VIGC(Visual Instruction Generation and Correction)是一个用于生成和修正视觉指令的项目,旨在提高视觉任务的效率和准确性,适用于多种视觉任务。
ScreenPipe是一个利用大型语言模型(LLM)进行屏幕内容分析与操作的智能工具,灵感来源于adept.ai、rewind.ai和Apple Shortcut,采用Rust + WASM技术实现,旨在提供高效的屏幕内容处理和用户友好的操作体验。
SparK项目旨在通过稀疏和层次化的掩码建模,设计出适用于卷积网络的BERT模型,提升卷积网络在各种任务上的表现。
HPT项目致力于通过结合多种预训练变换器来扩展自我感知与视觉学习的能力,旨在提高学习效率并适应多种复杂任务。
Freemidjourney是一个免费的AI图像生成工具,用户可以通过文本提示描述任何视觉概念,生成复杂的插图、logo设计、惊艳的肖像等。
该模型结合对比潜变量,以指导能量基础模型的训练和优化。
mjapi是一个简约的MidJourney API,支持Stripe、PayPal和BTC/Lightning支付。用户无需Discord账户即可测试,能够对之前的想象任务进行跟进,创建变体、升级和缩放等功能。新账户可享受1天的免费配额,开发者用户体验是其首要任务。
Jupyter Tldraw是一个在Jupyter环境中运行的tldraw白板工具,支持GPT4-Vision,允许用户创建、编辑和共享白板内容,提供实时协作功能,适合教学、会议和团队协作等场景。
Kartiv是一个先进的AI驱动设计工具,用户只需输入描述,即可生成令人惊艳的视觉效果,界面直观友好,极大降低了设计门槛。
Rerun 是一个用于记录计算机视觉和机器人数据的 SDK,并配有可视化工具,可以随时间探索这些数据。它允许用户以最小的代码调试和理解系统的内部状态和数据。开发者可以将数据记录到 Rerun SDK,系统会自动进行可视化处理。Rerun 支持来自多个进程的实时数据流,并可回放录制的数据。Rerun Viewer 根据记录的数据创建可配置的可视化效果,用户可以随时回溯和前进时间。