JoyTag是一个开源图像标注模型,专注于积极性和包容性,使用Danbooru标注方案,适用于从手绘到摄影等各种类型的图像。该模型基于ViT-B/16架构,经过660M个样本的训练,支持5000多个标签,能够对输入图像输出对5000多个不同标签的预测结果。
一个 AI 图库,能够与图库进行交互,帮助用户标注和管理大批量的图片素材和相册。
AnyLabeling是一个结合了Segment Anything和YOLO技术的智能数据标注工具,旨在通过AI支持实现高效的图像标注。
DeepFloyd IF 是一个模块化的项目,由一个冻结的文本编码器和三个级联的像素扩散模块组成。用户只需输入文本提示,模型便会根据输入生成高分辨率图像。
WiseFlow - Agile Information Mining Tool, 能从网站、微信公众号、社交平台等不同来源精炼信息,自动分类标签并上传至数据库,帮助用户从海量信息中筛选出有价值的内容
分享一个端到端的开源 OCR 模型,号称 OCR 2.0,支持场景文本、文档、乐谱、图表、数学公式等内容识别,拿到了 BLEU 0.972 高分。
Grounded-Segment-Anything 是一个结合了 Segment Anything、BLIP、Stable Diffusion、Whisper 和 Grounding DINO 等多种先进 AI 模型的项目。它通过集成图像分割、物体检测、图像生成和语音识别等多种能力,实现了对图片中任意物体的识别、分割和生成,支持多模态输入和输出,能够处理复杂的 AI 工作流,适用于多种创新应用场景。
Imagica是一个创新工具,旨在简化与计算机的交互,尤其是在人工智能领域。用户可以在几分钟内构建无代码的AI应用程序,使得节省时间、降低成本和提高效率成为可能,无需深入编程知识。
Xtreme1 是一个为多感官训练数据生成和处理而设计的平台,提供高效的数据标注和管理工具,支持深度学习模型的训练和评估,并且易于集成到现有的工作流程中。用户可以通过友好的界面和丰富的文档快速上手。
文本聚类项目提供了便捷的工具,能够对文本进行嵌入和聚类,并为聚类结果添加语义标签,帮助用户更好地理解和组织文本数据。