数据集整理

JoyTag开源项目 – 开源图像标注模型，注重积极性和包容性

JoyTag开源项目 – 开源图像标注模型，注重积极性和包容性

JoyTag是一个开源图像标注模型，专注于积极性和包容性，使用Danbooru标注方案，适用于从手绘到摄影等各种类型的图像。该模型基于ViT-B/16架构，经过660M个样本的训练，支持5000多个标签，能够对输入图像输出对5000多个不同标签的预测结果。

ViT-B/16架构开源图像标注模型数据集整理积极性和包容性

album-ai开源项目 – 智能图库管理助手

album-ai开源项目 – 智能图库管理助手

一个 AI 图库，能够与图库进行交互，帮助用户标注和管理大批量的图片素材和相册。

AI图库管理助手API集成图片素材管理用户友好的界面

AnyLabeling开源项目 – 轻松的AI辅助数据标注工具

AnyLabeling开源项目 – 轻松的AI辅助数据标注工具

AnyLabeling是一个结合了Segment Anything和YOLO技术的智能数据标注工具，旨在通过AI支持实现高效的图像标注。

AI辅助数据标注工具智能图像标注机器学习工具自动标注功能

Deep floyd开源项目 – 基于文本生成高分辨率图像

Deep floyd开源项目 – 基于文本生成高分辨率图像

DeepFloyd IF 是一个模块化的项目，由一个冻结的文本编码器和三个级联的像素扩散模块组成。用户只需输入文本提示，模型便会根据输入生成高分辨率图像。

图像扩散技术文本生成图像模块化设计高分辨率图像生成

WiseFlow开源项目 – 从海量信息中筛选出价值内容

WiseFlow开源项目 – 从海量信息中筛选出价值内容

WiseFlow - Agile Information Mining Tool, 能从网站、微信公众号、社交平台等不同来源精炼信息，自动分类标签并上传至数据库，帮助用户从海量信息中筛选出有价值的内容

信息挖掘工具数据分类数据库上传用户友好界面

GOT-OCR2.0开源项目 – 开源高效的OCR模型

GOT-OCR2.0开源项目 – 开源高效的OCR模型

分享一个端到端的开源 OCR 模型，号称 OCR 2.0，支持场景文本、文档、乐谱、图表、数学公式等内容识别，拿到了 BLEU 0.972 高分。

GOT-OCR2.0开源OCR模型文本识别高准确率OCR

Grounded-Segment-Anything开源项目 – 多模型集成的图像处理工具

Grounded-Segment-Anything开源项目 – 多模型集成的图像处理工具

Grounded-Segment-Anything 是一个结合了 Segment Anything、BLIP、Stable Diffusion、Whisper 和 Grounding DINO 等多种先进 AI 模型的项目。它通过集成图像分割、物体检测、图像生成和语音识别等多种能力，实现了对图片中任意物体的识别、分割和生成，支持多模态输入和输出，能够处理复杂的 AI 工作流，适用于多种创新应用场景。

AI辅助图像处理图像分割工具文本提示图像生成语音识别图像处理

Imagica官网 – 无代码AI应用开发工具

Imagica是一个创新工具，旨在简化与计算机的交互，尤其是在人工智能领域。用户可以在几分钟内构建无代码的AI应用程序，使得节省时间、降低成本和提高效率成为可能，无需深入编程知识。

AI应用程序构建图像识别数据分析无代码AI应用开发工具

Xtreme1开源项目 – 下一代多感官训练数据平台

Xtreme1开源项目 – 下一代多感官训练数据平台

Xtreme1 是一个为多感官训练数据生成和处理而设计的平台，提供高效的数据标注和管理工具，支持深度学习模型的训练和评估，并且易于集成到现有的工作流程中。用户可以通过友好的界面和丰富的文档快速上手。

多感官训练数据平台工作流程集成数据标注工具深度学习模型训练

Text Clustering开源项目 – 轻松嵌入、聚类及标注文本

Text Clustering开源项目 – 轻松嵌入、聚类及标注文本

文本聚类项目提供了便捷的工具，能够对文本进行嵌入和聚类，并为聚类结果添加语义标签，帮助用户更好地理解和组织文本数据。

文本嵌入文本聚类工具语义标签生成

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3