VLM-R1是一个开源项目,成功将DeepSeek的R1方法从纯文本领域迁移到视觉语言领域。该项目基于Qwen2.5-VL,对比了R1和传统的SFT方法,展示了其在多模态图像识别领域的突破性进展。VLM-R1在各种复杂场景下保持稳定的高性能,并展示了卓越的泛化能力,能够适应多种场景和任务而无需专门训练。项目在GitHub上线后迅速获得广泛关注,并登上平台热门趋势榜。
OLMo是一个由科学家设计的开源语言模型仓库,旨在训练和使用AI2最先进的开放语言模型。它采用两阶段训练程序,第一阶段在大约4T令牌的网络语料库上训练,第二阶段在约50-100B令牌的高质量目标语料库上微调。OLMo已用于各种自然语言处理任务,包括文本生成、问答和翻译。
一个利用AI生成随机搞笑表情包的工具,通过整合笑话和图像生成技术来提供娱乐。支持在smolagents框架内调用其他LLM工具,并具备将文本转为Markdown的功能。
Hugging Face Dataset Enhancer是一个Chrome扩展,它根据当前查看的选择建议相似的数据集,帮助用户轻松发现相关资源,扩展数据选择。
MergeUI是一个直观的用户界面,旨在帮助用户探索在Hugging Face上合并的语言模型(LLMs)。通过合并模型,用户可以以低廉的成本创建强大的语言模型,无需GPU。该工具提供了有关模型合并的建议,帮助用户决定合并哪些模型以及使用什么合并策略。
使用 huggingface/chat-ui 和 huggingface/candle 创建的适用于 macOS 和 iOS 的本地高效的聊天应用程序,提供流畅的用户体验和强大的聊天功能。
HF-LLM.rs 是一个命令行工具,旨在便捷地访问 Hugging Face 托管的大型语言模型(LLM)。该工具支持用户选择不同的模型,提供输入提示功能,以及实时输出流和聊天模式,适合开发者和研究人员使用。
LLaMA-VID 是一个用于理解长视频的多模态大模型,通过双令牌策略显著减少了长视频的过载,同时保留了关键信息。
谷歌DeepMind发布的最新多任务视觉语言模型(VLM),集成了多种视觉和语言处理能力,支持图像描述、目标检测、图像分割、OCR以及文档理解等任务。该模型提供三种不同参数规模(3B、10B、28B),支持224px和448px两种分辨率,基于开源框架开发,易于使用和扩展,通过简单提示即可切换任务,无需额外加载模型。
一个自定义 Hugging Face 节点的开源项目,用于 Google Visual Blocks for ML,允许用户在无代码图形编辑器中创建机器学习管道,支持多种机器学习功能并与Hugging Face Serverless API集成。
一套用于在Google Cloud Vertex AI和Google Kubernetes Engine上训练和部署模型的Docker镜像
本课程将教你使用 Hugging Face 生态系统中的库进行自然语言处理 (NLP)。课程涵盖了使用 Transformer 进行文本处理、数据集训练模型、文本分词及提高计算效率等多方面内容。
LightEval是一个轻量级的LLM评估套件,Hugging Face在内部使用,并与最近发布的LLM数据处理库datatrove和LLM训练库nanotron集成。
这是一个用于演示基于Swift的聊天和语言模型测试的Mac应用,旨在展示Hugging Face的swift-transformers库的能力。它提供了一个友好的用户界面,用户可以轻松与多种语言模型进行互动,测试其响应和性能。
Hugging Face是一个用户友好的开源平台,旨在快速构建、训练和部署AI模型与应用,无需深厚的机器学习专业知识。它支持流行框架,提供全面的文档,并专注于自然语言处理(NLP),为AI研究人员和工程师提供不可或缺的资源。
Semiring 是一个简化机器学习模型构建和部署的平台,用户只需五个数据样本即可创建数据集,通过简单的 API 部署模型,无需任何机器学习专业知识。
Hyper AI是一个终极平台,旨在帮助用户快速创建以AI驱动的应用程序,并能够迅速将其创新想法货币化。加入我们的社区,实现您的愿景。
LensQuery 是一款模型无关的AI聊天应用,允许用户选择自己喜欢的现代AI模型并进行互动。通过简洁的界面,用户可以轻松访问和体验不同的AI模型的功能。