dolphin-r1官网 – 开源推理数据集

dolphin-r1是一个开源的推理数据集，从DeepSeek-R1、Gemini 2.0 flash thinking和Dolphin大模型中蒸馏了总计80万条数据，专门用于训练推理大模型。该数据集包含了从不同来源蒸馏的推理和聊天样本，适用于多种自然语言处理任务。

dolphin-r1的特点:

1. 从DeepSeek-R1蒸馏了30万推理样本
2. 从Gemini 2.0 flash thinking蒸馏了30万推理样本
3. 从Dolphin大模型蒸馏了20万聊天样本
4. 总共有80万条数据，适用于训练推理大模型

dolphin-r1的功能:

1. 用于训练和微调定制风格的推理大模型
2. 用于研究和开发自然语言处理模型
3. 用于教育和学习大模型的训练过程
4. 用于创建和分享开源数据集，促进AI社区的发展

相关导航

PEFT开源项目 – 高效微调预训练模型的库

PEFT 是 HuggingFace 开源的一个高效微调库，旨在通过仅微调模型的一小部分参数（通常不到模型参数量的1%），实现与完全微调相似的性能，同时显著降低计算和存储开销。它支持多种微调策略，如适配器（Adapters）、低秩适应（LoRA）等，并且兼容多种预训练模型架构，如 BERT、GPT、T5 等。PEFT 还提供了模块化设计，易于集成到现有的 HuggingFace 模型和训练流程中。

STORM开源项目 – 基于检索与多角度提问的主题大纲合成

STORM项目旨在通过检索和多角度提问的方法，自动生成主题大纲，适用于多种自然语言处理任务，提升信息整理和知识提取的效率。

DecodeMed官网 – AI生物医学搜索引擎

DecodeMed是一个基于AI的生物医学搜索引擎，让用户能够搜索与其问题相关的数百万篇生物医学论文。

The Cambridge Law Corpus-法律人工智能研究语料库

剑桥法律语料库是一个专为法律领域的人工智能研究而设计的语料库，提供丰富的法律文本数据，支持法律领域的自然语言处理研究，适用于法律AI模型的训练和测试，包含多种法律文书和案例。

ModelScope官网 – 一站式AI模型服务平台

ModelScope是一个基于'模型即服务'(MaaS)理念的开源平台，整合了AI社区最先进的机器学习模型，覆盖计算机视觉(CV)、自然语言处理(NLP)、语音、跨模态和科学计算等多个领域。它提供统一的接口和实现，支持模型的推理、训练和评估，简化了模型在现实世界应用中的使用过程。平台公开了超过700个模型，支持从文本生成到图像处理等多种场景，并可与Hugging Face等社区集成扩展资源。

MindSparkAI官网 – 集成AI与机器学习的Flutter项目

MindSparkAI是一个基于Flutter的项目，旨在将人工智能和机器学习能力无缝集成到移动应用开发中。它为开发者提供了工具和库，以便轻松地将先进的AI特性融入到应用程序中。

Fluent官网 – 简化数据分析的AI工具

Fluent是一个先进的AI数据分析工具，旨在改变企业与数据的互动方式。用户可以通过简单的提问，自助获取数据洞察，无需复杂查询或深厚的技术知识，适用于各行业的决策者和专业人士。

gAIgle-结合谷歌搜索与GPT官网 – 4 AI

gAIgle是一个将谷歌搜索引擎与GPT-4人工智能相结合的创新工具，旨在提供更智能、更精准的搜索体验。用户可以通过自然语言提问，获取不仅限于网页链接的答案，还能得到更为深入的解析和建议。

深度学习自然语言处理技术概览开源项目 – 现代深度学习技术在NLP中的应用

该项目提供了现代深度学习技术在自然语言处理中的应用，包括多种模型和算法，结合实用代码示例，适用于多种NLP任务，文档易于理解，同时持续更新最新研究成果。

GPT-3开源项目 – 强大的自然语言处理模型

GPT-3是一个由OpenAI开发的自然语言处理模型，具有1750亿个参数，能够生成与人类相似的文本。它凭借强大的文本生成能力和高效的上下文理解，广泛应用于对话、写作、编程等多个领域。

Efficient LLM inference solution on Intel GPU-基于Intel GPU的高效LLM推理

提出一种高效的基于Intel GPU的LLM推理解决方案。通过简化LLM解码器层的结构，融合数据移动和逐元素操作，降低内存访问频率和系统延迟。同时，提出一种段KV缓存策略，将请求和响应token的键/值存储在不同的物理内存中，以有效管理设备内存，提高运行批处理大小和系统吞吐量。在Intel GPU上实现了该解决方案，并与标准的HuggingFace实现进行了比较，对于一些流行的LLM模型，在Intel GPU上实现的解决方案的令牌延迟降低了7倍，吞吐量提高了27倍。

Awan LLM官网 – 专注于成本和可靠性的LLM推理服务

Awan LLM是一个云服务提供商，专注于大语言模型的推理，致力于提供高性价比和可靠性。与其他按token计费的服务不同，Awan LLM采取按月计费的方式，有效控制了用户的使用成本。通过在战略城市部署数据中心，Awan LLM能够为客户提供稳定且高效的服务。

Vanna开源项目 – 一款易用的 SQL 生成 AI 框架

连续上榜 GitHub Trending 的一款 SQL 生成 AI 框架，允许在你的数据上训练出独有的 RAG（检索增强生成）模型，通过自然语言准确生成 SQL 查询语句和相关功能。

LLM Search开源项目 – 便捷的基于LLM的问答系统

提供一个方便的基于LLM的问答系统，可与多个本地文档集合进行交互，通过自然语言处理实现高效的信息检索和文档查询。

DCA (DeepCrossattention)开源 – 增强Transformer模型性能的深度学习机制

DCA (DeepCrossattention) 是一种用于增强Transformer网络中残差连接的新机制。它通过可学习的权重和深度交叉注意力动态地结合不同层的信息，从而提高语言模型的性能、训练效率和稳定性。DCA采用Pytorch实现，可通过pip安装，并提供如DCAGPT等类用于构建和训练Transformer模型，专注于语言建模任务。

暂无评论

暂无评论...