UltraChat是由清华团队基于Scalable Diverse方法构建的开源对话语言模型,凭借其在多轮对话中的卓越表现,在斯坦福大学的评测榜单中脱颖而出,成为得分超过80的唯一开源模型。该模型利用大规模、高质量、高度多样化的多轮指令数据进行训练,并在AlpacaEval评测集及自建评测集上表现出色,最高胜率可达98%。UltraChat致力于推动大模型对齐技术的发展,为各种自然语言处理任务提供强有力的支持。
Zgi.ai致力于简化大型语言模型(LLM)应用的构建过程,为开发者和企业提供必要的工具和资源,帮助他们将梦想转化为现实,打破技术限制,实现前所未有的可能性。
Orca是一个基于GPT-4复杂解释轨迹的渐进式学习模型,旨在推动自然语言理解与生成的前沿。它设计高效且智能的最先进语言模型,能够与OpenAI的GPT-4和PALM相媲美。
ChatGPT 中文语料库,包含对话、小说和客服等多种类型的中文语料,旨在为大型语言模型的训练提供丰富的数据支持,支持多种文本格式,适合多种场景应用。
femtoGPT 是一个使用纯 Rust 编写的最小生成预训练 Transformer 实现,旨在提供轻量级、高效的自然语言生成能力,易于集成和扩展,适合各种机器学习应用。
Asian Bart是一个专为亚洲语言设计的BART模型,支持英语、汉语、韩语、日语等多种语言,适用于文本生成、翻译和摘要等多种自然语言处理任务,并提供预训练模型以便于研究和应用。
该项目旨在通过多任务语言建模统一分子和文本表示,提升化学和语言处理的结合能力。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型