由vivo AI全球研究院自主研发的大规模预训练语言模型,具有更大量的优质数据、更优的效果及长文本支持。
只依赖pytorch、transformers、numpy、tensorboardX,专注于文本分类、序列标注的极简自然语言处理工具包
Asian Bart是一个专为亚洲语言设计的BART模型,支持英语、汉语、韩语、日语等多种语言,适用于文本生成、翻译和摘要等多种自然语言处理任务,并提供预训练模型以便于研究和应用。
基于Andrej Karpathy的GPT-2实现和训练,添加大量注释以帮助理解模型原理,计划逐步增加更多功能。
AAGPT是一个实验性开源应用,展示了大型语言模型(如GPT-3.5和GPT-4)的能力,适合研究和学习使用。它支持多种自然语言处理任务,便于社区的贡献与合作。
这是2022搜狐校园算法大赛NLP赛道第一名的开源方案,包含实验代码,旨在提供高效的自然语言处理解决方案。该项目经过优化,能够支持多种数据预处理方式,并提供详细的实验结果和分析,帮助用户更好地理解和应用自然语言处理技术。
LLaMA是Facebook研究开发的一款先进语言模型,旨在处理多种自然语言处理任务,声称在性能上优于GPT-3。它具备高质量文本生成能力,支持多种规模以满足不同的部署需求,同时采用高效的训练技术,能够先进地处理上下文信息。
PAIR是一款利用机器学习技术开发的AI驱动的编码辅助REPL工具。它将GPT-4与开发人员配对,通过交互式编程对话提高编程效率和准确性。PAIR是开源项目,为开发人员提供更高效、更智能的编程工具。
Auto-GPT-ZH是中文版AutoGPT,旨在提供一个中文环境下的自动化GPT应用,支持多种API扩展,用户可以自定义任务和目标,具有高效的文本生成和对话能力,界面友好,适合各种中文场景的应用。
Euclidean Fast Attention (EFA)算法的实现。该算法是一种高效的注意力机制,显著降低了计算成本,同时保持高性能,适合需要快速处理大量数据的场景。
riverbed 是一个支持大规模数据挖掘和自然语言处理的工具集,提供多种高效的功能,帮助用户在复杂的数据环境中进行深入分析。
SymbiotAI致力于帮助人类和AI模型协作,共同创造一个更美好的世界。用户只需注册一个账户,即可开始与AI模型进行合作。
基于GPT-2模型的中文文本生成项目,旨在为中文自然语言处理提供强大的文本生成能力,支持预训练和fine-tuning,适用于多种场景,如创作、对话等。
2000 Hugging Face Prompts 是一份全面的资源,旨在帮助爱好者学习和实验 Hugging Face,使他们熟悉其在不同背景下的功能和应用。
LLM Giraffe🦒可以用来扩展LLM的上下文长度,它实现了将LLAMA v1 2K的上下文长度扩展为4K和16K,支持长文本处理,优化上下文管理,易于集成到现有的LLM工作流中。
Claude 2 AI是由Anthropic开发的先进语言模型,提供无地域限制的直观对话体验,能够处理大量文本并同时支持与最多5个文件的交互。
Summarify是一款免费的摘要工具,利用人工智能帮助用户为PDF、网页、文本、YouTube视频、音频文件和博客创建简明扼要的摘要,支持19种语言,并可选择不同的语音和笔记风格。
Summary.sh是一个强大的总结API,可以接收任意格式的文本,并通过AI助手为用户进行摘要处理,旨在帮助用户快速获取信息精华。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型