NeuroGPT 是一个提供免费 API 服务的平台,用户可以方便地访问 GPT-3.5、GPT-4 及其他语言模型。它支持多种自然语言处理任务,并且具有高性能和低延迟的响应时间,适合开发者和企业使用。
MIT证明,机器能够理解含义,哪怕它本来只是训练用作预测下一个字符(LLM)。
Gemini是CMU的Graham Neubig教授团队开发的模型,经过与GPT-3.5-Turbo和Mixtrial的公平深入比较,显示出与GPT-3.5-Turbo相当的性能,尽管存在微弱的差距。该项目致力于提供可复制的研究结果,推动自然语言处理领域的进步。
ScaleLLM是一个面向大型语言模型高性能推理的系统,经过仔细设计,能够满足产业级环境的需求。
该项目提供多个无审查的中文语言模型,支持多种文本生成任务,灵活选择与使用,开放访问,社区驱动更新。
Qwen2-Audio是一个大规模音频语言模型,支持语音聊天和音频分析,能够处理各种音频信号输入并生成文本回应。
Nexa SDK是一款全面支持ONNX和GGML模型的工具包,具备文本生成、图像生成、视觉-语言模型(VLM)、自动语音识别(ASR)和文本到语音(TTS)功能,提供OpenAI兼容的API服务器,支持JSON模式调用函数和流媒体,配备用户友好的Streamlit UI,方便开发者使用和集成。
自然语言处理(NLP)教程,涵盖文本词向量、词法分析、预训练语言模型等常见NLP任务,适合作为入门学习和基线参考。
GPT-4是一种先进的语言模型,具备理解和重建被打乱文本的能力,展示出卓越的语言理解与推理能力,支持多种语言和领域的文本处理。
一个开源免费的 GPT 模型提示集合项目,包含多种用于 GPT 任务的提示,适合进行创意探索或对话/文本灵感的获取,能够提高 GPT 的使用效率和实验效果。
由字节跳动开发的先进的多模态大型模型,旨在处理涉及文本、图像和视频数据的各种任务,并在电商和短视频基准测试中取得了最佳结果
基于 LLaMA-7B 经过中文数据集增量预训练,旨在提升中文自然语言处理能力。
悟道·天鹰Aquila2包含基础语言模型Aquila2-7B和Aquila2-34B,支持对话模型AquilaChat2-7B和AquilaChat2-34B,以及长文本对话模型AquilaChat2-7B-16k和AquilaChat2-34B-16k,适用于各种自然语言处理任务。
基于MLX框架的GPT-2模型实现,提供从零开始训练生成式预训练语言模型的教程,使用Python代码约200行,依赖mlx和numpy,适用于Macbook等设备,能在约10分钟内训练完成并生成类似莎士比亚文本的输出
刚发布的 Llama 3.1 405B 是一款先进的 AI 模型,提供多种功能和应用场景。
深言科技联合清华大学NLP实验室开源的语鲸-8B模型,其能力大致介于ChatGLM2和3之间。该模型支持多种自然语言处理任务,适用于各种应用场景。
fairseq是一个用于序列建模的开源工具包,支持多种自然语言处理和语音处理任务。
该项目提供了一个关于大型语言模型推理的教程代码,涵盖了多种生成算法、元生成算法及高效元生成算法,旨在提高模型推理的效率和效果。用户可以通过该教程学习如何实施不同的算法,以优化文本生成和推理性能。
ChatGPT.nvim是一个用于与OpenAI GPT-3聊天机器人的Neovim插件,提供了一个易于使用的界面,让用户能够探索GPT-3及其自然语言处理功能。
DeepSeek-V3 的Q4_k_m 量化版本,大小比原本的小一半,兼容性强,适用于多种环境,提升处理效率,同时保留大部分原始模型性能。
LeNLP是一个为Python开发的自然语言处理工具箱,旨在通过Rust优化提升性能,集成高性能并行化功能,从而简化Python中的各种NLP任务。
Stanford Alpaca是一个基于大规模数据训练的自然语言处理模型,支持多种任务,如文本生成、理解、推理及对话系统等。
Llama 2是Meta推出的最新一代大型语言模型,旨在提供更强的自然语言处理能力。
一个用纯C语言实现的项目,旨在训练GPT-2模型,代码量仅为1000行,具有高效的内存管理和性能优化,方便扩展和修改。
中科闻歌研发的新一代开源大语言模型,采用了超过 2 万亿 Tokens 的高质量、多语言语料进行预训练。
基于 baichuan-7B 进行多任务有监督微调的开源多模态大语言模型,建立在 Pleisto 的以数据为中心(Data-centric AI)的工作上。羽人在多轮对话、开放域问答、角色扮演、文本生成、文本理解、图片理解等多个任务上均拥有优异的表现。
AndesGPT-7B是OPPO研究院基于Baichuan2项目继续训练得到的70亿参数规模中文语言模型,采用800B中文语料进行微调,能够有效处理多种中文自然语言处理任务。
Qwen2.5是由阿里云Qwen团队开发的超大型语言模型系列,专注于提供智能、易用、decoder only的语言模型,支持多语言和长文本生成。
tf-transformers是基于Tensorflow 2.0实现的最先进的自然语言处理架构,旨在提供更快的自动递归译码,支持多种前沿的NLP模型,如BERT、RoBERTA、T5、Albert和mt5等。其设计简化了API,便于用户使用和扩展,适合各种NLP任务。
Frame Semantic Transformer是一个基于T5模型的框架语义解析器,利用FrameNet进行深度语义分析,支持多种自然语言处理任务,具备灵活的模型训练和微调能力,能够高效地进行推理。