指令数据集

Awesome Instruction Datasets开源项目 – 丰富的指令数据集

Awesome Instruction Datasets开源项目 – 丰富的指令数据集

收录各种各样的指令数据集，用于训练 ChatLLM 模型，支持多种自然语言处理任务。

ChatLLM模型训练对话系统开发指令数据集自然语言处理

ConvAI bot开源项目 – 基于技能的对话智能体

ConvAI bot开源项目 – 基于技能的对话智能体

ConvAI bot是一个专为NIPS 2017智能会话挑战赛而开发的基于技能的对话代理，旨在实现自然流畅的对话，能够适应不同的对话场景并学习用户的偏好。

基于技能的对话智能体对话系统研究智能客服系统社交机器人开发

OpenChatKit官网 – 开源的 ChatGPT 产品

一个开源的 ChatGPT 产品，基于20B的聊天 GPT 模型，尽管尚未成熟，但已经具备基本雏形。

AI对话系统开发开源的ChatGPT产品自然语言对话

ERNIE开源项目 – 百度开源的自然语言处理框架

ERNIE开源项目 – 百度开源的自然语言处理框架

ERNIE是百度开发的自然语言处理框架，旨在通过持续学习和预训练技术提升语言理解与生成能力。它支持多种自然语言处理任务，包括文本分类、问答系统、文本生成等，并在多种任务中实现了最先进的性能。ERNIE基于Transformer架构，具备高效的模型优化和训练策略，支持多语言处理，适用于中文及其他语言的自然语言处理任务。

对话系统情感分析文本生成生成式语言模型

悟道·天鹰Aquila2开源项目 – 强大的多功能语言模型系统

悟道·天鹰Aquila2开源项目 – 强大的多功能语言模型系统

悟道·天鹰Aquila2包含基础语言模型Aquila2-7B和Aquila2-34B，支持对话模型AquilaChat2-7B和AquilaChat2-34B，以及长文本对话模型AquilaChat2-7B-16k和AquilaChat2-34B-16k，适用于各种自然语言处理任务。

多功能语言模型对话系统文本生成自然语言处理

OpenChineseLLaMA开源项目 – 中文大语言模型基座

OpenChineseLLaMA开源项目 – 中文大语言模型基座

基于 LLaMA-7B 经过中文数据集增量预训练，旨在提升中文自然语言处理能力。

中文自然语言处理模型对话系统情感分析文本分类

YAYI 2开源项目 – 新一代开源大语言模型

YAYI 2开源项目 – 新一代开源大语言模型

中科闻歌研发的新一代开源大语言模型，采用了超过 2 万亿 Tokens 的高质量、多语言语料进行预训练。

多语言处理对话系统开源大语言模型文本摘要

Qwen2.5开源项目 – 智能易用的超大型语言模型

Qwen2.5开源项目 – 智能易用的超大型语言模型

Qwen2.5是由阿里云Qwen团队开发的超大型语言模型系列，专注于提供智能、易用、decoder only的语言模型，支持多语言和长文本生成。

内容创作多语言支持对话系统文本摘要

Index-1.9B开源项目 – 哔哩哔哩自研的大语言模型

Index-1.9B开源项目 – 哔哩哔哩自研的大语言模型

哔哩哔哩自研大语言模型，提供多样化的对话和角色扮演功能，支持多种评测基准，具有领先的性能表现

大语言模型对话生成自然语言处理角色扮演

FastChat-基于Llama开源项目 – 2的高效对话生成工具

FastChat-基于Llama开源项目 – 2的高效对话生成工具

FastChat是一个基于Llama-2构建的对话生成项目，支持32k的上下文长度，旨在提供高效的对话生成能力，适用于多种应用场景。它是一个开源项目，易于自定义和扩展，适合开发聊天机器人和进行自然语言处理任务。

Llama-2对话生成工具开源项目聊天机器人

permchain开源项目 – 构建有状态的多参与者应用

permchain开源项目 – 构建有状态的多参与者应用

permchain 是一个用于使用 LLM 构建有状态的多参与者应用的开发库，扩展了 LangChain 表达式语言，能够跨多个计算步骤协调多个链（或参与者）。

LangChain扩展LLM应用开发多参与者应用状态持久性

VisualGLM-6B开源项目 – 多模态对话语言模型

VisualGLM-6B开源项目 – 多模态对话语言模型

VisualGLM-6B 是一个开源的，支持图像、中文和英文的多模态对话语言模型，基于 ChatGLM-6B，具有 62 亿参数，整体模型共78亿参数。该模型可以在消费级显卡上本地部署，适用于多种视觉任务，具备生成诗歌、评论图像的能力，并且支持低显存需求的量化技术。

图像生成多模态对话语言模型自然语言处理视觉理解

GPT-3-强大的1750亿参数语言模型

GPT-3 是一个具有 1750 亿参数的强大语言模型，展示了更大的模型在多种实际任务中表现更好的现象。它在自然语言处理领域具有显著的优势，能够理解和生成多种形式的文本。

GPT-3代码生成内容创作对话系统

MLC LLM开源项目 – 推动中文自然语言处理研究与应用

MLC LLM开源项目 – 推动中文自然语言处理研究与应用

Chinese LLaMA-Alpaca是一个专注于中文的LLaMA-Alpaca模型，旨在推动中文自然语言处理的研究和应用。该模型基于先进的LLaMA架构，适用于多种中文任务，帮助用户在中文环境中实现更智能的交互与分析。

LLaMA-Alpaca模型中文信息提取中文对话系统中文文本生成

NLP-Knowledge-Graph开源项目 – 整合NLP与知识图谱的智能系统

NLP-Knowledge-Graph开源项目 – 整合NLP与知识图谱的智能系统

NLP-Knowledge-Graph项目致力于将自然语言处理、知识图谱和对话系统三大技术进行深度研究与应用。该项目不仅支持构建和优化对话系统，还提供多种数据处理与分析工具，具备强大的可扩展性，允许用户自定义模块，并支持多语言处理，满足不同领域的需求。

多语言支持对话系统数据处理工具知识图谱

langchain-ChatGLM开源项目 – 优化对话系统的自然语言处理项目

langchain-ChatGLM开源项目 – 优化对话系统的自然语言处理项目

langchain-ChatGLM是一个用于处理自然语言处理任务的项目，允许通过语义匹配和上下文管理来优化对话系统的表现。该项目支持将原文划分为单句进行处理，基于提问语义进行单句匹配，同时具备上下文管理功能，结合单句前后文本进行分析，并可通过chunk_size限制上下文长度。

上下文管理对话系统优化文本匹配自然语言处理

ChatTTS-OpenVoice开源项目 – 开源个性化语音生成工具

ChatTTS-OpenVoice开源项目 – 开源个性化语音生成工具

ChatTTS-OpenVoice是一款结合ChatTTS和OpenVoice技术的开源个性化语音生成项目。它允许用户上传10秒的参考音频，通过先进的技术克隆出自然且个性化的语音。项目旨在提供高质量的语音合成解决方案，适用于多种应用场景。

ChatTTSOpenVoice个性化语音合成助手语音克隆

femtoGPT开源项目 – 最小生成预训练 Transformer 的纯 Rust 实现

femtoGPT开源项目 – 最小生成预训练 Transformer 的纯 Rust 实现

femtoGPT 是一个使用纯 Rust 编写的最小生成预训练 Transformer 实现，旨在提供轻量级、高效的自然语言生成能力，易于集成和扩展，适合各种机器学习应用。

对话系统开发文本补全纯Rust实现的生成预训练Transformer自然语言生成

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3