该数据集包含从播客“津津乐道”的 281 集中提取的 18,663 个中文问答对。使用 OpenAI Whisper 转录工具提取字幕,并使用 GPT-3.5 生成问答对。
海外中文开源大语言模型,基于 Llama-7B, -13B, -33B, -65B 进行中文领域上的持续预训练,使用了接近15M条数据,并针对推理能力在中文benchmark上进行了评测。
AAGPT是一个实验性开源应用,展示了大型语言模型(如GPT-3.5和GPT-4)的能力,适合研究和学习使用。它支持多种自然语言处理任务,便于社区的贡献与合作。
Frame Semantic Transformer是一个基于T5模型的框架语义解析器,利用FrameNet进行深度语义分析,支持多种自然语言处理任务,具备灵活的模型训练和微调能力,能够高效地进行推理。
轩辕模型是一种开源的自然语言处理模型,旨在提供高效的文本生成和理解能力,支持多种语言,并可定制化模型参数,适用于多种文本处理任务。