llm-swarm是在Slurm集群中管理可扩展的开放式LLM推理端点的工具,具备生成合成数据集的能力,主要用于预训练或微调。同时,它集成了huggingface/text-generation-inference和vLLM,以支持大规模文本生成任务。
Kiln 是一个全自动的微调框架,允许用户在一小时内使用 DeepSeek-R1 蒸馏出属于自己的小模型。整个过程无需编写代码或手动调节,仅需定义数据集即可。Kiln 提供可视化操作界面,支持主流模型如 DeepSeek、Claude、Llama 等,并允许训练自定义推理模型。它兼容 Windows、macOS 和 Linux 系统,开箱即用,适用于专业领域模型构建(如医学、法律等)。
Jax GPT是对Karpathy的nanoGPT的重写,基于Jax和Flax框架构建,旨在提供高效的文本生成能力,支持快速训练和推理,具有易于扩展和修改的架构,能够充分利用高性能的并行计算。
自然语言处理(NLP)教程,涵盖文本词向量、词法分析、预训练语言模型等常见NLP任务,适合作为入门学习和基线参考。
YT Copycat是一个基于AI的工具,允许用户将任何YouTube视频转换为多样化的书面内容。它使用GPT-4技术,支持超过30种语言,为YouTube视频解锁书面潜力。用户可以轻松创建详细的博客文章、有见地的推文和引人入胜的新闻通讯。
MiniRBT (中文小型预训练模型) 是由iFLYTEK开发的一个小型中文预训练模型,旨在提供高效的自然语言处理能力。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型