火山方舟是由火山引擎提供的一站式大型模型服务平台,专注于企业AI应用。该平台提供模型体验、微调、推理和评估等功能,支持多种模态模型体验,适合行业分析和投资预测等场景。平台提供免费代币配额,个人用户可获得50万代币,合作计划企业用户可获得500万代币。此外,平台还提供灵活的定价方案,包括按使用付费和资源包,并具备高安全性和隐私保护,符合多种国际认证标准。
GLM-4-Flash 是一款支持 26 种语言的大型语言模型,包括中文、英语、日语和韩语,专注于简单、低成本、快速响应的任务。它具备多轮对话、网页浏览、函数调用和长文本推理等功能,支持最大 128K 上下文,生成速度高达每秒 72.14 个 token(约每秒 115 个字符)。该模型适用于客户服务、内容生成、数据分析等领域,开发者可通过智谱 AI 开放平台免费使用,并提供一键微调工具,方便用户快速定制化模型以适应不同业务场景。
SiliconCloud 是一个基于优秀开源基础模型的高成本效益的生成式AI云服务,旨在为企业和开发者提供全场景模型服务。它支持快速的模型推理,适合各种应用场景,如对话和图像生成。项目特点包括高性能推理、自动伸缩和灵活的定价模式。
Azure AI Foundry 是由 Microsoft Azure 提供的综合平台,专注于生成式 AI 应用的开发和部署。它整合了 AI、数据、安全和应用的全生命周期管理,支持从模型选择到部署的整个流程,并注重安全性和隐私保护。平台提供了丰富的模型选择、无缝自定义功能,以及与多种开发工具的集成,适用于企业级 AI 项目的构建与扩展。
SiliconCloud 是一个为开发者提供多种大型 AI 模型访问的云平台,支持包括 DeepSeek-V3、DeepSeek-R1、Qwen2.5-72B 等模型。平台通过 API 服务让用户能够轻松集成这些模型,适合各种应用开发。新用户注册时可获赠 14 元信用,并可通过邀请朋友获取更多信用。平台还提供模型微调和部署服务,支持自定义模型,并与华为云合作,提供高性能推理加速,效果媲美高端 GPU。
FunASR 是一个旨在连接学术研究与工业应用的语音识别工具包。它支持工业级语音识别模型的训练与微调,帮助研究者和开发者更方便地进行语音识别模型的研究与生产,推动语音识别生态的发展。FunASR 提供了丰富的预训练模型和便捷的脚本与教程,支持推理和微调,涵盖语音识别、语音活动检测、标点恢复、语言模型、说话人验证、说话人分离等多种功能。
Qwen2.5是阿里巴巴开源的通义千问系列第二代AI模型,支持多种语言、代码和数学能力显著提升,上下文长度支持最高达到128K tokens。该模型提供了从0.5B到72B的不同规模版本,适用于各种应用场景。Qwen2.5在指令跟随、长文本生成、结构化数据理解等方面有显著改进,并且支持多达29种语言。
TRL 是一个用于增强训练基础模型的 Python 库,支持监督微调、近端策略优化和直接偏好优化等技术。它与 Hugging Face Transformers 生态系统紧密集成,支持多种模型架构和模态,并支持分布式训练。TRL 提供了多种训练器,如 SFTTrainer、GRPOTrainer、DPOTrainer 和 RewardTrainer,方便用户进行模型微调。此外,TRL 还支持通过 Hugging Face Accelerate 进行高效扩展,并集成了 Hugging Face PEFT 和 Unsloth 来优化训练过程。
本项目是面向国内开发者的LLM(大型语言模型)入门实践教程,基于吴恩达老师的大模型系列课程,进行了筛选、翻译、复现和调优。教程分为必修类和选修类,涵盖了从Prompt Engineering到RAG开发、模型微调的全流程,帮助开发者系统学习和掌握LLM相关技术和应用。
Align-Anything 是一个旨在对齐任意模态大型模型(如LLMs、VLMs等)与人类意图和价值观的开源框架。它提供了高度模块化的设计,支持多种对齐算法和模态模型的微调。项目支持文本、图像、音频和视频等多种模态,并提供了相应的处理和对齐方法。用户可以通过该框架轻松定制和优化模型,以适应不同的任务需求。
D-FINE是一种创新的目标检测模型,通过重新定义边界框回归任务为细粒度分布细化(FDR)并引入全局最优定位自蒸馏(GO-LSD),解决了传统固定坐标回归中的优化难题和定位不确定性问题。D-FINE在检测延迟、模型大小和准确率方面显著优于其他16种目标检测模型,尤其适用于复杂场景下的实时目标检测。
OpenChat是一个专为对话系统设计的开源框架,为开发者提供构建高效交互模型的工具,支持多场景对话任务的开发与优化,兼顾性能与适配性。
Lightning IR 是一个基于 PyTorch Lightning 的库,专门用于微调和运行基于 transformer 的语言模型进行信息检索任务。它提供了完整的解决方案,支持多种信息检索任务和数据集,简化了模型训练和推理过程,同时易于扩展和定制。
LMFlow是一个专为语言模型工作流设计的开源框架,提供优化开发与部署过程的工具,支持从训练到推理的全链路管理,提升语言任务的效率。它具有可扩展的架构,支持大规模机器学习模型的高效微调和推理,并提供用户友好的界面进行模型管理。
本课程旨在帮助学员从零开始构建自己的第二大脑AI助手,使知识管理和智能检索变得轻松。课程涵盖多个模块,从基础到生产级AI系统的搭建,内容涉及大语言模型(LLMs)、智能代理(agents)、检索增强生成(RAG)、模型微调、LLMOps以及AI系统技术等。学员将学习如何利用低成本工具(费用在1至5美元之间)实现高效操作,并兼容多种工具如OpenAI、Hugging Face和MongoDB。
DCLM-7B是由苹果开源的一个大型语言模型,其能力接近LLaMA3 8B。该项目完全开源,包括模型和数据集,但上下文长度限制为2K。该模型在Huggingface上提供,适用于多种自然语言处理任务,如文本生成、翻译和问答。此外,它还可作为基础模型进行微调以适应特定任务,并在研究和开发中用于探索大型语言模型的性能。该项目也适用于教育和学习目的,帮助理解大型语言模型的工作原理。
blurr是一个将Hugging Face Transformers与fastai v2框架无缝集成的库,旨在简化在fastai中使用最先进的自然语言处理(NLP)模型的过程。它支持广泛的Hugging Face Transformer模型,并提供了数据预处理和模型评估的实用工具,使得在自定义数据集上微调Transformer模型变得非常容易。
Intel LLM-on-Ray 是一个基于Intel平台的大规模语言模型预训练、微调和服务部署的解决方案。它简化了从零开始构建、定制和部署大型语言模型的复杂流程,帮助用户高效地完成语言模型的开发和应用。
MindDiffusion是一个基于MindSpore框架的扩散模型集合,支持多种任务,性能优化,包含预训练模型,可快速部署,并提供详细的文档和示例。
《Large Language Model 书籍中文版》是一本系统介绍如何从零开始构建、训练和微调大型语言模型(LLMs)的书籍。书中详细讲解了从文本数据处理到注意力机制实现,再到模型预训练和微调的全过程。此外,书籍还提供了结合人类反馈进行模型优化的方法,以及如何将大语言模型应用于实际场景的指导。
Llama Cookbook是一个全面的指南,旨在帮助开发者轻松掌握LLaMA模型的推理、微调以及端到端应用的开发,适合从初学者到高级用户。
GradientJ旨在使NLP应用更易获取,提供创建、微调和管理NLP应用的综合解决方案,充分利用大语言模型的能力。
Vercel AI Playground是一个在线平台,允许用户使用最新的AI语言模型构建AI驱动的应用程序。它提供了一系列功能来微调模型,例如并排比较模型的Compare Mode和优化参数的Tweak Mode。
基于模块化构建和敏捷部署的RAG系统框架,旨在通过自动化的 '数据构建 - 模型微调 - 推理评估' 知识适应技术系统,为研究人员和开发者提供一站式的解决方案。
Custom.MT是一个为本地化团队、语言服务提供商、产品经理和翻译人员设计的生成式AI和机器翻译平台。它提供了包括模型微调、机器翻译评估、内部机器翻译、语言数据匿名化、术语合规、翻译记忆清理、数据获取和开源机器翻译研讨会等多种服务。此外,Custom.MT还为流行工具如Trados、Smartling和memoQ提供AI翻译平台,以及API文档、博客、案例研究、事件和网络研讨会等资源。
Adaptive是一个先进的AI工具,旨在改变企业利用大型语言模型(LLMs)的方式。它提供了一整套工具,通过强化学习技术对开放模型进行微调和部署,增强其性能,确保满足特定的业务需求,同时保护用户隐私。Adaptive特别适合希望通过优化模型适应性、快速推理和基于实时反馈的持续改进来提升生成AI能力的企业。
MAP-NEO/document-convert是一个高效的转换管道,能够将PDF或扫描图像转换为类似Markdown格式,保留文档结构和格式,适用于多模态艺术投影项目。
指令回译是一种可扩展的方法,通过自动为人类编写的文本添加相应的指令标签,从而构建一个高质量的指令跟随语言模型。该方法在生成和筛选训练样例方面表现出色,并且可以微调现有模型以提高性能。
DeepSeek-V3 的Q4_k_m 量化版本,大小比原本的小一半,兼容性强,适用于多种环境,提升处理效率,同时保留大部分原始模型性能。
中文Mixtral混合专家大模型,基于Mistral.ai发布的Mixtral模型,经过中文增量训练和指令精调,支持长文本处理与多种应用框架。