StyleLLM文风大模型是一个文本风格迁移项目,基于大型语言模型,提供四个经过中国四大名著训练的模型,能够支持多种文本风格的转换,适用于各种语言处理场景。
Lagent是一个专为轻量AI代理设计的开源框架,旨在为开发者提供高效构建智能代理的工具。它通过简化的架构支持快速开发与部署,特别适用于资源受限场景。Lagent支持用户快速地将一个大语言模型转变为多种类型的智能体,并提供了一些典型工具为大语言模型赋能。
这篇论文对大语言模型的微调,从技术、研究、最佳实践、应用研究挑战和机遇等方面进行了详尽的回顾。
Differentiable Adaptive Merging (DAM) 自动化合并多个具有独特能力的大语言模型(LLM),优化模型间的平衡,以提高数据效率和降低计算成本。DAM 超越传统和进化方法,提供可扩展的解决方案,适用于多样化的 AI 系统。
OpenDevin 是一个开源的自主 AI 软件工程师平台,旨在通过 AI 和大语言模型(LLMs)来简化软件开发过程。它支持从需求分析、代码编写、测试与调试到部署的全流程自动化开发,能够处理多种编程语言,并与人类开发人员协作完成复杂的软件工程任务。
LLMChat是一个全栈Web界面的实现,支持多种大型语言模型,如ChatGPT或LLaMA,旨在提供用户友好的互动体验。它允许用户进行实时对话,并具备可定制的模型参数,方便多种部署选项。
Botsh 是一个基于大语言模型(LLM)的智能体,能够自动识别并安装用户所需的工具,适用于多种环境和需求,提供用户友好的操作接口,使得用户能够轻松配置和使用所需的工具。
The Pipe 是一个多模态工具,旨在将现实世界的信息输入到大语言模型中。它采用多核设计,并通过精心设计的启发式方法,从各种来源(如文件、文件夹、网页等)创建有意义的文本和图像提示,提升信息处理的效率和质量。
这是一个专注于大语言模型在数学推理方面应用的资源集合,旨在帮助用户更好地理解和利用这些模型解决各种数学问题。该项目汇集了多种与数学推理相关的大语言模型,提供丰富的示例和应用案例,同时包含使用不同数学工具和库的指南,支持多种数学问题的解决方案。
Otto是一个基于大语言模型的自主集体决策工具,旨在通过智能化的信息处理与分析,支持多方协作与集体决策,提高团队的决策效率与准确性。
llm-chain是一个强大的Rust库,用于构建大语言模型中的链,能够高效地进行文本摘要和处理复杂任务。
LLM4Decompile是致力于反编译的开创性开源大型语言模型,支持将Linux x86_64二进制文件反编译为人类可读的C源代码。该项目通过利用大语言模型,提高了反编译的准确性和效率,涵盖了多个优化级别,并提供了丰富的基准测试和训练数据集。
这是一个精心策划的阅读列表,专注于机器心智理论的最新进展,基于EMNLP 2023年关于大语言模型中情境心智理论的论文构建。
MOSS-RLHF项目专注于研究大语言模型的强化学习从人类反馈(RLHF)机制,详细探讨了Proximal Policy Optimization (PPO)的内部运作,并提供了相关的代码实现,旨在推动对RLHF的理解和应用。
ProtoReplicant是一个在浏览器中实现的AI 3D化身语音接口,集成了语音活动检测、语音转文本、大语言模型、文本转语音和虚拟角色模型等技术,旨在提供一种互动性强的用户体验。
大语言模型在图上的应用是一项新兴领域。本文系统地回顾了大语言模型在图上的应用场景和技术方法。将应用场景分为纯图、文本丰富的图和文本配对的图三类,讨论了LLM作为预测器、编码器和对齐器的具体技术。此外,还提到了这些方法的实际应用和开源代码和基准数据集,总结了该领域未来的研究方向。
PAI-RAG是一个基于大语言模型和多向量数据库的知识库问答系统,提供灵活定制的高效信息检索功能,适用于各种自然语言处理任务,具有良好的扩展性。
本项目展示如何使用向量数据库基于RAG(检索增强生成)方式搭建一个中国历史问答应用,旨在提供准确可靠的历史信息和分析。
一个用于搭建类似Perplexity的问答引擎的项目,结合了多种先进的技术和模型。
Alibaba LangEngine 是一个基于 Java 的 AI 应用开发框架,旨在赋予大语言模型(LLM)数据感知和Agent能力,支持多种应用场景和集成外部 API,主要应用于个人助理、文档问答、聊天机器人等场景。
哔哩哔哩自研大语言模型,提供多样化的对话和角色扮演功能,支持多种评测基准,具有领先的性能表现
一个整理的大语言模型在表格数据应用的论文资源列表,汇集了大量与表格数据处理相关的研究资源,并提供对大语言模型在这些应用中的深入分析。项目持续更新,确保资源的时效性和相关性,支持多种表格数据处理任务的参考资料。
Recommender AI Agent 是一个结合了大语言模型的推荐系统,能够提供个性化和互动式的推荐体验。它通过用户的自然语言查询生成推荐,并能根据用户的反馈实时调整推荐结果。此外,该系统支持多种推荐算法的集成,以提高推荐的多样性和准确性。
Nanbeige-16B(南北阁-16B)是南北阁大模型实验室研发的160亿参数规模的大语言模型,采用了2.5T Tokens进行预训练,数据包含大量互联网高质量语料、各类书籍、代码等领域脱敏文本,在各个权威测评数据集上都取得了不错的效果。本次发布包含有 Base、Chat 以及扩展上下文长度的 Base-32k、Chat-32k 版本。
Pocket LLM是一个平台,旨在使复杂的大语言模型和其他先进的人工智能技术对所有人都可访问。它提供定制化、私密的人工智能解决方案,这些解决方案在普通硬件上训练,具有超低延迟推理,消除了对GPU、TPU或定制ASIC的需求。用户可以在没有高级配置或GPU的情况下,仅使用CPU构建和部署数十亿参数的模型。
Octopulse AI是一个专注于用户激活、转化和留存的增长平台,采用基于大语言模型的方法,通过关注通知和邮件的'五个正确'(正确的用户、信息、渠道、数量和时间)来最大化用户参与度。
LLMOps.Space是一个全球性的社区,专注于大语言模型(LLM)相关的公司、开源模块、教育资源和融资新闻等,旨在帮助从业者发现、学习和参与LLM的各个方面。
Defined.ai是一个提供高质量、伦理收集的数据集的平台,用户可以在此购买、销售或委托数据集,以满足AI训练的需求。
Entry Point AI 是一个现代化的微调平台,支持定制和管理大语言模型,用户无需编程技能即可训练和评估模型。它提供用户友好的界面,帮助用户按照具体需求优化大语言模型的表现。
通义千问-7B是阿里云研发的通义千问大模型系列的70亿参数规模的模型,基于Transformer的大语言模型,经过超大规模的预训练数据训练,覆盖广泛,包括网络文本、专业书籍、代码等。