mcts-llm是一个集成了蒙特卡洛树搜索(MCTS)和提示工程技术的轻量级项目,旨在提高大型语言模型(LLMs)的性能。该项目通过结合MCTS算法与大型语言模型,优化提示工程,来提升模型的响应质量。其轻量级的设计使得该项目易于集成和使用,并且支持多种语言模型,适用于各种自然语言处理任务。
FuseLLM 是一个旨在通过融合多种大型语言模型的知识,以提高推理能力的项目。该项目能够结合不同模型的优点,扩展知识的边界,适用于多种自然语言处理任务,提供更强大的模型性能。
TokenLearn 静态词嵌入:一种预训练模型2Vec的方法,专注于提升自然语言处理中词嵌入的静态特性,使其更适用于各种下游任务。
LlamaIndex(原名GPT Index)是一个开源工具,专注于将大型语言模型(LLMs)与外部数据源集成,帮助开发者构建更强大的问答系统和知识库应用。它提供了一种结构化的方式来管理LLM的数据,支持多种数据源和索引策略,旨在提升LLM应用的开发效率和数据检索性能。
Search-o1是一个增强大型推理模型的搜索工具,类似于为模型装上“搜索引擎”,使其在思考过程中能够随时查找知识,从而减少错误和不确定性,提升完成复杂任务的能力。
一种特殊的神经网络架构,可以在不增加推理成本的情况下,为语言大模型(LLM)增加可学习的参数。该研究发现模型比密集模型更能从指令调优中获益,因此提出将MoE和指令调优结合起来。
用蒙特卡洛树搜索与大型语言模型结合解决数学问题的演示项目,就像给AI装上了解题的“指南针”,让它能更高效地找到解题路径