这是2022搜狐校园算法大赛NLP赛道第一名的开源方案,包含实验代码,旨在提供高效的自然语言处理解决方案。该项目经过优化,能够支持多种数据预处理方式,并提供详细的实验结果和分析,帮助用户更好地理解和应用自然语言处理技术。
Open Interpreter Local III是一款开源的本地模型运行和训练工具,支持高速推理和个性化模型定制。
OpenGPTs 是一个开源实验项目,旨在提供可定制的 GPT 模型,紧跟 OpenAI 的前沿技术。它允许用户根据自己的需求创建和调整模型,以便进行更灵活的应用和创造性实验。
llm-workflow是一个利用语言模型构建智能工作流的工具,提供了灵活的配置选项,支持多种语言模型,并易于与其他应用程序和服务集成。
Wenet STT Python是一个基于WeNet的语音识别库,旨在提供高效、准确的语音转文本功能。它支持多种语言,能够实时处理语音输入,并允许用户自定义模型以满足特定需求,易于与现有Python项目集成。
Shire 是一个用于增强 AI 与 IDE 整合体验的工具,提供丰富的交互支持和多功能升级。
Nixiesearch是一个混合搜索引擎,结合了传统文本搜索和语义搜索的最佳特性,专为云原生环境设计,支持自动扩展,并且能够通过机器学习模型对搜索结果进行优化。
这是一本由李宏毅老师和Datawhale团队出品的电子书,整理了李老师的视频教程,涵盖深度学习的理论与实战,提供丰富的学习资源和配套代码,适合各层次的学习者。
面向Stretch 3移动机器人的智能行为开发框架,集成了抓取、操控、导航、LLM代理、语音交互等多项功能。
可微分的刚体物理模拟器,用于在虚拟环境中模拟物体的物理行为,比如物体的碰撞和运动,帮助研究人员和开发者更好地理解和预测物理世界中的物体交互
RaySystem 是一个多功能的工具集,涵盖笔记目录树生成、系统监控、分布式计算和 AI 全栈副业生存系统等多个领域。它支持 Flutter 框架,提供美观的 UI 设计和开源代码,适用于多种开发场景。RaySystem 还包括状态栏系统信息监控、macOS 系统资源监控、分布式应用框架等功能,帮助用户高效管理和监控系统资源,提升开发效率。
《对齐手册》主题是如何使用不同技术来微调语言模型,以使其更符合人类和AI的偏好。
这是一个全面的解决方案加速器,旨在在Azure上实施MLOps实践,使组织能够简化其机器学习工作流程并有效管理ML模型的生命周期。
一个 Python 库,用于创建和处理自然语言处理 (NLP) 数据集,以便训练大型语言模型 (LLM)。该库包含一些可扩展的模块,允许 NLP 研究人员从无标注 Web 采集高质量文本,并提供 GPU 加速功能。
FastMCP是一个快速构建Model Context Protocol(MCP)服务器的Python框架,提供了简洁的API接口来构建LLM上下文服务。它支持工具函数、资源访问、提示词模板等功能,特别适合为Claude等LLM应用提供数据和功能支持。
imgfind是一个基于Rust、candle和CLIP构建的图像搜索工具,旨在提供高性能的图像检索体验。它利用深度学习技术和CLIP模型,支持多种图像格式,并具备用户友好的命令行界面,适用于各种图像搜索需求。
OpenPipe是一个自托管的平台,旨在以数据驱动的方式快速生成、测试和比较LLM提示。用户可以轻松地在不同模型之间翻译提示,从而优化模型的表现。
为苹果的mlx机器学习库提供的非官方Rust绑定,支持在Rust程序中便捷地使用苹果的机器学习技术,特别适合希望在苹果生态中进行机器学习开发的开发者。
Delta是一个用Rust语言开发的开源机器学习框架,包含神经网络层、激活函数、损失函数、优化器等组件,并提供数据处理工具。
通过人工智能加速UI的构建和迭代,可以直接在IDE中使用,可以快速创建和编辑组件,并生成可维护的代码
这是一个精心策划的Rust工具、库和框架列表,旨在帮助开发者在大型语言模型(LLM)、GPT和人工智能(AI)领域进行工作。该项目提供了全面的Rust库集合,专为LLM和AI开发而设计,注重性能和效率,并且定期更新新工具和资源。
一个可用来快速构建完善 AI Agent(智能体)服务的工具包,包含 LangGraph Agent、FastAPI 服务、Streamlit 应用等工具,并提供模板,助力构建和运行专属的 Agent。
Gorilla是一个擅长调用各类API的大语言模型,能够通过自然语言查询生成语义和语法正确的API调用。
MobileCPM是一个旨在帮助开发者将大型语言模型无缝集成到移动应用中的工具集,能够实现多种用例的本地模型能力,支持在移动设备上运行并提供多种功能,简化了开发者的集成过程。
diffusers-rs是一个基于Rust和Torch的Diffusers API,旨在提供高性能的图像生成和模型推理功能。它支持多种预训练模型,并提供易于扩展和自定义的架构,适合在机器学习工作流中使用。
该项目展示了如何使用Transformers.js在浏览器中进行AI推理,特别是图像背景去除和语音识别,支持WebGPU加速,保证数据隐私,适合需要实时处理的应用。
LLaMA-Mesh是一个利用大规模机器学习模型生成高质量3D网格的项目,支持多种3D模型格式并提供易于使用的API,能够与现有的3D渲染工具兼容,方便用户生成和导出所需的3D模型。
LlamaParse是一款专门用于解析包含表格、图表和图像的复杂幻灯片的工具,能够生成视觉丰富的报告,支持文本和图像的混合输出。它支持多模态功能,能够处理多种数据源,并实现文本和图像块的向量索引。此外,LlamaParse还能生成结构化输出,便于创建复杂的报告,并与RAG(检索增强生成)技术集成,提升报告生成的质量和效率。
Alpaca 是斯坦福大学基于 LLaMa-7B 训练的开源语言模型,其性能可与 173B 的 GPT-3.5 媲美。通过优化数据集,Alpaca 能够在微调 7B 和 13B 参数的语言模型时显著提高效果。
高级检索增强生成(RAG)技术合集,包含10种先进RAG实现方案的详细教程。从基础的Naive RAG到高级的Adaptive RAG,提供完整的代码实现和评估方法。使用LangChain、Pinecone等主流工具,适合研究人员和开发者学习和实践RAG技术