一个持续更新的手册,旨在帮助读者追踪最新的 NL2SQL(文本到 SQL)技术,并为研究人员和实践者提供实用指导。该手册汇集了最新的信息和最佳实践,适合不同层次的用户,提供了丰富的示例和代码片段,便于理解和应用。
llama-jax是LLaMA的JAX实现,旨在利用Google Cloud TPU进行训练,提供高效、灵活的模型训练解决方案。
Hugging Face Transformers 是一个广泛使用的开源NLP框架,专注于大规模预训练语言模型的实现与部署。它支持BERT、GPT-3、T5等数百种顶级模型,涵盖文本分类、情感分析、命名实体识别等多种NLP任务,并支持多模态任务。该库提供简洁的API接口,便于快速加载、微调和优化模型,适用于学术研究与工业应用,社区驱动更新迅速,是自然语言处理领域的重要工具。
Eko是一个用自然语言构建生产就绪的智能工作流框架,让开发者能轻松创建从简单命令到复杂流程的可靠Agent,统一在电脑和浏览器环境中运行。
该项目集成了Firecrawl的OpenAI实时API控制台,支持实时交互和音频管理,适用于浏览器和Node.js环境,用户可以通过声音引导AI代理实时爬取和浏览网站内容。
Hugot 是一个用于 Golang 的 huggingface transformer pipelines,可以轻松地将 Python 中的 huggingface 模型部署到 golang 应用中。该项目支持多种 Hugging Face 模型,简化模型部署过程,轻松与 Golang 应用集成,提供高性能的推理和用户友好的 API。
RLAIF通过人工智能反馈扩展人类反馈的强化学习,表明可以在不依赖人类注释者的情况下产生与RLHF相当的改进。
NanoLLM 是一个专门为大语言模型(LLM)提供优化本地推理的平台,支持 HuggingFace 风格的 API,具备量化、视觉/语言模型、多模态Agent、语音处理、矢量数据库集成和检索增强生成(RAG)等功能。
一站式AI开发平台,支持机器学习、深度学习和大模型开发。它提供从数据管理到模型部署的全流程支持,涵盖在线开发、分布式训练、推理服务等功能,帮助企业和开发者高效构建AI应用。
拓扑机器学习教程:面向从业者的拓扑方法,利用代数拓扑技术分析复杂数据结构,捕捉传统机器学习方法可能无法捕捉的特征
GAIA是一个可以从单个肖像图像和语音片段生成会说话的化身的人工智能项目。它支持通过文字提示来指导视频生成。
一个包含大约4675本中文科幻小说的语料库,可以用于中文科幻小说的人工智能研究。
microchain是一个基于函数调用的LLM智能体的开源项目,旨在提供简洁高效的智能体解决方案,支持多种功能与集成,适合开发者和企业使用。
该项目证明可以将 LLMs 的工作负载分散到多个设备上并实现显著的加速,支持在低功耗设备上运行,兼容Llama 2 70B模型。
vx.dev是v0.dev的开源替代,提供可控成本和高度定制的用户界面生成工具,能够与GitHub无缝集成,适合开发者使用。
关于使用RAG模式(Retrieval-Augmented Generation)的应用和资源的信息,包括关于RAG技术的综述,以及一些GitHub库和企业级应用的链接,这些应用使用RAG模型来增强自然语言处理和信息检索能力
本项目提供了Rasa框架的官方示例代码,帮助开发者快速上手构建对话机器人,支持中文语料的处理,并包含多种对话管理策略和模型训练评估工具。
i2vgen-xl是一个最新的开源视频生成模型,基于先进的深度学习技术,能够支持高质量视频生成,并且开放源代码,便于用户自定义和扩展。该模型可以处理多种输入格式,适用于多种应用场景。
利用该项目你可以在你的iOS或macOS应用程序中使用Stable Diffusion生成图像。
一个由AI驱动的数据科学团队,旨在帮助你以更快的速度完成常见的数据科学任务,比如数据清洗、特征工程等,就像是拥有一支数据科学的“私人部队”
Helibrunna是一个兼容Hugging Face的xLSTM训练框架,旨在探索xLSTM在AI领域的潜力,提升模型训练效率并支持实验性研究。
展示如何使用 TensorFlow 生态系统从 Transformers 构建视觉模型的机器学习管道,支持完整的 MLOps 流程,集成模型管理和监控功能。
《解构大语言模型:从线性回归到通用人工智能》配套代码,提供了大语言模型的实现与分析,展示了线性回归与语言模型之间的关系,并支持多种数据集与训练配置,易于扩展与自定义。
开源复现Moshi模型训练过程,包括音频编解码器Mimi及文本和音频的层次化语言模型。该项目为研究人员和开发者提供了一个完整的框架,用于训练和实现先进的语音和文本处理能力,支持实时对话和多模态学习。
LoRA inspector是一个专为Stable Diffusion设计的工具,旨在可视化和评估Low-Rank Adaptation(LoRA)模型的性能。它提供了用户友好的界面,支持多种文件格式的导入和导出,方便用户快速比较不同模型的效果,帮助用户选择最佳的模型配置以提升生成效果。
BMTools是面壁智能开发的一个大模型工具学习平台,专注于问答系统的构建和训练,填补了国产大模型在该领域的空白,支持多种中文应用。
一个强大的Python框架,用于轻松管理和协调AI Agent,支持创建、管理和协调多个AI Agent之间的复杂交互。它提供了智能体管理、互动编排、进度控制、数据生成等多种功能,旨在提升AI Agent的运行效率和交互质量。
专为物理AI设计的世界基础模型平台,旨在帮助物理AI开发者更好更快地构建物理AI系统。
Nano是一个自制的168M大语言模型,具备完整的模型结构和多种推理方式,适用于多种场景的AI应用。
一个通用框架(服务器 + UI),可让您轻松地在自己的数据集上执行 RAG。