一个开源的量化金融自动交易框架,包含市场环境、智能体和应用,提供先进的算法核心以辅助连续交易决策。
LOTUS是一个语义查询引擎,能够利用大型语言模型(LLM)轻松处理数据,类似于编写Pandas代码的简单性,旨在简化数据操作的复杂性,使数据分析更加高效和准确。
llm-chain是一个强大的Rust库,用于构建大语言模型中的链,能够高效地进行文本摘要和处理复杂任务。
一个简单易用的解析工具,能够解析来自ChatGPT o1的XML响应,并将它们应用到目标代码库中
JAX Synergistic Memory Inspector是一个用于检查JAX程序内存使用情况的工具,旨在优化性能。它可以帮助开发者识别内存瓶颈和低效之处,提供有关JAX张量的分配和释放的深入见解,能够与JAX工作流程无缝集成,并提供关于内存使用情况的详细报告和统计信息。
这是一个用Python编写的GraphRAG算法的简化实现,仅包含1000行代码,旨在提供高效的结构化信息检索和知识图谱构建功能。
semchunk是一个快速且轻量的纯Python库,旨在将文本拆分成语义上有意义的区块,方便进行自然语言处理和文本分析。
PlotAI利用大型语言模型生成Python和Matplotlib的图表生成代码。用户只需提供DataFrame和一个提示,PlotAI会自动构建适合LLM的提示,并返回相应的Python代码和图表。
lightning-uq-box是一个基于PyTorch和Lightning的库,旨在为现代神经网络提供多种不确定性量化(UQ)技术,支持灵活的模型训练和评估,并与现有的PyTorch项目无缝集成。
bricks是一个模块化的自然语言处理工具,包含分类器、提取器和生成器等众多基础模块,支持多种NLP任务,具有开源和易于扩展的特点。
HugNLP是一个基于HuggingFace Transformer的综合自然语言处理库,支持多种NLP任务,具有易于使用的API接口和丰富的预训练模型,同时允许用户自定义模型训练。
机器学习实战资料(Jupyter Notebooks) - 通过在Jupyter Notebooks中实验最先进的机器学习模型和算法进行学习。
Jlama是一个纯Java实现的大规模语言模型推理引擎,支持多种模型格式,能够提供高性能和低内存占用,易于集成到各种应用中。
LLM4Decompile是致力于反编译的开创性开源大型语言模型,支持将Linux x86_64二进制文件反编译为人类可读的C源代码。该项目通过利用大语言模型,提高了反编译的准确性和效率,涵盖了多个优化级别,并提供了丰富的基准测试和训练数据集。
Gpt4Free-Chat-bot是一个使用discord.py库开发的聊天机器人,能够在Discord上与用户互动。它可以回复用户消息、更新个人资料图片,并提供延迟信息。此外,该机器人利用来自GPT4FREE的模型,根据对话历史生成智能响应,增强了用户体验。
SimPO 通过将强化学习转变为有监督的成对损失,提供了一种新的方法来处理序列生成任务。
transformers_zamba2是一个为自然语言处理打造的先进工具库,提供数千个预训练模型,支持文本分类、问答、翻译等多种语言任务,让NLP技术更易用。该库不仅可以处理文本数据,还支持视觉和音频模态,适用于多种应用场景。
LLMs-from-scratch 是一个资源库,提供构建大型语言模型(LLM)所需的实践经验和基础知识。该项目通过逐步指导、清晰的文字、图表和示例,帮助用户深入了解LLM的内部工作原理,并创建自己的LLM。内容包括文本数据处理、注意力机制实现、模型预训练与微调等,适合初学者和进阶用户。
gsh是一个现代化、与POSIX兼容的生成式shell,旨在利用生成式人工智能辅助功能来提供智能命令建议、命令解释和Agent执行等功能,同时保证隐私和定制性。
rust-genai是一个支持多个生成式AI服务的客户端,兼容Ollama、OpenAI、Anthropic等,提供统一的API接口,旨在简化各种AI服务的调用和集成过程,易于使用和扩展,并支持多种语言和模型。
boardgame.io是一个强大的JavaScript引擎,专注于回合制游戏的开发,提供全面的状态管理、实时对战和灵活的游戏阶段管理,旨在简化游戏开发过程,支持多人在线互动和AI对战,并能够快速进行原型验证。
关于算法代码生成的数据集,具有更大规模、更高质量和更精细标签的特点,旨在提供一个更具挑战性的训练数据集和评估基准,用于代码生成模型领域
Hugging Face 在所有 250K+ 公共数据集上增加了自然语言转 SQL 的功能,使用的模型是 Qwen 2.5 Coder 32B。该项目旨在通过简化查询过程,使用户能够轻松地从自然语言生成SQL查询,从而提高数据分析和操作的效率。
这是2022搜狐校园算法大赛NLP赛道第一名的开源方案,包含实验代码,旨在提供高效的自然语言处理解决方案。该项目经过优化,能够支持多种数据预处理方式,并提供详细的实验结果和分析,帮助用户更好地理解和应用自然语言处理技术。
Brev.dev Notebooks 提供多种现成的 AI 和 ML 笔记本模板,支持快速原型开发和实验,集成常用的机器学习库和工具,易于共享和协作。
一个主动预测任务的LLM代理系统,通过环境感知、辅助标注和动态生成管道,能够在无需用户明确请求的情况下主动提供帮助。
一个用Rust开发的本地LLM接口工具,支持多平台(Mac/Windows/Linux)的CPU和GPU运行。特色是提供了级联提示工作流(Cascading Prompt Workflow)系统,能将LLM的概率性输出转换为确定性信号,大幅提高输出可靠性。
Shire 是一个用于增强 AI 与 IDE 整合体验的工具,提供丰富的交互支持和多功能升级。
langchain-examples是一个由LangChain LLM框架驱动的应用程序集合,旨在展示其强大功能,涵盖多种使用场景和用例,提供易于扩展和定制的示例,适合快速原型开发和学习。
首款利用大型语言模型(LLM)进行零样本漏洞发现的工具,能自动分析代码,检测远程可利用的安全漏洞,帮助开发者及时发现和修复潜在的安全隐患。