Delta是一个用Rust语言开发的开源机器学习框架,包含神经网络层、激活函数、损失函数、优化器等组件,并提供数据处理工具。
Ludwig v0.8是一个开源的低代码框架,旨在帮助开发者轻松构建先进的机器学习模型,特别是优化用于使用私有数据构建定制的大型语言模型(LLM)。它提供了一种声明式接口,使得模型的构建过程更加高效和简便。
llm-numbers是一个每个LLM开发人员都应该了解的工具,提供关键的统计数据和指标,帮助开发者深入理解模型性能。它支持多种语言模型的评估,并易于集成到现有的机器学习工作流中。此外,llm-numbers还提供可视化工具,以便展示模型数据,让开发者更直观地分析结果。
Collie是一个多功能的AI模型训练与部署框架,旨在简化机器学习模型的开发和管理过程。它基于PyTorch,结合了DeepSpeed和MegatronLM,避免使用复杂的外部库,并提供用户友好的接口和多种内置工具。
Xtreme1 是一个为多感官训练数据生成和处理而设计的平台,提供高效的数据标注和管理工具,支持深度学习模型的训练和评估,并且易于集成到现有的工作流程中。用户可以通过友好的界面和丰富的文档快速上手。
Giskard是一个开源测试框架,专为生成式AI和机器学习模型设计。它集成了130多种评估指标,支持自动化检测生成内容的事实性、安全性及合规性。Giskard可以处理从表格模型到大型语言模型(LLM)的所有内容,并提供企业级测试中心,支持自托管和云部署。它还与Hugging Face、MLFlow、Weights & Biases等平台无缝集成,帮助团队更快、更好地交付机器学习产品。
LongBench是一个专为中英双语长文本理解而设计的评测基准,支持多种理解任务的评估,并提供标准化的数据集和评测指标,适用于各种长文本处理模型的性能评估。
Analytiqus是一个综合性的商业分析与机器学习平台,能够连接多种数据库,使用交互式图表可视化数据,执行特征工程,并利用流行的机器学习模型如RNN、LSTM和CNN。
Predibase是一个低代码AI平台,使工程师和数据科学家能够轻松构建、优化和部署最先进的模型,从线性回归到大型语言模型,只需几行代码。它还提供了一种声明式方式,帮助工程师快速调优和服务任何开源机器学习模型或大型语言模型,并在私人云中托管先进基础设施。
该项目提供了Vision Transformer在Tensorflow中的完整实现,支持多种数据集和任务,易于扩展和修改,并包含详细的使用示例和文档,帮助用户快速上手并深入了解模型的应用与性能。
用于 LLaMA 3 8B 参数版本的轻量级 CUDA C 语言实现的推理引擎,旨在在 Nvidia GPU 上进行高效的并行处理。该项目旨在充分利用 Nvidia GPU 的性能,以提供快速的模型推理,并易于集成到现有的机器学习工作流中。
llama-swap 是一个 HTTP 代理服务器,用于在需求时自动加载和切换模型。它支持动态切换 llama.cpp 或其他符合 OpenAI 兼容的后端服务器,如 vllm。该工具简化了模型调用流程,允许在请求中热切换模型,并且可以集成到现有应用程序中以增强模型调用能力。
专门用于大型语言模型微调和对齐的库,它提供了一系列高效和可扩展的技术,以及广泛的支持方法和指标,旨在简化模型的训练和部署过程
Cursive是一个直观的Python大型语言模型(LLM)框架,旨在简化与LLM的交互,支持多种模型和任务,提供高效的数据处理能力和灵活的API设计,适用于各种应用场景。
Deepseek-V3-Base是一个参数量达到685B的AI模型,采用MoE架构,虽然官方尚未公开详细信息,但其性能表现优越,已被广泛认可,成为开源领域的亮点。
一个用于促进和支持链式思考的工具库,旨在提高模型推理能力和理解力。
TaxEval 是一个专注于税务领域的语言模型评估工具,支持多种评估指标并提供详细的评估报告,便于集成到现有的税务应用中。
lightning-uq-box是一个基于PyTorch和Lightning的库,旨在为现代神经网络提供多种不确定性量化(UQ)技术,支持灵活的模型训练和评估,并与现有的PyTorch项目无缝集成。