Amazon Foundation Model Evaluations Library,用于评估大型语言模型(LLMs),帮助选择最适合您用例的LLM。该库提供多种评估功能,覆盖开放式生成、文本摘要、问答和分类任务,旨在帮助用户全面了解不同模型在特定任务上的表现。
llm-numbers是一个每个LLM开发人员都应该了解的工具,提供关键的统计数据和指标,帮助开发者深入理解模型性能。它支持多种语言模型的评估,并易于集成到现有的机器学习工作流中。此外,llm-numbers还提供可视化工具,以便展示模型数据,让开发者更直观地分析结果。
Ludwig v0.8是一个开源的低代码框架,旨在帮助开发者轻松构建先进的机器学习模型,特别是优化用于使用私有数据构建定制的大型语言模型(LLM)。它提供了一种声明式接口,使得模型的构建过程更加高效和简便。
RoboManipBaselines是一个集成了多种模仿学习方法和基准任务环境的软件,旨在为机器人操控提供基准和支持,提升学习效率与准确性。
Giskard是一个开源测试框架,专为生成式AI和机器学习模型设计。它集成了130多种评估指标,支持自动化检测生成内容的事实性、安全性及合规性。Giskard可以处理从表格模型到大型语言模型(LLM)的所有内容,并提供企业级测试中心,支持自托管和云部署。它还与Hugging Face、MLFlow、Weights & Biases等平台无缝集成,帮助团队更快、更好地交付机器学习产品。
提供一种 Pythonic 方式在 LLM 管线上运行离线评估,以便轻松投入生产
vLLM是一个高吞吐量且内存高效的推理和服务引擎,专为大规模语言模型设计,具备优化的模型加载与推理速度,能够与多种硬件加速器兼容。
Meta 的应用强化学习团队带来了可投入生产的强化学习 AI 代理库,支持多种算法和高效的样本利用率,适用于不同的应用场景。
一个包含多个样本的基准测试项目,用于大语言模型的测试和评估,旨在帮助研究者和开发者了解模型的性能表现。该项目提供多种语言的测试样本,支持自定义测试用例,易于与现有AI项目集成,方便进行系统性评估。
Notehub.ai是一个便捷的平台,允许用户与同事和朋友分享Jupyter笔记本。用户只需注册账户,创建笔记本,并通过提供笔记本的URL与他人共享。
一个简洁、易于修改的GraphRAG实现,提供了小型化、快速、清晰的GraphRAG核心功能,同时保持了可扩展性、异步处理和全面类型化
一个基于FastAPI的Llama2嵌入服务,旨在提供高效的文本嵌入功能。该服务通过RESTful API接口,支持多种输入格式,能够快速生成文本嵌入,方便用户集成到现有的应用程序或机器学习管道中。
一个用于促进和支持链式思考的工具库,旨在提高模型推理能力和理解力。
diffusers-rs是一个基于Rust和Torch的Diffusers API,旨在提供高性能的图像生成和模型推理功能。它支持多种预训练模型,并提供易于扩展和自定义的架构,适合在机器学习工作流中使用。
OpenAI Tools是一个综合工具包,旨在帮助用户充分利用他们的OpenAI账号。它提供了API使用情况跟踪、ChatGPT微调数据集管理、微调任务的创建、监控和取消、训练日志的审查和可视化、直接测试和比较微调及其他模型等功能。
Amazon CodeWhisperer是一个先进的AI工具,旨在通过提供实时代码建议来提升开发者的生产力。它能够生成代码片段和完整函数,还能将自然语言转化为bash命令,支持多种编程语言,并与多种IDE和命令行工具无缝集成,简化复杂的编码任务,提升效率。
pykan 是一个基于 Kolmogorov-Arnold 表示定理的 Python 库,旨在替代传统的多层感知器 (MLP),提供更高的模型准确性和可解释性。它特别针对科学研究优化,能够在物理和数学领域解决复杂问题,如识别相关特征、揭示模块结构、发现符号公式等。pykan 通过使用非线性边缘函数和样条函数参数化,能够表示更复杂的曲线并进行细致的调整,从而在数据拟合、PDE 求解等任务中表现出色。
vizGPT是一个数据可视化平台,通过聊天界面将上下文数据转化为互动式可视化图表,利用先进的模型生成有意义的视觉表现。