carefree-flow是一个基于OneFlow的深度学习库,旨在简化模型构建与训练过程,提供高效的计算性能和友好的API设计,支持动态计算图,适合开发者快速原型和高性能训练需求。
开源机器学习框架
这个开源项目是一个生成式AI模型优化赛的参赛方案,获得了天池NVIDIA TensorRT Hackathon 2023初赛的第三名。该项目的功能涉及到开源、机器学习等领域。
一个完整的管道,用于在消费级硬件上使用LoRA和RLHF微调Vicuna LLM。该项目实现了基于Vicuna架构的RLHF(强化学习与人类反馈),基本上是ChatGPT的变种,但使用Vicuna。
HyperLLM是一种新一代的小型语言模型,称为'混合检索变换器',利用超检索和无服务器嵌入技术,实现即时微调和训练,成本降低85%。
MobileNet V1的TensorFlow官方checkpoint到PyTorch版本的checkpoint转换工具,旨在简化不同深度学习框架之间的模型迁移,同时保持模型的精度和性能,适用于研究人员和开发者。
这个开源项目的功能是对类似 #ChatGPT# 的模型进行简单、快速且经济实惠的 RLHF 训练。
从自动微分开始完全从头开始GPT-2训练,一个快速且功能完备的深度学习库,使用Python和NumPy编写
该教程是连接基础微积分与深度学习实践的桥梁,适合希望摆脱“黑箱”使用框架、深入理解模型数学本质的开发者。
Algomax是一个平台,旨在简化您的LLM和RAG模型评估,提升提示开发效率,并通过独特的定性指标洞察加速开发过程。该平台提供直观的仪表盘,便于您轻松集成到工作流程中,评估模型性能,评估引擎设计精准,能够深入洞察模型行为。
APEBench是一个用于评估偏微分方程(PDE)自回归神经仿真器的基准测试框架,提供标准化的评估工具,支持多种自回归建模配置,旨在促进不同模型和技术之间的比较。
river-torch是一个基于PyTorch的Python库,专为在线深度学习而设计,支持实时数据的模型适应。它与River框架无缝集成,提供多种神经网络架构,并包含模型评估和性能监控工具。
Qwen2-VL微调工具:用于微调开源多模态大模型Qwen2-VL,支持单GPU和多GPU训练,提供简易上手的微调脚本和数据,旨在帮助开发者快速进行模型微调或再训练
OneDiff 是一个用于提升 Stable Diffusion 和 Stable Video Diffusion 性能的工具,提供社区版和企业版,支持多种硬件加速,能够显著提高计算速度和图像生成效率。它适用于机器学习、图像处理和数据分析等多个领域,支持多种模型和场景的实时生成与修改。
Python版本的TensorFlow深度学习API
该项目深入介绍了Transformer模型的背景、关键组件及其实现细节,旨在帮助开发者理解并实现Transformer架构。