Meta 发布的 Llama 3.1 1B和3B的官方量化版本,提供了更小的内存占用、更快的设备推理速度、准确性和便携性。
针对 LiteRT 模型的高级后训练量化工具,旨在帮助开发者优化资源密集型模型(如 GenAI 模型)以在边缘设备上实现最佳性能。该工具支持灵活的后训练量化,专为提高边缘设备的运行效率而设计,适用于需要减少模型大小和计算需求的应用场景。
mllm是一个专为移动和边缘设备优化的轻量级多模态大型语言模型推理引擎,能够在无需依赖外部库的情况下,支持多种模型和硬件架构,提供快速推理能力。
cl-waffe2是一个基于Common Lisp的图和张量抽象的深度学习框架,具有可扩展性、内联优化、图优化、可视化和调试等特点,旨在为研究和开发提供强大的工具支持。
开源机器学习框架
Predibase是一个低代码AI平台,使工程师和数据科学家能够轻松构建、优化和部署最先进的模型,从线性回归到大型语言模型,只需几行代码。它还提供了一种声明式方式,帮助工程师快速调优和服务任何开源机器学习模型或大型语言模型,并在私人云中托管先进基础设施。
Taipy是一个强大的工具,可以将数据和人工智能算法转化为完整的网络应用程序,支持快速构建数据驱动的应用,集成多种机器学习和AI算法,提供用户友好的界面和丰富的数据可视化功能。
openagent是一个模块化组件库和编排框架,受到微服务方法的启发,为开发人员提供构建强大、稳定和可靠的人工智能应用程序和实验性自主智能体所需的所有组件。它支持易于扩展和维护的设计,提升了系统的可伸缩性,适用于构建复杂的AI应用和自主智能体。
FreeAiKit是由Prgmine提供的一套AI工具,旨在帮助用户完成各种与AI相关的任务,且免费提供。用户可以通过访问网站浏览工具,每个工具都有详细的描述和使用说明,用户可根据指南选择所需工具并应用于AI项目。
Liner.ai 是一个免费的工具,让用户可以在无需编码或机器学习专业知识的情况下构建和部署机器学习应用。它提供了一个端到端的解决方案,允许用户使用自己的数据训练机器学习模型,并将其与应用程序集成。
RWKV Infinite Context trainer 是一个用于训练任意上下文大小的工具,能够处理超过10k的上下文长度,同时在几乎恒定的VRAM内存消耗下运行。
JupyterLab-TensorBoard-Pro是一个TensorBoard插件,为JupyterLab提供了更完善的功能。它能将TensorBoard整合到JupyterLab中,使用户能够更方便地在JupyterLab中使用TensorBoard。这是一个开源项目,用户可以自由使用。该插件专为机器学习任务设计,可以在JupyterLab中方便地进行机器学习相关的操作和监控。
TinyZero是一个以不到30美元的成本,利用veRL强化学习训练框架,在qwen2.5模型基础上进行训练的项目,能够复现DeepSeek R1论文中的'Aha moment',并提供完整实验日志和开源代码,方便复现和学习。
MeZO是一个通过正向传递实现语言模型微调的工具,无需反向传播,极大地简化了训练过程,同时支持多种预训练语言模型,提升了训练效率和资源利用率。
river是一个用于在线机器学习的Python库,支持增量学习和数据流处理,适合实时预测系统的构建。它具有多种机器学习算法和模型,易于与现有的数据处理管道集成,同时支持模型评估和性能监控。
MuJoCo Python 可视化工具:用于MuJoCo物理引擎的交互式渲染器,支持Python官方绑定,简化仿真和可视化过程。该工具提供了丰富的可视化选项,帮助用户更好地理解和调试物理仿真。
ModuleFormer是一个模块化的大模型,通过使用不同的模块来提高效率和灵活性。该模型允许根据输入动态激活特定模块,从而实现针对特定领域的优化和轻量化。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型