SmolLM2是HuggingFace团队推出的轻量化AI模型系列,支持在资源有限的设备上运行,提供多个参数版本(135M、360M和1.7B),能够处理多种任务,特色是体积小、速度快,开发者友好,支持多种集成和部署方式。
LiteRT是Google AI Edge团队推出的高性能、可信赖的边缘AI运行时,旨在继承TensorFlow Lite的优势,并拓展其愿景,支持多种AI框架并优化资源利用率,方便集成和部署。
FlexGen: 针对面向吞吐量的场景在单个 GPU 上运行大型语言模型,旨在提高模型的运行效率和简化部署过程。
一个新的LLM训练方法,通过将训练分散到不同的边缘设备上以保持数据隐私,同时最大化利用边缘设备的算力。
Roboflow是一个综合平台,旨在帮助软件识别和分析图像和视频中的物体,适用于开发者和工程师,简化数据集创建、模型训练和生产部署的过程。
mlc-llm 使每个人都能在每个人的设备上本地开发、优化和部署 AI 模型,支持多种 AI 模型架构,并提供模型优化工具和简化的部署过程。
VT-Transformer是一个基于第一性原理的AI模型转换器,采用宏展开的DSL技术,旨在优化各种AI模型在复杂硬件环境下的性能,特别是针对国产硬件。
该项目通过Tensorrt技术加速SAM模型的推理过程,旨在提升图像分割的效率和性能,确保其在多种硬件平台上的兼容性,适用于各类深度学习应用。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型