该项目是一个专注于多模态大型语言模型(MLLM)和视觉语言模型(VLM)推理的综合资源库,汇集了最具影响力的论文、代码、数据集、基准测试和资源。旨在为研究人员和开发者提供一站式学习平台,涵盖Chain-of-Thought、OpenAI o1、DeepSeek-R1等前沿推理技术,包含20+顶级论文和实操项目资源。
该项目是一个专注于深度推理研究的资源集合,旨在解决深度推理研究中的资源查找难题。它收集了40多个深度推理模型、论文、数据集和工具,覆盖从基础到高级的多维度资源,包括数学、科学、代码等多个领域。项目持续更新,紧跟最新研究动态,特别关注r1模型(如DeepSeek-R1)相关内容,为用户提供一站式资源平台。
阿里云 PAI Model Gallery 是一个为开发者提供便捷 AI 模型部署的平台,特别支持 DeepSeek-V3 和 DeepSeek-R1 系列模型。这些模型分别是拥有 6710 亿参数的专家混合大语言模型和高性能推理模型。该服务通过一键部署功能,结合 BladeLLM、SGLang 和 vLLM 等加速技术,帮助用户轻松集成先进 AI 能力,无需复杂基础设施配置。
transformers.js-chrome 是一个浏览器插件,旨在直接在浏览器中运行大语言模型。它支持本地小模型(1-7B规模)及DeepSeek-R1的蒸馏版本,无需WASM方案,用户只需安装插件即可使用。对于性能足够强的电脑,还可以加载并运行更大的模型。
DeepSeek-R1 是一个基于 SGLang 和 SkyPilot 实现的高吞吐量服务,专门用于大规模语言模型的部署和高效服务。它通过优化计算资源和网络通信,显著提升了语言模型的处理能力和响应速度,适用于需要高吞吐量的场景。
DeepSeek-R1 是 GitHub 模型游乐场上线的模型,允许用户进行有限量的使用,适合于快速测试和体验。