阿里云 PAI Model Gallery 是一个为开发者提供便捷 AI 模型部署的平台,特别支持 DeepSeek-V3 和 DeepSeek-R1 系列模型。这些模型分别是拥有 6710 亿参数的专家混合大语言模型和高性能推理模型。该服务通过一键部署功能,结合 BladeLLM、SGLang 和 vLLM 等加速技术,帮助用户轻松集成先进 AI 能力,无需复杂基础设施配置。
DeepSeek-R1 是一个基于 SGLang 和 SkyPilot 实现的高吞吐量服务,专门用于大规模语言模型的部署和高效服务。它通过优化计算资源和网络通信,显著提升了语言模型的处理能力和响应速度,适用于需要高吞吐量的场景。