该项目是一个专注于深度推理研究的资源集合,旨在解决深度推理研究中的资源查找难题。它收集了40多个深度推理模型、论文、数据集和工具,覆盖从基础到高级的多维度资源,包括数学、科学、代码等多个领域。项目持续更新,紧跟最新研究动态,特别关注r1模型(如DeepSeek-R1)相关内容,为用户提供一站式资源平台。
Hunyuan-T1是腾讯推出的人工智能推理模型,采用全球首个混合Mamba-Transformer架构的MoE模型,生成速度为每秒60-80词元,具有低幻觉特性。它特别适合需要处理复杂逻辑和长文本的企业开发者,提供高效可靠的AI推理能力。该模型基于TurboS快速思维基础,是一个超大型的Hybrid-Transformer-Mamba MoE大模型。
NVIDIA DeepSeek R1 FP4 是基于 DeepSeek AI 的 DeepSeek R1 模型的量化版本,采用 FP4 精度,优化了推理性能并降低了成本。该模型通过 TensorRT 技术,在保持高精度的同时显著加快数据处理速度,特别适合需要高效率 AI 系统的企业和开发者。