该项目是一个专注于高效推理技术的学术论文收集平台,涵盖隐式推理、推理压缩等前沿研究方向,旨在为AI领域的研究人员提供最新论文资源和研究动态。项目持续更新,内容与大型语言模型(LLMs)的高效推理研究密切相关,涉及知识蒸馏、潜在空间压缩等技术,支持学术研究与应用开发。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型