一个魔改版的llama2.c,旨在利用1998年的计算机硬件(Intel Pentium II CPU + 128MB RAM)在Windows 98系统上运行大模型。
LiteRT是Google AI Edge团队推出的高性能、可信赖的边缘AI运行时,旨在继承TensorFlow Lite的优势,并拓展其愿景,支持多种AI框架并优化资源利用率,方便集成和部署。
vLLM是一个高吞吐量且内存高效的推理和服务引擎,专为大规模语言模型设计,具备优化的模型加载与推理速度,能够与多种硬件加速器兼容。
关于算法代码生成的数据集,具有更大规模、更高质量和更精细标签的特点,旨在提供一个更具挑战性的训练数据集和评估基准,用于代码生成模型领域
用于评估和理解大型语言模型的统一评估框架,提供了用户友好的API,方便研究人员进行模型性能评估、提示工程和对抗提示攻击评估等。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型