NanoDL是一个基于Jax的库,专门用于从头设计和训练Transformer模型。它是一款低资源的定制开发工具,能够加速定制模型和大型语言模型(LLM)的开发。NanoDL提供了灵活的模型设计和训练配置,支持GPU/TPU加速,并适用于资源受限的环境。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型