隐式非线性扩散模型的最大似然训练,旨在通过学习复杂数据分布来提升生成模型的性能。
专为大型语言模型(LLM)训练优化的类,集成了多种高效训练技术,旨在提升训练效率和内存使用效率。
《对齐手册》主题是如何使用不同技术来微调语言模型,以使其更符合人类和AI的偏好。
Remix-DiT是一种采用扩散变换器的模型,旨在通过多专家系统提高图像去噪的性能,适用于多种图像处理任务。
Grounded-Segment-Anything 是一个结合了 Segment Anything、BLIP、Stable Diffusion、Whisper 和 Grounding DINO 等多种先进 AI 模型的项目。它通过集成图像分割、物体检测、图像生成和语音识别等多种能力,实现了对图片中任意物体的识别、分割和生成,支持多模态输入和输出,能够处理复杂的 AI 工作流,适用于多种创新应用场景。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型