MNN LLM App 是专为 Android 设备优化的多模态语言模型应用,支持文本/图像/音频处理任务,强调设备端运行以保护隐私。通过 CPU 推理优化,其预填充和解码速度显著超越同类工具(如 llama.cpp),兼容 Qwen、Gemma 等主流模型,适合在移动端高效执行复杂 AI 任务。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型