MNN LLM App 是专为 Android 设备优化的多模态语言模型应用,支持文本/图像/音频处理任务,强调设备端运行以保护隐私。通过 CPU 推理优化,其预填充和解码速度显著超越同类工具(如 llama.cpp),兼容 Qwen、Gemma 等主流模型,适合在移动端高效执行复杂 AI 任务。