MNN LLM App 是一个专为 Android 设备设计的多模态大语言模型应用,支持文本、图像、音频等多种任务。它基于阿里巴巴的 MNN 框架,优化了 CPU 推理,预填充速度比 llama.cpp 快 8.6 倍,解码速度快 2.3 倍,兼容多种主流模型如 Qwen、Gemma 和 Llama。该应用在设备本地运行,确保用户隐私,无需上传数据,特别适合需要离线处理的场景。