LLaMA推理

LLaMA_MPS开源项目 – 在Apple硅上运行LLaMA推理

LLaMA_MPS开源项目 – 在Apple硅上运行LLaMA推理

LLaMA_MPS是一个专门为Apple Silicon GPU优化的项目，旨在高效地运行LLaMA模型的推理过程。该项目充分利用苹果硬件的加速能力，提供简洁的API接口，优化内存管理，确保用户能够快速高效地进行自然语言处理任务。

API接口Apple Silicon优化LLaMA推理内存管理

Keywords AI官网 – 高性价比的LLM API

Keywords AI是一个提供高质量、低成本替代方案的LLM API，用户可以通过注册免费试用API密钥，体验其测试平台和聊天机器人功能。

免费试用API测试平台聊天机器人高性价比LLM API

MLX开源项目 – Apple 机器学习阵列框架

MLX开源项目 – Apple 机器学习阵列框架

MLX 是 Apple 芯片上用于机器学习的阵列框架，由 Apple 机器学习研究团队提供。它提供了熟悉的 API 和强大的功能，支持多种计算模式和设备，旨在简化机器学习模型的构建与训练。

Apple机器学习C++ APIMLX框架Python API

MLX RAG开源项目 – 本地运行的RAG应用示例

MLX RAG开源项目 – 本地运行的RAG应用示例

MLX RAG是一个简单的示例项目，展示如何在Apple Silicon设备上利用MLX框架进行RAG应用的本地运行。

MLX框架RAG应用示例本地运行示例

Kokoro-FastAPI开源项目 – 基于Docker的文本到语音模型部署

Kokoro-FastAPI开源项目 – 基于Docker的文本到语音模型部署

Kokoro-FastAPI 是一个基于 Docker 的 FastAPI 封装项目，专门用于部署 Kokoro-82M 文本到语音模型。它支持 CPU ONNX 和 NVIDIA GPU PyTorch 加速，提供自动分割和拼接功能，并支持多种语言和音频格式。该项目通过 Docker 实现便捷部署，适用于需要高效、多语言支持的语音合成场景。

Docker部署FastAPINVIDIA GPU加速ONNX推理

Transformers.js开源项目 – 桥接Web开发与AI大模型的强大工具

Transformers.js开源项目 – 桥接Web开发与AI大模型的强大工具

Transformers.js是一个桥接Web开发与本机AI大模型能力的库，为Web AI开发者提供了强大的工具和功能。

WebGPU加速AI计算Web开发与AI模型桥接工具预转换模型快速开发

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3