LLaVA C++ Server开源项目 – 简单API服务器，用于LLaVA的C++实现

LLaVA C++ Server 是一个用于LLaVA模型的高效推理的API服务器，旨在提供简单易用的接口，兼容多种平台与环境，支持模型的动态加载与卸载，并优化内存管理和性能。
LLaVA C++ Server的特点:
1. 支持LLaVA模型的高效推理
2. 提供简单易用的API接口
3. 兼容多种平台和环境
4. 支持模型的动态加载和卸载
5. 优化的内存管理和性能

LLaVA C++ Server的功能:
1. 通过HTTP请求调用API进行推理
2. 自定义模型参数进行特定任务
3. 集成到现有的应用程序中
4. 使用命令行工具进行测试和调试

相关导航

Dictanote官网 – 集成语音识别的笔记应用

Dictanote是一款集成语音识别的笔记应用，用户可以轻松通过语音录入笔记。它实时准确地将语音转录为文本，支持50多种语言和80多种方言。用户可以使用语音命令添加段落、标点符号和笑脸表情。该应用还支持跨平台使用，适用于桌面（Windows/Linux/Mac的Google Chrome）、Android和iPhone（Safari 12及以上）。

PostgresML官网 – 简单强大的数据库机器学习平台

PostgresML是一个完整的MLops平台，以简单的PostgreSQL扩展形式存在。它允许用户在数据库内部快速、简单且强大地构建模型。

Invicta AI官网 – 使用Mixture of Agents协作的AI项目

Invicta AI通过Mixture of Agents (MoE)方法组织AI代理团队，创建具有独特知识、语言模型、触发器和工具的专业AI工人。该项目旨在通过计算而非人力来扩展工作，轻松自动化复杂工作流，无需编码。用户可以将提示转化为强大且可分享的自定义AI模型，增强人类能力和体验。

Boogie官网 – 快速构建和管理NLP应用

Boogie是一个平台，允许用户使用大型语言模型（如GPT-4）测试、部署和管理自然语言处理应用程序，帮助开发者高效构建强大的NLP应用。

ChatinAI: Web Chatbot by Assistants API官网 – 提升网站客服体验的AI聊天机器人

ChatinAI 是一个基于 OpenAI Assistants API 的网页聊天机器人，旨在利用您的网站数据创建个性化的 AI 聊天助手。通过即时与访客互动，提升转化率，并提供无与伦比的用户体验。

Evebyte Studio官网 – 轻松控制安卓手机的工具

Evebyte Studio是一款Windows软件，旨在通过图形界面轻松控制物理Android手机设备，无需编程。用户可以创建和管理单个或多个手机任务，操作简单直观。

Butterfish Shell官网 – 一个拥有AI超能力的Shell

Butterfish是一个集成了AI功能的Shell，能够在命令行中提供上下文帮助和建议，增强用户的命令行体验。用户只需在终端输入'butterfish shell'启动Butterfish shell包装器，然后可以正常使用shell，首字母大写的命令会触发AI的响应。

MLC-MiniCPM开源项目 – 在安卓上高效运行 MiniCPM

基于 MLC-LLM 开发，将 MiniCPM 和 MiniCPM-V 在 Android 手机端上运行，具备优化的内存管理和计算性能，提供用户友好的接口，支持多种语言模型。

Efficient LLM inference solution on Intel GPU-基于Intel GPU的高效LLM推理

提出一种高效的基于Intel GPU的LLM推理解决方案。通过简化LLM解码器层的结构，融合数据移动和逐元素操作，降低内存访问频率和系统延迟。同时，提出一种段KV缓存策略，将请求和响应token的键/值存储在不同的物理内存中，以有效管理设备内存，提高运行批处理大小和系统吞吐量。在Intel GPU上实现了该解决方案，并与标准的HuggingFace实现进行了比较，对于一些流行的LLM模型，在Intel GPU上实现的解决方案的令牌延迟降低了7倍，吞吐量提高了27倍。

qwen.cpp开源项目 – 用于MacBook的实时聊天C++实现

qwen.cpp是基于C++的Qwen-LM实现，旨在为用户提供高效、实时的聊天体验，支持跨平台使用，便于集成与自定义。

eigenGPT开源项目 – GPT2的最小化C++实现

eigenGPT是一个基于C++的高效实现，旨在提供简化的GPT2架构，易于理解和扩展，适合嵌入式系统和资源受限环境。

ChatGLM.cpp开源项目 – C++实现的ChatGLM-6B

ChatGLM.cpp是ChatGLM-6B的C++实现版，专为在macBook等设备上运行而设计。它通过C++实现优化了性能和资源使用，使其能够在资源受限的环境中高效运行，同时保持与ChatGLM-6B模型的兼容性。

VMEC++开源项目 – C++实现的恒星器和托卡马克平衡求解器

VMEC++是一个用C++从头实现的、对Python友好的变分矩平衡代码（VMEC）重新实现。它是一个用于恒星器和托卡马克的自由边界理想磁流体力学（MHD）平衡求解器。

MNBVC开源项目 – 超大规模中文语料数据集

MNBVC（Massive Never-ending BT Vast Chinese corpus）是一个超大规模中文语料集，旨在收集各种形式的纯文本中文数据，包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词等。该数据集不仅涵盖主流文化，还包括各类小众文化及火星文，目标数据量达到40TB，目前进度为19.96%（7984GB），支持社区参与和协作。

Smallchat开源项目 – 极简聊天服务器示例

编写聊天服务器的极简编程示例，用C语言编写，共有约200行代码，其初衷是为前端开发人员提供一个理解系统编程的经验，特别是关于IRC服务器的构建