BitNet是微软发布的1-bit LLM变体研究,支持在CPU上快速无损地推理1.58位模型。该项目通过将每个参数表示为三进制数 {-1, 0, 1},显著改善了时延、内存利用、吞吐量和能耗,能够在苹果M2等CPU上运行,适用于1.58位模型的无损推理。
该项目允许用户在CPU上运行MPT-30B模型的推理,具有低训练和运行成本的特点。用户只需32G内存即可进行模型推理,适合各种文本生成和评估任务。
在本地使用Gradio用户界面在GPU或CPU上运行Llama 2,支持Linux/Windows/Mac系统。
Snapclear是一款支持Windows、macOS和Linux的AI驱动软件,能够离线自动去除图像背景或提升图像分辨率,为用户提供高质量照片。
一个能够直接在文件字节上进行训练和测试的模型,无需在推理时对文件进行解码。
Warp AI是一个前沿工具,旨在通过提供AI驱动的命令建议、错误解释和工作流自动化,简化和增强开发者在命令行终端中的用户体验。它为希望简化编码和调试流程的开发者提供了一种高效的解决方案,适用于新手和经验丰富的编码者。
ChatALL 是一款桌面应用程序,允许用户同时与多个AI机器人进行聊天,如 ChatGPT、Bing Chat、Bard、Alpaca、Vicuna等。它帮助用户发现这些机器人提供的最佳答案。
llama-api是一个类OpenAI的LLaMA推理API,旨在提供便捷的模型推理服务。它支持自动下载模型、并行处理和并发处理,以便用户可以高效地进行文本生成和其他相关任务。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型