E2B桌面沙箱为大型语言模型(LLM)提供图形桌面环境的沙盒服务,旨在通过安全的计算机使用体验提供隔离的云端环境。
Jan 是一个开源的 GPT 替代工具,支持在本地计算机上 100% 离线运行主流开源大语言模型,如 Mistral、Llama、Mixtral 等。它提供了一个高颜值且操作便捷的图形用户界面,用户无需编写代码即可轻松安装、管理和使用这些模型。Jan 兼容 Windows、Mac 和 Linux 系统,并支持多种硬件架构,包括 Nvidia GPU、Apple M 系列、Apple 英特尔、Linux Debian 和 Windows x64。此外,Jan 还支持与外部人工智能服务(如 ChatGPT 或 Google)的连接,并允许用户根据特定需求定制人工智能模型,将其集成到日常工具和应用程序中。
一种优化视觉语言提示上下文的方法,通过知识引导提升交互效果。
API for Open LLMs 是一个为开源大语言模型提供统一后端接口的项目,支持多种开源大模型的调用,旨在简化与大语言模型的交互体验。通过提供类似于 OpenAI 的 API 使用方式,开发者能够更方便地集成和利用大语言模型的能力。
slowllama实现了在苹果M1/M2设备(如MacBook Air或Mac mini)上对Llama2和CodeLlama模型(包括7B/70B等规模)进行微调,且未采用量化优化。
Lemonfox.ai提供了一种简单的API,使用户能够访问开放源代码的AI模型。该项目的LLM聊天AI模型能够节省75%的使用成本,提供与ChatGPT相当的性能,同时还可以使用Stable Diffusion生成高质量的图像。其OpenAI兼容API使得用户轻松切换至该平台。
BitNet是微软发布的1-bit LLM变体研究,支持在CPU上快速无损地推理1.58位模型。该项目通过将每个参数表示为三进制数 {-1, 0, 1},显著改善了时延、内存利用、吞吐量和能耗,能够在苹果M2等CPU上运行,适用于1.58位模型的无损推理。
基于 OpenAI 的聊天开源框架,旨在实现用户可同时获得多个大模型的并行输出。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型