所有AI工具AI学习网站AI对话工具AI开源项目AI编程工具

Web LLM开源项目 – 浏览器内运行大型语言模型的工具

Web LLM 是一个可以在浏览器中直接运行大型语言模型的工具,支持通过 WebGPU 加速。它支持多种大型语言模型,包括 Llama 2 7B/13B、Mistral 7B 和 WizadMath,并能够在设备内存为 ...

标签:

AI交流(进群备注:Web LLM)

Web LLM 是一个可以在浏览器中直接运行大型语言模型的工具,支持通过 WebGPU 加速。它支持多种大型语言模型,包括 Llama 2 7B/13B、Mistral 7B 和 WizadMath,并能够在设备内存为 64GB 的情况下运行 Llama 2 70B 模型。利用 WebGPU 提供更快、更流畅的模型运行体验,仅需约 6GB 的显存即可运行 Llama 7B 和 Vicuna-7B。

Web LLM的特点:

  • 1. 支持多种大型语言模型,包括 Llama 2 7B/13B、Mistral 7B 和 WizadMath
  • 2. 能够在设备内存为 64GB 的情况下运行 Llama 2 70B 模型
  • 3. 利用 WebGPU 提供更快、更流畅的模型运行体验
  • 4. 仅需约 6GB 的显存即可运行 Llama 7B 和 Vicuna-7B
  • 5. WebGPU加速框架,推理速度较WebAssembly方案提速6倍
  • 6. 模型切片加载,动态加载必要参数块,内存占用降低70%
  • 7. 流式响应优化,首token延迟小于800ms,支持实时对话交互
  • 8. 隐私保护模式,所有计算在本地完成,数据不出浏览器

Web LLM的功能:

  • 1. 在 Chrome 浏览器中直接加载和运行大型语言模型
  • 2. 通过 WebGPU 加速选择的模型以提升性能
  • 3. 在支持的设备上测试和使用不同的语言模型
  • 4. 离线环境智能客服
  • 5. 教育领域隐私敏感应用
  • 6. 浏览器插件开发

相关导航

暂无评论

暂无评论...