所有AI工具AI其他工具AI开源项目

PolyMind开源项目 – 多模态LLM驱动的Web界面

PolyMind是一个多模态、函数调用驱动的LLM Web界面,专为与Mixtral 8x7B + TabbyAPI集成而设计,提供了广泛的功能。它支持使用DuckDuckGo进行互联网搜索和网页抓取,使用comfyui生...

标签:

AI交流(进群备注:PolyMind)

PolyMind是一个多模态、函数调用驱动的LLM Web界面,专为与Mixtral 8x7B + TabbyAPI集成而设计,提供了广泛的功能。它支持使用DuckDuckGo进行互联网搜索和网页抓取,使用comfyui生成图像,通过sharegpt4v进行图像输入(通过llama.cpp的服务器),具备OCR和Yolo功能,支持使用nmap进行端口扫描,集成了Wolfram Alpha和Python解释器,并提供了用于PDF和杂文文本文件的语义搜索的RAG。90%的网页部分(HTML、JS、CSS和Flask)完全由Mixtral编写。

PolyMind的特点:

  • 1. 多模态功能调用
  • 2. 与Mixtral 8x7B + TabbyAPI集成
  • 3. 使用DuckDuckGo进行互联网搜索和网页抓取
  • 4. 使用comfyui生成图像
  • 5. 使用sharegpt4v进行图像输入
  • 6. OCR和Yolo功能
  • 7. 使用nmap进行端口扫描
  • 8. Wolfram Alpha集成
  • 9. Python解释器
  • 10. 用于PDF和杂文文本文件的语义搜索的RAG

PolyMind的功能:

  • 1. 作为多模态LLM的Web界面
  • 2. 进行互联网搜索和网页抓取
  • 3. 生成图像
  • 4. 处理图像输入
  • 5. 进行OCR和Yolo分析
  • 6. 进行端口扫描
  • 7. 使用Wolfram Alpha进行数学和科学计算
  • 8. 执行Python代码
  • 9. 进行PDF和文本文件的语义搜索

相关导航

暂无评论

暂无评论...