PolyMind开源项目 – 多模态LLM驱动的Web界面
PolyMind是一个多模态、函数调用驱动的LLM Web界面,专为与Mixtral 8x7B + TabbyAPI集成而设计,提供了广泛的功能。它支持使用DuckDuckGo进行互联网搜索和网页抓取,使用comfyui生成图像,通过sharegpt4v进行图像输入(通过llama.cpp的服务器),具备OCR和Yolo功能,支持使用nmap进行端口扫描,集成了Wolfram Alpha和Python解释器,并提供了用于PDF和杂文文本文件的语义搜索的RAG。90%的网页部分(HTML、JS、CSS和Flask)完全由Mixtral编写。