PolyMind开源项目 – 多模态LLM驱动的Web界面

PolyMind是一个多模态、函数调用驱动的LLM Web界面，专为与Mixtral 8x7B + TabbyAPI集成而设计，提供了广泛的功能。它支持使用DuckDuckGo进行互联网搜索和网页抓取，使用comfyui生成图像，通过sharegpt4v进行图像输入（通过llama.cpp的服务器），具备OCR和Yolo功能，支持使用nmap进行端口扫描，集成了Wolfram Alpha和Python解释器，并提供了用于PDF和杂文文本文件的语义搜索的RAG。90%的网页部分（HTML、JS、CSS和Flask）完全由Mixtral编写。

PolyMind的特点:

1. 多模态功能调用
2. 与Mixtral 8x7B + TabbyAPI集成
3. 使用DuckDuckGo进行互联网搜索和网页抓取
4. 使用comfyui生成图像
5. 使用sharegpt4v进行图像输入
6. OCR和Yolo功能
7. 使用nmap进行端口扫描
8. Wolfram Alpha集成
9. Python解释器
10. 用于PDF和杂文文本文件的语义搜索的RAG

PolyMind的功能:

1. 作为多模态LLM的Web界面
2. 进行互联网搜索和网页抓取
3. 生成图像
4. 处理图像输入
5. 进行OCR和Yolo分析
6. 进行端口扫描
7. 使用Wolfram Alpha进行数学和科学计算
8. 执行Python代码
9. 进行PDF和文本文件的语义搜索

相关导航

AiGPT Free官网 – 解锁无限可能的AI工具

AiGPT Free是一款革命性的AI工具，旨在让每个人都能轻松访问和使用人工智能。该平台提供免费的文本、图像、报告生成等功能，消除使用限制，帮助用户提高创意和生产力。无论是个人用户还是专业人士，AiGPT Free都能满足各种需求，支持通过Telegram进行一键访问。

Quino官网 – 智能学习助手

Quino是一款提供自动摘要、要点笔记、语义搜索和问答工具的智能学习平台，旨在帮助用户高效学习和研究。用户可以上传文档、书籍或研究论文，利用AI功能生成摘要、要点，与文档互动，组织笔记，并评估知识水平。

Dezee官网 – 颠覆技术互动的创新AI工具

Dezee是一个全能的AI工具平台，整合多种AI功能，旨在简化和提升工作效率。用户可以通过该平台无缝生成图像、文本、语音、记录和摘要，成为创意项目的终极合作伙伴。

AllChat官网 – 一款整合多种AI模型的应用

AllChat是一款集成了领先的AI模型（如Gemini、Claude和OpenAI）的应用，超越了传统聊天功能，支持图像生成、文件上传、代码执行和网络工具集成。用户可以生成精美图像、分析数据、自动化任务等。

tt-scale-flux开源项目 – 突破图像生成限制，提升生成效果

tt-scale-flux通过创新的推理时扩展技术，突破了传统去噪步数的限制，显著提升了图像生成的效果。该项目支持多种模型，并采用先进的验证器进行精准评分，确保生成高质量的图像。

ComfyUI Visual Area Nodes开源项目 – 增强 ComfyUI 的区域控制

提供了一组自定义节点，用于在 ComfyUI 中增强基于区域的条件化控制，并提供了一个视觉面板以便用户预览这些区域在图像中的定位和缩放。该项目旨在提升用户在图像生成过程中的灵活性和可视化效果，确保用户能够更好地控制生成的内容。

Storykube官网 – 一站式AI互动平台

Storykube是一个全面的平台，用户可以通过流畅的聊天界面与人工智能互动，体验对话式AI、图像生成和文档分析等多种功能，提升工作效率。

I IMAGINE官网 – 专为商业提供的AI聊天机器人

I IMAGINE是针对特定领域的AI聊天机器人，旨在帮助企业主高效管理业务的各个方面。与ChatGPT相比，每个领域的聊天机器人拥有独特的知识库，并采用先进的提示工程技术。通过发挥想象力和AI的力量，用户可以轻松管理个人和工作生活的所有方面，生成文本、图像和编程代码，进行关于健康、职业建议等主题的专家聊天，利用语音转文本功能将会议内容转换为文本。

intelligenius.ai官网 – 分钟内生成无限可能的AI内容

IntelliGeniusAI是一个综合性的AI平台，提供多种服务来生成AI内容，包括文本、图像、代码和聊天生成器。用户只需登录，选择需要的生成器，必要时自定义设置，然后点击'立即生成'即可创建AI内容。

OmniChat官网 – AI驱动的Telegram聊天机器人

OmniChat是一个基于AI的Telegram聊天机器人，整合了多种先进的AI模型，以增强用户交互体验。用户可以通过添加@OmniChatBot，并点击'开始'来开始聊天，支持多种智能响应和图像生成。

PaliGemma 2官网 – Google发布的增强视觉模型

PaliGemma 2是Google发布的新一代视觉模型，主要在OCR、图像分割和问题回答等方面进行了显著增强。该模型能够更准确地识别图像中的文字，更精细地分割图像中的对象，并更智能地回答与图像内容相关的问题。

ComfyUI开源项目 – 强大的扩散模型图形界面

ComfyUI 是一款功能强大的扩散模型图形用户界面 (GUI) 和后端，提供了一种直观的界面，用于设计和执行复杂的工作流。它被广泛认可为稳定扩散建模的领先 GUI，支持图像、视频和音频转换。ComfyUI 通过节点/图/流程图的方式，允许用户无需编写代码即可创建复杂的稳定扩散工作流。它支持多种模型和优化，适用于 Windows、Linux 和 macOS 平台。

ezML官网 – 快速集成计算机视觉功能

ezML是一个基于云的平台，旨在帮助开发者快速集成计算机视觉功能，无需训练数据和机器学习代码，只需三步即可完成。通过构建管道、配置层和轻松集成到应用程序中，用户可以在短短30秒内实现自定义的计算机视觉功能。

Bootstrap RAG开源项目 – 一键搭建语义搜索和RAG应用框架

Bootstrap RAG是一个便捷的项目框架，旨在帮助开发者快速搭建语义搜索和RAG（Retrieval-Augmented Generation）应用。它提供了常规模板代码，减少了开发时间，并且易于扩展与定制，适合各种项目需求。

360 智脑官网 – 多模态生成AI大模型

360 智脑是由奇虎 360 公司独立开发的 AI 大模型，拥有数百亿参数规模和多模态生成能力。它支持文本生成、图像生成、文本到视频转换等功能，涵盖生成创作、多轮对话、逻辑推理等十大核心能力，旨在为用户提供强大的 AI 辅助工具。其训练基于 3.4 万亿 token 的语料库，支持多达 360K 的上下文长度，适用于复杂的 AI 交互场景。

暂无评论

暂无评论...