GUI-Thinker官网 – 动态桌面GUI自动化框架

GUI-Thinker是由新加坡国立大学Show Lab团队开发的桌面图形用户界面自动化研究框架，通过自反机制（Planner-Critic/Step-Check/Actor-Critic模块）处理复杂多变的GUI交互。在WorldGUI基准测试中成功率比Claude-3.5高14.9%，支持Windows环境部署，无需Docker或虚拟机。核心技术结合了大型语言模型（GPT-4o/Gemini-2.0等）和强化学习，能解析教学视频和非视频输入，适用于PowerPoint/VSCode/Adobe等软件的自动化操作。

GUI-Thinker的特点:

1. 自反闭环机制：包含规划器/执行者双批评模块实现操作自检
2. 多模型支持：兼容GPT-4o/Gemini-2.0/Claude-3.5等主流LLM
3. 动态环境适应：可处理不同初始状态的GUI任务
4. 精准操作验证：Step-Check预验证+Actor-Critic后评估
5. 轻量级部署：Windows环境下通过bat脚本快速启动
6. 多模态输入：支持教学视频和非视频两种任务定义方式

GUI-Thinker的功能:

1. 自动化办公软件操作（PPT排版/PDF处理等）
2. 开发环境自动化（VSCode项目配置/代码生成）
3. GUI交互流程的学术研究
4. 软件测试自动化（多状态界面验证）
5. 教学视频转自动化脚本
6. 跨软件工作流编排（如数据从Excel到PPT的自动转换）

相关导航

BotGauge官网 – 基于AI的低代码自动化平台

BotGauge是一个利用人工智能驱动的低代码平台，旨在帮助用户轻松创建自动化流程。用户可以通过简单的英语步骤来自动化各种场景，从而加速测试过程和快速适应变化。

Microsoft Copilot官网 – macOS 用户的 AI 生产力伴侣

Microsoft Copilot 是一款专为 macOS 用户设计的 AI 伴侣，整合了 AI 图像生成、文本创作和快速启动功能，提供一站式智能生产力工具。它解决了多任务处理中频繁切换软件和创意内容生成效率低下的问题，特别适合需要深度思考的内容创作者。其“Think Deeper”模式由 OpenAI 的 o1 模型驱动，提供深入的响应，支持从个人到专业任务的广泛使用。

QR-ART官网 – 提升二维码的视觉吸引力

QR-ART是一个基于AI的二维码设计工具，旨在通过将二维码转变为引人注目的设计来提升其视觉吸引力。用户可以选择多种样式，轻松创建独特的二维码，增强品牌形象和用户体验。

AI Business Coach官网 – 引导你走向成功的智能教练

AI Business Coach通过先进的算法，帮助用户识别商业关键点，提供丰富的信息资源，促使用户采取可行步骤，实现商业目标。

Cherry Studio官网 – 多功能AI客户端

Cherry Studio 是一款支持多种大型语言模型（LLM）的AI客户端，提供直观的视觉界面和远程API接口，旨在降低对本地硬件的依赖，并提高工作和学习效率。它跨平台支持Windows、Mac和Linux，并集成了300多个预配置AI助手和多种文档处理功能，适合需要灵活AI解决方案的用户。

Teammates.ai官网 – 智能自动化客户支持与销售助手

Teammates.ai 是一个基于先进多智能体架构的AI团队助手，能够自动化处理客户支持和销售任务，支持超过50种语言，并与30多个原生集成无缝连接，提升运营效率。

Astronuts官网 – 软件工程的智能助手

Astronuts是一款软件工程协助工具，提供工程度量和洞察，帮助团队更快交付代码。只需将其集成到现有技术栈中，即可即时获得有关拉取请求和问题跟踪的工程指标和洞察，节省时间并提高效率。

KnowledgeBase Everywhere – Chrome Extension-无缝集成知识库的Chrome扩展

KnowledgeBase Everywhere是一个Chrome扩展，与Zendesk、HelpCenter.io或HelpScout知识库系统无缝集成。用户可以从任何网页访问丰富的信息，并轻松引用帮助文章。

Tools A Day官网 – 多种AI工具的集合

Tools A Day 提供多种AI、SEO及网页工具，包括图像转换器、编辑器、AI写作工具、PDF转换器、文本编辑器、哈希生成器、网页开发提取器、验证器及其他转换工具，旨在为用户提供便捷的在线解决方案。

scWGBS-GPT开源项目 – 首个单细胞甲基化数据分析AI模型

scWGBS-GPT是首个用于单细胞甲基化数据分析的AI模型，能够精准捕捉全基因组范围内CpG位点的长程依赖关系，大幅提升表观遗传分析的准确性和效率。该模型能够处理长达200万CpG位点的全基因组规模数据，比传统方法长100倍，单个CpG位点的甲基化模式识别精度高达93.4%，并且采用Mamba加速，推理速度比标准Transformer快200倍。

Walles.ai – Your AI Browser Sidekick-浏览器个人AI助手

Walles.ai 是一个浏览器个人AI助手，可以快速从任何网站或PDF中提供即时洞察和答案，帮助用户更高效地工作和学习。

Canopy开源项目 – 基于RAG的知识图谱查询引擎

Canopy是一套完整的基于检索增强生成(RAG)架构的知识图谱建立和查询引擎，利用Pinecone向量数据库技术，能快速构建自定义的RAG模型，随时查询文档库给出相关回答。它实现了完整的RAG工作流程，包括文档的切分、embedding、会话记录管理、查询优化、上下文检索以及增强生成，帮助开发者快速构建自己领域的问答系统，并支持迁移现有基于OpenAI API的应用。

Dont Lose Your Cool官网 – 帮助用户以礼貌的方式表达不满

Dont Lose Your Cool 是一个基于AI的平台，帮助用户将愤怒的言辞转化为更具建设性和尊重的消息，促进更好的沟通。

Chroma开源项目 – 开源嵌入式数据库

Chroma 是一款面向人工智能的开源嵌入式数据库，旨在帮助开发者轻松构建 Python 或 JavaScript 的大型语言模型（LLM）应用程序。它通过使用 Sentence Transformers 的深度神经网络模型自动生成文本嵌入，适用于信息检索、相似文档搜索和 LLM 增强等应用场景。Chroma 提供了直观的 API、完善的功能集以及与其他工具的集成，显著简化并加速了 LLM 应用程序的开发。