GUI-Thinker官网 – 动态桌面GUI自动化框架
GUI-Thinker是由新加坡国立大学Show Lab团队开发的桌面图形用户界面自动化研究框架,通过自反机制(Planner-Critic/Step-Check/Actor-Critic模块)处理复杂多变的GUI交互。在WorldGUI基准测试中成功率比Claude-3.5高14.9%,支持Windows环境部署,无需Docker或虚拟机。核心技术结合了大型语言模型(GPT-4o/Gemini-2.0等)和强化学习,能解析教学视频和非视频输入,适用于PowerPoint/VSCode/Adobe等软件的自动化操作。