UI-TARS Desktop开源项目 – 自然语言控制电脑的跨平台应用
UI-TARS Desktop 是一款基于 UI-TARS 视觉语言模型的图形用户界面(GUI)代理应用,允许用户通过自然语言控制计算机。它支持跨平台操作,提供屏幕截图与视觉识别、精准的鼠标与键盘控制等功能。所有数据处理均在本地完成,确保用户隐私安全。支持 Windows 和 macOS 操作系统,提供简单的安装过程和实时反馈。此外,UI-TARS Desktop 开源且社区活跃,用户可以通过 HuggingFace 或 vLLM 部署自己的模型。