Cradle 是一个 AI 框架,旨在提升基础智能体的能力,使其能够通过统一的接口执行复杂的计算机任务。该框架使用屏幕截图作为输入,键盘和鼠标操作作为输出,能够控制日常软件、专业软件以及多款游戏。目前支持自动操作 Chrome、Outlook、剪映、美图、飞书等软件,以及《荒野大镖客2》、《星露谷物语》、《都市:天际线》、《当铺人生2》等游戏。
LaVague是一个大型动作模型框架,旨在通过将自然语言指令转化为无缝的浏览器交互,为用户节省时间并自动化个人任务。它重新定义了互联网浏览方式,通过自动化浏览器交互来提高效率。LaVague基于开源项目如transformers和llama-index构建,确保透明性并与用户利益保持一致。它支持本地模型,确保用户完全控制和隐私保护,并利用Few-shot学习和Chain of Thought等先进AI技术生成最相关的Selenium代码。