Roo Code是一款AI增强的VS Code插件,通过集成多种AI模型和API(如OpenAI、Google Gemini等)提升编程效率。它支持自然语言交互、文件操作、终端命令执行和浏览器自动化,允许用户创建自定义编程助手角色(如架构师、测试工程师等),并提供代码修复、重构、上下文嵌入等高级功能。
Eko 是一个生产就绪的 JavaScript 框架,专注于使用自然语言和编程语言构建可靠的智能代理。它支持从简单命令到复杂多步工作流的生成,兼容浏览器和计算机环境,开发效率高。Eko 的设计目标是提高开发效率,特别适合需要灵活性和定制化的开发者。其主要特点包括混合设计语言、统一数字世界交互和透明可干预的代理。此外,它还支持视觉交互元素感知(VIEP)技术,显著减少 web 内容处理的 token 数量,以及分层规划和钩子系统以增强工作流管理。
Automa 是一个浏览器扩展程序,通过连接模块自动执行各种任务。它可以帮助用户自动登录网站、执行购物流程、抓取网站数据、定时提交表单等。用户还可以在 Automa 市场分享和下载工作流,甚至使用 Automa Chrome 扩展生成器生成独立的 Chrome 扩展。
Browserbase MCP Server 是一个开源项目,旨在为大型语言模型(LLM)提供与外部数据源和工具无缝集成的能力。它通过云端浏览器自动化,使LLM能够与网页互动,提取数据,并执行JavaScript,从而扩展了LLM的应用场景。项目基于Browserbase、Puppeteer和Stagehand技术,提供浏览器自动化、数据提取、控制台监控、屏幕截图、JavaScript执行和Web交互等功能。
NICAR 2025前沿网页抓取技术研讨会,涵盖视频抓取、图像模型应用、现代浏览器自动化以及GitHub Actions和Codespaces的使用。
OWL(Optimized Workforce Learning)是一个基于 CAMEL-AI 框架构建的多智能体协作工具,旨在通过多代理交互完成复杂的现实任务,并在 GAIA 基准测试中排名第一。它支持多模态处理、浏览器操作、文件解析、代码执行等功能,并包含丰富的工具包,满足各类特定任务需求。
MultiPost-Extension是一个基于浏览器自动化技术的开源插件,专为内容创作者设计,能够一键将内容发布到多个平台,极大地提高了内容分发的效率。该插件不仅支持多平台内容同步,还易于集成到现有系统中,并且允许用户根据需求自定义和扩展其功能。
Cursor Tools 是一个为 Cursor Composer Agent 和其他编码代理提供 AI 团队和高级技能的工具库。它通过集成 Perplexity AI 和 Gemini 2.0 提供网页搜索、代码库分析、浏览器自动化等功能,并支持 GitHub Issues 和 Pull Requests 的处理。该工具库旨在提升代码编写和问题解决的效率,增强团队协作能力,并自动生成文档以简化开发流程。
Project Atlas 2 是一个强大的工具,旨在通过自然语言处理技术,帮助用户在浏览器中自动化各种业务操作。用户可以利用这个项目来简化日常任务,提高工作效率,并且通过简单的语言指令与浏览器进行互动。
Wrk Automation是一个结合了AI、浏览器自动化、API连接器和人工任务的全能平台,旨在高效且经济地自动化业务流程。通过预构建的机器人和连接器,Wrk可以快速重现任何流程,只需用简单的英语描述流程,Wrk将在24小时内为您定制机器人和连接器,自动化成本低于1000美元。
Roo-Code是一个基于人工智能的VS Code插件,能够自动化编码工作,支持多模型和实验性功能,提供灵活的自定义模式以提升软件开发效率。它允许与编辑器进行自然语言交流,直接读取和写入文件、执行命令、自动化浏览器操作等,支持多种API和模型,提升了开发者的编程体验。
Open Operator是一个开源的Web自动化操作平台,旨在帮助用户轻松构建和定制自己的Web Agent,具备强大的自动化能力和自然语言处理功能。
Skyvern AI 是一个通过大语言模型(LLM)和计算机视觉技术,自动化基于浏览器的工作流程的项目。它提供了一个简单的 API 端点,便于集成到现有系统中,完全自动化手动工作流程,取代脆弱或不可靠的自动化解决方案。
awesome-mcp-servers 是一个精选的模型上下文协议(MCP)服务器资源集合,涵盖了浏览器自动化、云平台、命令行、社交平台、数据库、开发者工具、文件系统、搜索以及旅行交通等多个领域。该项目提供了丰富的AI模型与外部资源交互的实现,支持AI模型安全地访问和操作各类资源。
Crawlee-Python是一个用于Python的网络爬虫与浏览器自动化库,提供全面的网页抓取和数据提取解决方案,支持快速构建可靠的爬虫,具有人类行为模拟能力和现代反爬虫技术规避能力,适合各种数据抓取需求。
Automa是一款实用的Chrome插件,通过连接不同的任务区块,用户可以轻松自定义浏览器工作流,自动执行重复性工作,提升工作效率。
GPT-V-on-Web是一个结合了GPT-4视觉能力与Vimium的项目,旨在实现网页的自动化操作。它能够通过自然语言处理与网页进行交互,识别网页内容并执行相应操作,极大地提高了用户在网络上的操作效率。用户可以自定义快捷键来快速完成各种任务,提升工作流的流畅性。
Hexomatic 是一款网络爬虫和工作流自动化工具,允许用户将互联网作为自己的数据源。它能够自动化执行100多个销售、营销或研究任务,帮助用户高效获取和处理数据。用户可以利用其网络爬虫功能从任何网站提取数据,使用一键式爬虫或创建自定义爬虫食谱。此外,Hexomatic 提供100多种现成的自动化功能,用户可以将自己的爬虫食谱与现成的自动化程序结合,创建强大的自动化工作流。