LaVague是一个大型动作模型框架,旨在通过将自然语言指令转化为无缝的浏览器交互,为用户节省时间并自动化个人任务。它重新定义了互联网浏览方式,通过自动化浏览器交互来提高效率。LaVague基于开源项目如transformers和llama-index构建,确保透明性并与用户利益保持一致。它支持本地模型,确保用户完全控制和隐私保护,并利用Few-shot学习和Chain of Thought等先进AI技术生成最相关的Selenium代码。