Google DeepMind开发的研究原型,探索人类与AI代理互动的未来,从浏览器开始。使用Gemini 2.0构建,结合了强大的多模态理解和推理能力,可以自动化完成浏览器中的任务。
能够理解和推理浏览器屏幕上的所有内容,包括像素和文本、代码、图像和表单等web元素
理解并导航复杂网站,代表用户执行任务
在WebVoyager基准测试中,单代理设置达到83.5%的最先进结果
仅向受信任测试者开放
自动浏览和交互复杂网站
处理网页上的重复性任务,节省用户时间