Project Mariner是什么
Project Mariner 是谷歌 DeepMind 推出的浏览器助手。Project Mariner基于 Gemini 2.0 技术,用 Chrome 扩展程序实现浏览器自动化,理解和执行网页任务。Project Mariner能理解和推理浏览器屏幕上的信息,包括像素和网页元素,基于 Chrome 扩展程序使用这些信息完成任务。Project Mariner 能控制 Chrome 浏览器、移动屏幕上的光标、点击按钮和填写表格,像人类一样使用和浏览网站。Project Mariner在 WebVoyager 基准测试中达到 83.5% 的高分成绩。目前,Project Mariner 只能在浏览器的活动选项卡中执行键入、滚动和点击操作,在执行某些敏感操作(如购买物品)之前,会要求用户进行最终确认。

Project Mariner的主要功能
多模态理解:理解浏览器屏幕上的所有内容,包括像素、文本、代码、图像和表单等数据。浏览器交互:实时导航和操作复杂的网站,自动执行浏览器中的任务,保持用户的控制权。自动化任务:自动与浏览器进行交互操作,将数据整理、填充到网页其他区域,同时将数据按照用户的要求整理好。复杂指令处理:理解、执行复杂的用户指令,分解为可执行的步骤。关系理解:理解不同网页元素之间的关系及其功能。视觉反馈:在执行任务时提供视觉反馈和更新,让用户了解进度。安全性:在执行敏感操作(如购物和付款)之前,会要求用户进行最终确认,确保安全性。如何使用Project Mariner
Project Mariner目前处于早期测试阶段,仅对少数测试者开放,访问Project Mariner的官方网站,加入等候名单。