点击蓝字 关注我们
SUBSCRIBE to US
Image: Cath Virginia / The Verge
谷歌正在为其以搜索为核心的人工智能模式(AI Mode)聊天机器人添加多模态功能,使其能够“识别”图像并回答有关图像的问题,同时谷歌将人工智能模式(AI Mode)的使用权限扩展到“数百万更多”用户。
此次更新将定制版的Gemini AI与该公司的Lens图像识别技术相结合,使人工智能模式搜索(AI Mode Search)用户能够拍摄或上传一张图片,并收到有关图片内容的“包含链接的丰富、全面的回复”。人工智能模式(AI Mode)的多模态更新从现在起可用,可通过安卓(Android)和苹果(iOS)系统上的谷歌应用(Google app)使用。
“人工智能模式(AI Mode)建立在我们多年视觉搜索工作的基础之上,并更进一步,”谷歌搜索产品副总裁Robby Stein表示。“借助Gemini的多模态能力,人工智能模式(AI Mode)能够理解图像中的整个场景,包括物体之间相互关联的上下文以及它们独特的材质、颜色、形状和布局。”
谷歌表示,此次更新使用了一种“fan-out technique”,针对它所识别的图像及其内的任何物体发出多个查询,以提供“非常细致入微且与上下文相关”的回复。这使得它能够做到诸如识别图像中展示的书籍、为评分较高的类似书籍提供建议,以及回答问题以进一步筛选推荐内容等事情。
搜索人工智能模式(AI Mode)是谷歌对Perplexity和ChatGPT搜索的回应,这是一种类似聊天机器人的体验,它利用从谷歌搜索索引中的所有内容提取的人工智能生成的摘要来回应查询。
人工智能模式(AI Mode)上个月专门面向Google One AI Premium订阅用户推出,不过仅在实验室(Labs)范围内。现在,谷歌表示,它已经开始让美国“数百万更多”的实验室(Labs)用户(不仅仅是付费的人工智能高级订阅用户)使用人工智能模式(AI Mode)。
微信号|IEEE电气电子工程师学会
新浪微博|IEEE中国
Bilibili | IEEE中国
· IEEE电气电子工程师学会 ·
往
期
推
荐
AI如何解读人类幸福?
无人机助推产业迈向新高度
数字干扰让人抓狂?这些方法或许能解决
世界最小心脏起搏器 —— 比米粒还小,注射植入后能自行溶解