查看: 148|回复: 1

[聊技术] 用智灵Desearch看透 Google I/O 发布会

[复制链接]

6

主题

8

回帖

32

积分

新手上路

Rank: 1

积分
32
发表于 2025-5-28 12:26:12 | 显示全部楼层 |阅读模式
AI 能“看图说话”“理解上下文”“通过眼镜辅助你生活”了吗?Google I/O 2025 的回答是:现在可以。从更聪明的 Gemini 到全天候在线的 Project Astra,从能理解视频的搜索引擎到智能终端的 XR 生态,Google 把我们想象中的未来提前了几年落地。我们用智灵 Desearch 抽丝剥茧,带你快速看懂这一轮 Google 如何用 AI 重塑生活方式。
Google I/O 2025人工智能生态全景与技术创新深度解析
大纲一览:
Google I/O 2025战略定位与核心发布概览
Gemini人工智能模型技术突破
搜索引擎功能革命性升级
AI视频生成技术创新应用
Android系统深度AI集成
通用型AI助手开发进展
硬件生态AI化布局
AI服务商业化探索
技术伦理与行业影响
资本市场反馈与行业展望
总结
正文:
Google I/O 2025战略定位与核心发布概览
大会主题聚焦AI技术全生态融合
自2024年I/O大会上,谷歌CEO桑达尔·皮查伊宣布Google进入"Gemini时代"后,AI就成了大会重头戏。今年也不例外,首日的核心就是GeminiAI相关的新产品升级。北京时间5月21日,一年一度的谷歌开发者大会(Google I/O)在美国加州山景城的海岸线圆形剧场举办。在本次大会上,谷歌展示了其在AI领域的最新进展,从升级搜索引擎到生成式内容工具的推出,以及硬件的更新,标志着该公司正以前所未有的速度将AI技术融入其生态系统。
Gemini 2.5模型发布与性能跃升
谷歌在会上发布的最重要的AI产品是其Gemini2.5的升级版模型——Gemini2.5 Pro。Gemini2.5 Pro是Gemini系列最新的推理旗舰模型,对标OpenAI o3。相对于Gemini2.5,Gemini 2.5 Pro在其基础上进一步增强了复杂任务处理能力,尤其在代码生成、逻辑推理和多模态理解方面表现有了极大提升。据Deepmind CEO哈萨比斯介绍,Gemini 2.5 Pro具备深度思考能力,能够在回答前’思考’多个假设,进行复杂的逻辑推理和信息分析,并具备’思维链’功能,能够在回答时展示完整的思考步骤和多种选择方案。在评价模型能力的LMArena排行榜上,Gemini 2.5 Pro在所有类别(对话能力、代码生成、图文生成以及综合评分项目)中都排名第一。
AI Ultra订阅计划的市场定位分析
5月21日Google I/O 2025大会开幕。谷歌在大会上宣布了堪称 ‘AI全家桶’ 的全新订阅计划 ——「Google AI Ultra」。Google AI Ultra定价为每月249.99美元,整合了目前谷歌最好的模型、各种高级功能以及30T的云存储,以帮助影视、金融、医疗等人员通过AI提升工作效率节省时间。Google AI Ultra为用户提供访问谷歌最先进AI模型的权限,以及在Gemini、NotebookLM、Flow等应用中更高的使用限制。订阅者还将获得在Chrome浏览器中早期体验Gemini以及Project Mariner(AI代理,可同时处理近12个任务)的权限。该订阅计划目前仅在美国推出。
硬件+软件协同创新战略解读
谷歌最后环节还展示了一系列新的AI硬件,头显XR与眼镜,这些新型硬件都是以其’Android XR’平台为基础开发构建。谷歌工程主管Shahram Izadi介绍称,除手机外,未来几个月里谷歌将会把Gemini AI功能拓展至智能手表、汽车控制台、电视及眼镜上。当地时间5月20日,谷歌在’I/O 2025’全球开发者大会上发布了AI全家桶——Google AI Ultra。Google AI Ultra整合了目前谷歌最好的模型、各种高级功能以及30T的云存储。有如此强的功能,收费方面每月249.99美元(约合人民币1809元)。
Gemini人工智能模型技术突破
Gemini 2.5 Pro多模态推理机制升级
Gemini2.5 Pro是Gemini系列最新的推理旗舰模型,对标OpenAI o3。相对于Gemini2.5,Gemini 2.5 Pro在其基础上进一步增强了复杂任务处理能力,尤其在代码生成、逻辑推理和多模态理解方面表现有了极大提升。据Deepmind CEO哈萨比斯介绍,Gemini 2.5 Pro具备深度思考能力,能够在回答前’思考’多个假设,进行复杂的逻辑推理和信息分析,并具备’思维链’功能,能够在回答时展示完整的思考步骤和多种选择方案。在衡量AI编程能力的WebDev Arena上,Gemini 2.5Pro居于首位,比其上一个版本提升了142分,超过了包括Claude 3.7 Sonnet和GPT-4.1 Turbo等竞争对手。
Deep Think模式增强型算法架构
周二,在Google I/O 2025开发者大会上,该公司宣布推出Deep Think,这是其旗舰产品Gemini 2.5 Pro型号的"增强型"推理模式。Deep Think允许模型在回答问题之前考虑多个答案,从而提升其在某些基准测试中的表现。Google人工智能研发部门DeepMind负责人Demis Hassabis在新闻发布会上表示:“Deep Think将模型性能推向了极限。它运用了我们在思维和推理方面最新的前沿研究成果,包括并行技术。”
Flash版本性能优化与应用场景扩展
除了Deep Think之外,Google还对其预算导向的Gemini 2.5 Flash模型进行了更新,使其在涉及编码、多模态、推理和长上下文的任务上表现更佳。新的2.5 Flash模型也比其取代的版本更高效,目前已在Google的AI Studio和Vertex AI平台以及Gemini应用程序中提供预览。同样得到升级的还有注重效率的Gemini 2.5 Flash。新版2.5 Flash在推理、多模态、代码和长上下文等关键基准上都有了改进,同时在效率上更高,评估中使用的tokens减少了20%至30%。2.5 Flash现已在Gemini应用程序中向所有人开放,并将在6月初通过Google AI Studio面向开发者和Vertex AI向企业全面发布。
与OpenAI技术对标的关键指标对比
Gemini2.5 Pro是Gemini系列最新的推理旗舰模型,对标OpenAI o3。相对于Gemini2.5,Gemini 2.5 Pro在其基础上进一步增强了复杂任务处理能力,尤其在代码生成、逻辑推理和多模态理解方面表现有了极大提升。在衡量AI编程能力的排行榜WebDev Arena上,Gemini 2.5Pro居于首位,比其上一个版本提升了142分,超过了包括Claude 3.7 Sonnet和GPT-4.1 Turbo等竞争对手。Google表示,Deep Think助力Gemini 2.5 Pro在LiveCodeBench(一项颇具挑战性的编程评估)中脱颖而出。此外,Gemini 2.5 Pro Deep Think还在MMMU(一项针对感知和推理等技能的测试)中击败了OpenAI的o3。
搜索引擎功能革命性升级
AI模式对话式搜索交互范式
在"老本行"搜索方面,这次I/O大会宣布将Gemini 2.5正式引入Google搜索引擎,面向美国用户全面开放。引入AI模型的谷歌搜索将提供"AI mode""AI Search"功能。皮查伊称,“AI搜索是对传统搜索引擎的颠覆”。在AI Mode下,用户可以通过语音、文字、图片等多模态方式输入搜索问题,搜索引擎会自动分解查询意图,生成对应的答案,可以用在制定旅游行程、购物建议、编程指南等生活场景中。
深度搜索语义理解技术突破
此外,AI Mode将支持一系列全新的功能,比如:深度搜索(Deep Search)、实时互动搜索(Search Live)。深度搜索可以支持AI模型自动发起上百次搜索,跨领域整合信息并生成引用详尽的专家级报告,节省大量人工研究时间。
实时视觉数据融合处理方案
实时互动搜索功能则基于Gemini模型和Live API技术,支持实时视频交互。用户在AI Mode界面下轻触"Live"图标后,可以直接通过手机摄像头对着现实场景进行"现场直播"提问:AI能够实时’看懂’摄像头画面内容,结合视觉信息进行理解和分析。实时以语音形式给出回答,并提供相关资源链接。
搜索广告生态潜在影响评估
不过,尽管AI技术取得多项突破,仍有分析师对谷歌AI Ultra订阅计划的盈利能力存疑,尤其是在搜索广告收入可能受到影响的情况下。
AI视频生成技术创新应用
Veo 3原生音频合成技术解析
新的视频生成模型Veo3首次实现了视频与音频的原生同步生成。它不仅能生成高质量的视频画面,还能同步生成包括环境音效、角色对话和口型同步的音频内容。在今年的I/O开发者大会上,谷歌推出了新一代视频生成模型Veo3,这也是其首个可生成视频背景音效的模型。它不仅能合成画面,还能为鸟鸣或街头交通等场景配上相应的音效,甚至还可生成人物对话。谷歌表示,Veo3在物理模拟与口型同步方面也表现优异。
音视频同步生成算法突破
新的视频生成模型Veo3首次实现了视频与音频的原生同步生成。它不仅能生成高质量的视频画面,还能同步生成包括环境音效、角色对话和口型同步的音频内容。在图像生成方面,谷歌称,Imagen4能够渲染"精细细节",如织物、水滴和动物皮毛,以及处理照片级写实和抽象风格,创建各种纵横比和高达2K分辨率的图像。
Imagen 4跨场景渲染能力升级
还有新的图像生成模型Imagen 4,生成的图像更加丰富,色彩更加细腻,细节更加逼真。在生成式内容领域,谷歌推出了Veo 3视频生成模型和Imagen 4图像生成模型。Veo 3支持原生音频生成,能够为视频添加背景音乐、音效甚至对白,解决了以往AI视频生成中"有影无声"的问题,极大提升了AI视频的质量和真实感。
影视创作行业应用前景展望
在今天的I/O开发者大会上,谷歌发布了一款专为"AI电影创作"打造的新应用 —— Flow。这款工具整合了谷歌近年来在AI视频Veo、图像生成Imagen和语言模型Gemini等领域的成果,官方称其是"为创作者量身定制的叙事工具"。Flow主要面向内容创作者,可用来发想创意、生成片段与场景,其类似动态分镜或草图。这些更精细的控制能力,有望逐步提升AI视频创作的质量与吸引力。
Android系统深度AI集成
Material 3 Expressive设计语言革新
DoNews5月21日消息,在5月21日召开的 I/O 开发者大会上,谷歌公司正式发布了 Wear OS 6 更新,融合了 Material 3 Expressive 设计风格,增强了表盘定制功能,优化了媒体控制体验,并推出全新的开发者预览版。据9to5Google报道,Google宣布将向 Beta 测试用户推出色彩丰富的全新 Android 16 界面。QPR1 测试版采用了该公司上周正式发布的 Material 3 Expressive 设计语言,并新增了启动器、通知、锁屏的视觉效果,以及一个深受苹果启发的快速设置页面。
QPR1测试版系统交互优化
据9to5Google报道,Google宣布将向 Beta 测试用户推出色彩丰富的全新 Android 16 界面。QPR1 测试版采用了该公司上周正式发布的Material 3 Expressive 设计语言,并新增了启动器、通知、锁屏的视觉效果,以及一个深受苹果启发的快速设置页面。
XR眼镜AI助手功能技术实现
谷歌展示了Android XR原型眼镜。该眼镜集成了Gemini多模态助手,用户按住右侧镜腿的触控区域即可激活。体验中,Gemini能实时分析周围环境,例如识别书籍内容、推荐旧金山湾区的远足路线,解读画作历史并比较主题等等,且操作几乎完全无需物理操作。Google Maps功能尤为亮眼:向前看时显示简洁的箭头和街道名称,低头时无缝切换至实时地图视图。
跨设备智能协作新范式
谷歌正在美国推出AI Mode —— 一种实验性的搜索功能,支持用户通过AI接口提出复杂的多段式问题。AI Mode能处理涉及体育与金融的复杂数据查询,还提供服饰"试穿"功能。今夏晚些时候上线的Search Live将结合手机摄像头的实时画面支持基于视觉的搜索提问。Gmail是首款支持个性化语境处理的应用。
通用型AI助手开发进展
Project Astra环境感知技术突破
谷歌展示了Project Astra的最新进展,该工具旨在开发一个具备上下文理解、规划和执行能力的通用AI助手。其能够通过实时摄像头交互,理解用户所处环境,并提供相应的帮助。在现场演示环节中,一位用户一边维修自行车,一边通过Astra请求查找相关的维修手册。Astra不仅准确识别出维修手册,还能智能高亮关键信息,并在不需用户操作的情况下自动与屏幕交互,完成查阅任务。这一过程展现了Astra对现实场景的高阶理解力和设备操控能力。
实时摄像头交互决策机制
Project Astra内建的空间感知能力可帮助视障人士识别房间中的障碍物、物品位置,甚至"读懂"环境变化,实现更安全便捷的出行与生活。当用户面对一个需要复杂解读的搜索问题,AI Mode可启动"深度搜索"机制,不同信息之间进行推理,并在几分钟内生成一份专家级的引用报告,为你节省数小时的研究时间。此外,Google也将Project Astra的多模态能力接入搜索,进一步提升搜索的实时交互性。
Mariner代理工具多任务处理优化
Project Mariner则是谷歌的实验性AI代理工具,用于浏览和使用网站。谷歌表示,其更新了Project Mariner的工作方式,允许代理一次承担近十几项任务。例如,用户可以购买棒球比赛门票或在线购买杂货,而无需访问第三方网站。Project Mariner是谷歌的实验性AI代理,可代用户访问和操作网页。其现已更新,支持同时处理近十项任务,开始面向部分用户开放。例如,用户无需打开第三方网站,只需与AI聊天即可完成购票或在线购物等任务。
AI代理商业化落地路径分析
谷歌还正式发布了Android XR产品和技术线的最新一代产品:与Xreal共同推出的首款轻量级智能眼镜产品Project Aura。该产品集成三大创新:光学透视(OST)技术突破;安卓生态深度融合;高通骁龙XR芯片赋能。Project Aura搭载骁龙XR2 Gen 2芯片,算力提升4倍的同时功耗降低30%,支持6DoF空间定位与眼动追踪,可流畅运行《Pokémon GO》等AR游戏,续航达6小时以上。
硬件生态AI化布局
Android XR眼镜多模态交互设计
谷歌与Xreal、Samsung、Warby Parker和Gentle Monster等品牌合作,推出了Android XR智能眼镜。这些眼镜集成了AI助手功能,支持实时翻译、导航和信息提示,是该公司在可穿戴设备领域的新探索。在产品渲染图中,可以看到铰链和鼻梁架上的摄像头,以及镜腿上的麦克风和按钮,这暗示着与Xreal现有设备相比,硬件将迎来升级。基于Android 14 XR定制系统,支持Google Play超百万应用的AR适配,用户可直接通过语音指令调用Google Maps导航、YouTube视频悬浮播放等功能,首次实现AR眼镜与安卓手机的无缝协同。
Gentle Monster合作产品创新点
官方表示未来将和Warby Parker、Gentle Monster合作,推出搭载Gemini AI、外观时尚的AR智能眼镜。这款新智能眼镜预计将具备深度手机整合能力,如消息同步、照片自动上传及AI语音操作等,有望为用户带来更加便捷和智能的体验。硬件上,谷歌与Xreal、Samsung、Warby Parker和Gentle Monster等品牌合作,推出了Android XR智能眼镜。这些眼镜集成了AI助手功能,支持实时翻译、导航和信息提示,是该公司在可穿戴设备领域的新探索。
可穿戴设备AI芯片性能参数
Project Aura搭载骁龙XR2 Gen 2芯片,算力提升4倍的同时功耗降低30%,支持6DoF空间定位与眼动追踪,可流畅运行《Pokémon GO》等AR游戏,续航达6小时以上。
AR导航与实时翻译技术突破
基于Android 14 XR定制系统,支持Google Play超百万应用的AR适配,用户可直接通过语音指令调用Google Maps导航、YouTube视频悬浮播放等功能,首次实现AR眼镜与安卓手机的无缝协同。Beam实现毫米级头部追踪与60帧/秒的视频流传输,结合Google Meet使用时,还可提供AI实时语音翻译,并保留原说话人的音色、语调与表情。
AI服务商业化探索
AI Ultra订阅计划功能矩阵拆解
通过AI Ultra,用户能体验到最高版本的Gemini应用,该应用在深度研究领域设置了最高使用权限,支持使用Veo 2进行视频生成,还能让用户提前使用突破性的Veo 3模型。此外,在未来几周内,AI Ultra订阅用户将能够使用Deep Think 2.5 Pro这一全新增强推理模式。订阅Gemini Ultra的用户还将获得更高配额的NotebookLM与图像混合应用Whisk,以及在Chrome中使用Gemini聊天机器人、基于Project Mariner技术的多项"智能代理"工具、YouTube Premium和Google Drive、Photos、Gmail的30TB存储空间。
B端开发者工具链更新
Gemini Ultra(目前仅限美国)提供对谷歌AI应用与服务"最高级别的访问权限",月费为249.99美元。套餐内含Veo 3视频生成器、新推出的视频剪辑工具Flow,以及尚未上线的强大AI功能Gemini 2.5 Pro的Deep Think模式。订阅Gemini Ultra的用户还将获得更高配额的NotebookLM与图像混合应用Whisk,以及在Chrome中使用Gemini聊天机器人、基于Project Mariner技术的多项"智能代理"工具、YouTube Premium和Google Drive、Photos、Gmail的30TB存储空间。
广告营收与技术投入平衡策略
不过,尽管AI技术取得多项突破,仍有分析师对谷歌AI Ultra订阅计划的盈利能力存疑,尤其是在搜索广告收入可能受到影响的情况下。
249.99美元定价模型合理性评估
Google AI Ultra定价为每月249.99美元,整合了旗下最先进的大模型、多项高级功能以及30TB云存储,面向影视、金融、医疗等行业用户,较ChatGPT Pro定价高出50美元。Gemini Ultra(目前仅限美国)提供对谷歌AI应用与服务"最高级别的访问权限",月费为249.99美元。套餐内含Veo 3视频生成器、新推出的视频剪辑工具Flow,以及尚未上线的强大AI功能Gemini 2.5 Pro的Deep Think模式。
技术伦理与行业影响
生成式内容版权保护机制
考虑到由Veo 3、Imagen 4和Lyria 2生成的内容将继续带有SynthID水印,Google发布了全新的SynthID Detector。用户只需上传文件,即可识别其中是否包含SynthID水印,用于防伪和追踪AI内容来源。当前用户越来越难以辨别AI生成内容,为此谷歌推出了SynthID Detector。用户可上传媒体文件以检测其是否包含SynthID水印,这是谷歌用于识别AI作品的标记工具。不过,目前并非所有图像生成模型都支持这一水印。
搜索算法透明度改进措施
在Google I/O 2025开发者大会上,谷歌宣布为其功能最强大的Gemini AI模型进行升级,推出Gemini 2.5 Pro型号的"增强型"推理模式Deep Think。这项功能可在生成答案前权衡多个答案,提高模型在某些基准测试中的表现。谷歌表示将在更广泛推出前进行额外的安全评估。
AI代理工具伦理风险控制
Google还正式发布了Android XR产品和技术线的最新一代产品:与Xreal共同推出的首款轻量级智能眼镜产品Project Aura。该产品集成三大创新:光学透视(OST)技术突破;安卓生态深度融合;高通骁龙XR芯片赋能。Project Aura将搭载针对XR优化的高通芯片组,这将显著提升眼镜的计算能力和能效比。

Alphabet股价波动深层动因
大会当日,谷歌母公司Alphabet的股价下跌了约1.5%,收于每股约167.87美元,市值约为2.03万亿美元。自2025年初以来,Alphabet的股价已累计下跌约13%。
Wedbush技术创新阶段论验证
Wedbush分析师Daniel Ives指出,Gemini的进展有助于谷歌缩小与OpenAI的差距,标志着公司进入新的创新阶段。
生成式AI市场竞争格局演变
从Gemini 2.5 Pro/Flash模型,到AI Mode,再到Veo 3、Imagen 4,以及面向开发者与创作者的AI套件等,Google几乎把从模型到产品的路径都压缩到一场发布会里。当下最火的AI应用场景,都被Google"预埋"进了产品接口里,让人无法忽视它作为全球同时具备工程实力和生态整合能力的AI巨头硬实力。
2026技术路线图前瞻预测
谷歌希望将其人工智能产品用到硬件中,推出了配备摄像头和扬声器的安卓XR眼镜,可以显示文本和拍照,用户可以用Gemini虚拟助手识别和评论人物和地点。虽然该XR眼镜仍是原型,但已经展示了谷歌在这一领域的雄心壮志。
总结
本届Google I/O 2025开发者大会,谷歌以Gemini为核心,展示了其在AI领域的全方位布局。从基础模型升级到生成式内容工具推出,再到硬件更新,谷歌正以前所未有的速度将AI技术融入其生态系统。Gemini 2.5 Pro和Flash模型在性能和效率上的显著提升,以及AI Ultra订阅计划的推出,标志着谷歌在AI商业化的道路上迈出了重要一步。同时,Android XR智能眼镜等硬件产品的发布,也体现了谷歌软硬件协同创新的战略方向。尽管资本市场对谷歌的AI商业化进程有所担忧,但从技术发展角度看,谷歌正在构建一个更加完整的人工智能生态体系,这将对未来科技发展产生深远影响。
别让研究拖慢你的步伐,
智灵Desearch 助你十分钟完成深度研究,
轻松搞定海量信息!
点击体验,见证效率革新
回复

使用道具 举报

5

主题

20

回帖

50

积分

一年会员

Rank: 2

积分
50
发表于 2025-5-28 13:13:45 | 显示全部楼层
路过的帮顶
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

特惠

限量优惠活动

正在火热进行

站长

添加站长微信

领取新人礼包

下载

便携运营智库

立即下载APP

工具

运营导航

工具推荐

帮助

帮助中心

常见问题

分销

50%直推收益

30%间推分成

AI

智能对话

办公助手

顶部