热门文档
- 2025-04-21 11:02:12 2025年中国宠物行业白皮书
- 2024-11-17 13:23:03 Mckinsey:2024中国消费趋势调研
- 2024-07-31 22:30:59 城市飞行营地总体规划及主题体验区概念设计规划案
- 2025-06-17 17:31:50 2024中国医疗器械行业发展报告
- 2025-03-07 11:57:25 【剧星传媒】《哪吒2》资源推荐0205
- 2024-05-19 21:59:54 2024小红书餐饮行业方法论
- 2025-01-16 15:13:48 2025年全新品牌屋框架模型
- 2024-07-21 20:53:59 2024全球E-Bike市场洞察报告(电动自行车)
- 2025-04-01 11:29:02 2025小红书家生活场景需求洞察白皮书-小红书
- 2024-03-22 23:03:56 红爵啤酒品鉴会“红爵之夜 嗨啤TIME ”主题活动策划方案
- 2024-07-09 21:55:15 如何运营你的小红书?
- 2024-08-18 12:25:23 2024年科大讯飞1024招商方案

1、本文档共计 0 页,下载后文档不带水印,支持完整阅读内容或进行编辑。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
国信证券证券研究报告|2025年07月23日GUOSEN SECURITIES全球AI应用产品梳理模型能力持续迭代,智能体推动商业化进程行业研究·行业专题计算机·人工智能投资评级:优于大市(维持评级)证券分析师:熊莉021-61761067xionglil@guosen.com.cnS0980519030002请务瓷阅读正文之后的免责声明及其项下所有内容摘要国信证券GUOSEN SECURITIES慎型层:能力迅速提升,开源推动成本降低。近年来全球A持续发展,大模型在知识问答、数学、编程等能力上达到新高度,多种任务上表现超过人类水平,在各领域的可用性及准确度快速提升。Scaling Law目前正在从预训练扩展到后训练和推理阶段,随若大模型行业发展逐步成熟,厂商之间开始出现明显的价格竞争与市场份额抢占,大模型的推理成本有了显著下降。同时,得益于lma3.1以及DeepSeek R1等高性能开源模型的推出,开源与闭源之间模型差异快速缩小。>智能体:技术逐步完善,新产品密集发布。人工智能体是一种能够感知环境、进行决策和执行动作的智能实体。通过支持添加MCP,Agenti可以访问和利用各种外部工具和服务,丰富了Agent的功能范围。Google正式发布A2A协议,整合不同领过Agent的优势,完成跨系统复杂任务。随若应用效果提高,海内外智能体产品密集发布。>商业化:用量特续增长,国产横型表现亮限。中国与美国顶尖模型之间的差距正在迅缩小,国产模型依靠开源走出自身生态。当前全球模型流量持续上张,为应用发展提供基础。数据显示,各家云厂商推理芯片租赁价格均有不同程度上张,AP调用量亦星现快速增>G州应用:借助I赋能业务,置型流量入口。A应用有望重塑流量入口,各个厂商积极卡位。传统互联网巨头在A领域具备先发优势,可利用专有数据和用户参与度将功能集成到现有的应用当中,在A应用渗透领域具备先发优势。当前,编程成为人机协同的主要领域,办公类任务AI占比较低.>B端应用:开源提升投入意愿,推动企业上云。开发工具和生态的繁荣大幅降低行业应用门槛,加速产业智能化落地进程。A技术和解决方案已深入到传媒、医疗、机器人、制造等多个行业,通过创新产品和服务、优化生产流程来推动行业的智能化转型。随若智能化准进,A应用有塑进一步提升企业上云意愿>风险提示:A应用落地不及预期、市场需求不及预期、行业竞争加剧、宏观经济波动、新技术研发不及预等。请务冬阅读正文之后的免责声明及其项下所有内容目录国信证券GUOSEN SECURITIES01模型层:能力迅速提升,开源推动成本降低02智能体:技术逐步完善,新产品密集发布03商业化:用量持续增长,国产模型表现亮眼04C端应用:借助AI赋能业务,重塑流量入口05B端应用:开源提升投入意愿,推动企业上云06风险提示请务瓷阅读正文之后的免责声明及其项下所有内容A技术快速发展,推动模型能力持续提升国信证券GUOSEN SECURITIES近年来全球持续发晨,大模型在知识问答、数学、编程等能力上达到新高度,多种任务上表现粗过人类水平,在各领域的可用性及准确度快速升。从模型技术来看:1)当前模型主流架构逐步转向oE,通过将输入Toke分配给不同的专家模型,让模型在处理复杂任务时展现出更强的能力,同时也能有效降低训练、推理所需的资源,DeepSeek-V3、Qwen3、Llama4等模型均采用MoE架构取得了低成本的高性能表现;2)模型的多模态能力显著增强,通过跨模态对齐、异构数据融合等技术,模型能够处理图像、视频、音频等多种类型的数据,从而丰富了模型的应用场景,GPT-4o、Gemini2.5Pro等领先模型均采用多模态技术;3)模型开始采用思维链技术,将复杂问题逐步分解为多个简单步骤,并按照步骤推导最终答案,通过分步推理的方法,模型的回答不仅更加精确可靠,其思考过程也变得清晰可懂,2024年9月,0 penAl发布o1模型,首次将思维链技术运用在底层模型当中,大幅提高了模型在测试中的表现,后续DeepSeek-R1等模型均采用思维链技术,全球模型进入推理时代。除上述方面外,模型量化、超长上下文窗口、多种RG变体、偏好微调等技术的发展亦共同推动了模型可用性的进步,为AI在垂直领域的应用奠定了基础。图:A在多种能力测试中超越人类水平8济硬究所整理请务瓷阅读正文之后的免责声明及其项下所有内容模型训练竞赛趋缓,Scaling Lawl向推理侧迁移国信证券GUOSEN SECURITIES据斯坦福大学数据,受训练规横不高增加、1技术复杂性提升以及开发新模型方法面临更大挑战等因素响,各地区2024年发布的横型总数同比均有所下降。美国为2024年发布知名模型最多的地区,数量达40个,较2023年的61个同比下降34.43%。分机构看,2024年贡献知名模型最多的机构分别是0penA!(7个)、谷歌(7个)和阿里巴巴(4个)。受oE等新技术推动,2024年模型的参数数量保持快速上升趋势,规模扩大仍是模型性能提升的重要方式。8ca1igL目前正在从预训练扩晨到后训练和推理阶段,盖于强化学习、思维链等技术在后训练和推理阶段投入更多的算力,可以大幅提升大模型的思考能力。同时,随着强化学习时间和推理思考时间的增长,模型性能也将得到显著提升。据前加peAI应用研究负责人Lilian Weng数据,s1实验中,通过强制延长思维链推理路径长度,以Token衡量的平均思维时间与下游评估准确率之间展现出明显的正相关关系。据上海交通大学研究表明,通过延长1的推理时间,仅需500个样本训练,就能让模型在医疗诊断准确率上提升6%11%,达到专业医生的诊断水准。随着模型推理能力快速提升,当前A在各领域可用性、准确度不断提高,商业化前景被逐步打开。图:全球新发模型数量同比下降7214.90%Medical Reasoning)rXM-2025P6.请务瓷阅读正文之后的免责声明及其项下所有内容模型推理成本显著下滑,利好应用端成本下降国信证券GUOSEN SECURITIES随着大模型行业发晨墨步成燕,厂商之间开始出现明显的价格竟◆与市场份额抢占。据0peA1和谷歌官网数据,2024年双方主力模型API调用价格均出现大幅下降,其中GPT-4o输入API调用价格为2.5美元/百万Tokens(下降50%),输出API调用价格为10美元/百万Tokens(下降33%);谷歌Gemini1.5Pro输入API调用价格为2.5美元/百万Tokens(下降64%,超过128k),Gemini1.5Pro输出API调用价格为10美元/百万Tokens(下降52%,超过128k)。国内方面,千问、Kimi、腾讯等主力模型价格均有不同程度下降,据千问官网数据,Qwen-Max输入API调用价格在2025年下降至2.5元/百万Tokens(下降88%),输出API调用价格下降至9.6元/百万Tokens(下降84%)大模型API调用价格下降利好AI应用厂商成本下降,进而传导至终端AI应用消费者费用的下降。据斯坦福大学数据,在保持人性能不变的前提下,近年来大模型的推理成本有了显着下降。例如,在流行的LU基准测试中,达到GPT-3.5水平(得分64.8)的AI模型推理成本,从2022年11月的每百万Tokens20美元,大幅下降至2024年10月的仅0.07美元(对应Gemini-1.5-F1sh-8B),这意味着在大约1.5年的时间里,推理成本下降了超过280倍。在更具挑战性的基准GP0A上,对于性能评分超过50%的模型,其推理成本从2024年5月的每百万Tokens15美元,下降到了2024年12月的0.12美元(对应Phi-4)·据poch Al的估算,根据推理任务的不同,大模型的推理成本每年都在以9到900倍的速度下降。图:国内外主力模型PI调用价格下降图:全球大模型推理成本快速下降041014-M请务瓷阅读正文之后的免责声明及其项下所有内容开源与闭源摸型差距缩小,推动A应用落地国信证券GUOSEN SECURITIES大学数据,2023年闭源与开源大模型之间存在明显的性能差距,在Chatbot Arena排行榜中,2024年1月初领先的闭源模型比顶级开源模型高出8.0%,而2025年2月差距缩小至1.%,类似的趋势也出现在其他问答类基准测试中。2023年闭源模型几乎在所有主要基准测试上优于开源模型,但到2024年这种差距显著缩小,例如,2023年底闭源模型在WMLU基准上领先开源模型15.9个百分点,而到2024年底这一差异缩小至仅0.1个百分点。·开源模型允许开发者直接访问、修改和优化模型代码,降低了A技术的使用门槛,用户可根据自身需求进行定制化开发,使模型更容易适配金融、医疗等垂直行业需求,加速大模型应用的普及。同时,用户无需支付闭源模型调用费用,使用大模型的成本显著降低,刺激AI应用在付费意愿较低的用户中渗透。随着开源模型与闭源模型之间的差距逐步缩小,下游企业可直接在企业中接入相关模型,并获得与顶尖闭源模型等同的应用表现,极大推动AI在各个垂类领域的应用。例如,通过微调L lama模型,AT&T在客户服务搜索响应上取得了近33%的提升;中医药大学深圳医院部署DeepSeek赋能医院运营管理等。究所整理请务瓷阅读正文之后的免责声明及其项下所有内容目录国信证券GUOSEN SECURITIES01模型层:能力迅速提升,开源推动成本降低02智能体:技术逐步完善,新产品密集发布03商业化:用量持续增长,国产模型表现亮眼04C端应用:借助AI赋能业务,重塑流量入口05B端应用:开源提升投入意愿,推动企业上云06风险提示请务瓷阅读正文之后的免责声明及其项下所有内容AI应用快速迭代,人机协同从Copilot转向Agent国信证券GUOSEN SECURITIES·A!Agot(人工智能体)是一种能等感知环境、进行决策和执行动作的智能实体。不同于传统的人工智能,A!Aget具备通过独立思考、调用工具去逐步完成给定目标的能力。Al Agent和传统大模型的区别在于,大模型与人类之间的交互是基于prompt实现的,用户prompt是否清晰明确会影响大模型回答的效果,而Al Agent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。基于大模型的gt不仅可以让每个人都有增强能力的专需智能助理,还将改变人类与I协同的模式。随着大模型的发展,人类与模型透的入口。随着自然语言处理、机器学习和生成式AI的进步,Al Agent的多功能性和部署量将急剧增长。图:人类与AI交互方式转变图:AIt打开垂直行业应用入口A请务瓷阅读正文之后的免责声明及其项下所有内容模型Agent能力快速提升,测试分数不断刷新国信证券GUOSEN SECURITIESGAIA是由ta于2024年5月推出的一个面向通用A1助手的基准测试,包含466道问题,旨在评估A1系统执行广泛任务的能力,包括推理、多模态处理、网页浏览和工具使用等。与那些简单、类似考试风格的问题不同,GAI使用复杂、多步骤的问题来挑战AI模型,这些问题可能需要搜索开放网络、解读多模态输入,并在复杂情境中进行推理。GAI可以根据解决问题所需的步骤数量和所需的不同工具数量分为三个难度级别:1)L|1:问题通常不需要工具,或最多使用一个工具,不超过5步;·2)Lv12:问题通常涉及更多步骤,大约在5到10步之间,且需要结合不同的工具;·3)L。|3:问题是为接近完美的通用助手设计的,需要执行任意长度的操作序列,使用任意数量的工具,并访问一般世界。·当研究人员发布GAI时,他们发现现有的大语言模型(LLW)在表现上远远落后于人类。例如,使用插件的GPT-4仅能正确回答15%的问题,而人类受访者的正确率则高达92%。当前模型在GA1A上的表现迅速提升,在2024年,表现最佳的系统得分达到了65.1%,相比2023年记录到的最高分提高了大约30个百分点。2025年5月,昆仑万维的天工智能体登顶GAIA,刷新S0TA得分,平均得分来到78.0%。请务瓷阅读正文之后的免责声明及其项下所有内容MCP扩展AI能力边界,推动Agent加速落地国信证券GUOSEN SECURITIES通过支持漆加McP,Al Agont能力边界被进一步扩晨。MCP(Model Context Protocol)是由Anthropic提出的开放标准,旨在为AI模型与外部工具之间建立安全、双向的连接。在CP出现之前,A!要集成工具需要针对每个工具进行定制开发,缺乏统一标准,集成效率低。而WCP协议提供了可插拔、可扩展的框架,允许AI无缝对接数据源、文件系统、开发工具、Wb浏览器等外部系统。,通过集成MCP扩展,Aget可以访问和利用各种外部工具和服务,丰富了Aget的功能范围,使其能够执行更复杂的任务。同时,MCP提供了标准化的接口,AI可以根据具体需求快速接入新的工具或数据源,对于Aget的可用性以及生态构建均有显著推动作用。·海内外内大厂粉布局McP,相关生态迅速丰言。海外方面,微软宣布在Copilot Studio、GitHub Copilot等产品中支持CP,并将在Windows11中集成MCP;谷歌支持Gemini Al模型使用MCP协议;AWS上线MCP Servers.,每个服务器专注于特定领域,协同提供全面解决方案。国内方面,百度智能云率先宣布千帆大模型平台接入集成MCP,支持通过千帆AppBui lder SDK开发的组件无缝转化为MCP Server模式;阿里云百炼平台推出全生命周期WCP服务,覆盖高德地图、GitHub自动化等15类场景,支持一键开通并集成至智能体;腾讯云大模型知识引壁已接入MCP,用户可调用平台精选或自定义MCP插件搭建应用;火山引壁发布大模型生态广场MCP Servers,实现工具调用、模型推理到应用部署的全链路开发闭环。MCP有望成为AI时代的TTP协议,可大幅提效AI应用开发、加速生态扩展。MCP clients¥ClaudeMCP绿OpenAlMCP hostsMCP-E请务瓷阅读正文之后的免责声明及其项下所有内容谷歌发布A2A协议,打通AI落地复杂应用场景国信证券GUOSEN SECURITIES·A2A与CP互补,加速gnt生态完善。2025年4月,Google正式发布Agent2 Agent Protocol(简称A2A),为用于链接不同封闭Aget,并实现其相互操作的开放协议,该协议为不同类型的智能体之间搭建了高效沟通与协作的桥梁,无论是独立Agent与独立Agent、独立Agent.与企业Agent,亦或是企业Agent:与企业Agent,都能借助该协议实现通信交互和事务协作。A2A协议与MCP互补,A2A负责解决Agent间的通信问题,CP解决Agent与工具间的通信问题,有望提升gent在下游领域的应用效果,推动Agent生态系统的完善与发展。·2获得多个科技巨头支持,推动I应用向复杂工作流落地。随着Agent应用的逐步落地,单一Aget难以独立完成多领域任务(如同时处理数据分析、文档生成等),需依赖团队协作,而不同厂商的eet因技术栈差异无法直接协作,形成信息孤岛,从而阻碍Aget应用落地。A2协议可通过任务自动分配与结果同步,减少人工干预,同时整合不同领域Aget的优势,完成跨系统复杂任务。A2A协议构建在HTTP、Server--Sent Events(SSE、JSON-RPC等常用标准上,企业无需大规模改造自身IT技术栈,就能平滑接入多代理环境。在用户发起任务后,客户端智能体通过gent Card定位目标智能体,通过代理间相互发送消息,包括上下文信息、用户指令、执行结果等形成协同网络,依次或并行地处理不同环节。A2A协议当前已得到了50多家谷歌技术合作伙伴的支持和贡献,包括Atlassian、Salesforce,图:A2A与0P协议互为补充图:2A已获得50多家科技公司支持Partners contributing to the Agent2Agent protocolgent请务瓷阅读正文之后的免责声明及其项下所有内容海内外智能体快速发展,测评成绩不断刷新国信证券GUOSEN SECURITIES全球通用领媒got快速发晨,应用效果快速提高。海外方面,2025年1月,0 penAl.上线了其首个Al Agent0 perator,.能够与电脑交互,完成浏览网页、填写表格、预定餐厅等相关任务。2月,OpenAl发布Deep Research,由o3模型提供支持,能够帮助用户进行信息查询与分析,输出综合报告。5月,Anthropic:发布Claude4,可自主编程数小时并在推理过程中使用工具。同时发布编程gent Claude Code,通过GitHub Actions:支持后台任务,与VS Code和JetBrains进行了原生集成,可直接在文件中显示编辑内容,实现无缝结对编程。国内方面,3月,onica正式对外发布通用型AI Agenti产品Manus,提供多种处理现实世界任务的案例,包括旅行规划、股票分析等,测评成绩超越Deep Research。4月,MainFunc.发布Genspark.,采用整合多AI模型的混合代理(MoA)系统,包含80多个工具集和1O多个高级数据集,可协调多个AI工具高效执行各项任务。字节跳动发布扣子空间,除通用Aget外还提供华泰A股助手等专家Agent,支持飞书多维表格、高德地图等CP。5月,昆仑万维发布天工智能体,采用Deep Research:技术,能够生成文档、PPT、播客和音视频多模态内容,提供5个专家级Agents和1个通用Agent,接入数十个MCP,刷新GAIA测评新高,图:mt领城新品密集发布DoepSook-RI月之请务瓷阅读正文之后的免责声明及其项下所有内容目录国信证券GUOSEN SECURITIES01模型层:能力迅速提升,开源推动成本降低02智能体:技术逐步完善,新产品密集发布03商业化:用量持续增长,国产模型表现亮眼04C端应用:借助AI赋能业务,重塑流量入口05B端应用:开源提升投入意愿,推动企业上云06风险提示请务瓷阅读正文之后的免责声明及其项下所有内容中国走出自身发展路径,本土A形成生态闭环国信证券GUOSEN SECURITIES·中美作为全球1领城的领导者,目前已走出不同的发展路径:不同于美国算力至上的路径,中国发展更侧效率,以显着少于预期的硬件配量实现了先进的I能力,例如,DeepSeek--V3仅用557.6万美元的训练成本便取得与GPT-4o等顶尖闭源模型相当的成绩;仅需4张H20即可本地部署235B的Qen3旗舰版loE模型,部署成本仅为DeepSeek-R1的35%当前中国已构成了政府推动+本土产业+人才储备+数据红利共同构成I生态闭环,成为中国川持煤发晨的核心动能。政府方面,早在2017年我国便发布了《新一代人工智能发展规划》,并在后续发布了《人工智能人才培养行动计划(2024-2026年)》等文件,为1产业的基础理论研究、产业应用落地等方面提供了政策支撑。同时,我国亦高度重视对!公司的财政支持,据财政部数据,2025年中央预算将拨款3981.2亿元用于科学技术,同比+10%,将重点推进半导体、人工智能等领域发展。人才储备方面,当前中国已成为全球最大的AI人才聚集地。据MacroPolo数据,2022年顶级AI研究人员中有28%在中国工作,较2019年的11%大幅提升。据斯坦福大学数据,截至2023年,中国AI领域论文发表数量位居全球第一,占比达23.2%,相关论文引用量占全球所有AI论文引用的22.6%。专利方面,据R8D帽oId数据,全球A1授权专利数量自2010年以来已增长超30倍,中国在全球A1专利申请中占据主导地位,截至2024年总专利数达12945。图:中国1领域论文发表数量占全球232器中国3151.5735》P.US.CN4EP.US180EP.US12济究所整理请务瓷阅读正文之后的免责声明及其项下所有内容
请如实的对该文档进行评分-
-
-
-
-
0 分