热门文档
- 2025-04-21 11:02:12 2025年中国宠物行业白皮书
- 2024-11-17 13:23:03 Mckinsey:2024中国消费趋势调研
- 2025-03-07 11:57:25 【剧星传媒】《哪吒2》资源推荐0205
- 2024-07-31 22:30:59 城市飞行营地总体规划及主题体验区概念设计规划案
- 2024-05-19 21:59:54 2024小红书餐饮行业方法论
- 2024-03-22 23:03:56 红爵啤酒品鉴会“红爵之夜 嗨啤TIME ”主题活动策划方案
- 2024-07-21 20:53:59 2024全球E-Bike市场洞察报告(电动自行车)
- 2024-07-09 21:55:15 如何运营你的小红书?
- 2024-08-18 12:25:23 2024年科大讯飞1024招商方案
- 2024-11-04 20:41:56 淘天集团:2024年家装家居行业营销解决方案
- 2024-08-25 22:28:04 喜马拉雅:喜马拉雅2024营销白皮书
- 2024-09-08 21:00:26 【Short TV】ShortTV出海短剧内容生态

1、本文档共计 41 页,下载后文档不带水印,支持完整阅读内容或进行编辑。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
SOUTHWEST SECURITIESAI专题·Agent智能体基建厚积薄发,商业化应用曙光乍现西南证券研究院海外研究团队2025年4月核心观点A发展阶段从推理者走向智能体,模型底座智能水平提升。目前,AI发展水平正从推理者向智能体Agent演进,AI产品逐步能够理解目标、具备外部记忆和推理能力,相关智能体产业链正经历从模型能力提升到应用商业化的系统性跃迁。A大模型能力由预训练、后训练、测试时三条扩展曲线推进,其中,预训川练奠定模型内部智能上限,后训练及测试时扩展分别释放模型在特定领域和推理方面的潜力,当前基础模型迭代放缓,逐步从训练扩展向测试时扩展转变,主次曲线迎来切换,从而对大规模集群依赖程度下降、推理算力需求攀升,更加聚焦AI产品的商业化能力和生态建设。中间工具厚积薄发,开发者生态积极构建。在中间层,智能体生态所需的通信协议与开发工具快速涌现,Anthropic MCP协议、谷歌A2A协议等代表性技术正助力构建智能体新型操作系统,为模型与工具、智能体与智能体之间建立统一的交互接口。其中,2025年3月MCP Server2发现平台Smithery的服务器创建数量较2月实现3倍增长,A2A已得到50多家合作伙伴的支持,开发者生态加速繁荣。开发工具与底层框架的标准化,可类比为互联网时代移动手机的USB-C接口,或者类比为用于App和操作系统之间通信的Android API,将加速AI智能体商业化进程。初代产品创收加速,商业化应用曙光乍现。在应用层,智能体应用分为跨行业通用产品和垂类专业产品,前者发展相对成熟,部分产品已开始规模化应用,后者商业化起步略晚,但有望成为B端数智化转型的重要抓手。目前,智能体作为交互式A产品开始快速落地,初代产品Cursor、Glean等已实现上亿美金年经常性收入(ARR),展现出较高成的长潜力,并出现基于实际交付成果、任务完成率等指标的新收费模式。整体来看,AI智能体产品正形成“底层模型能力升级+中间工具繁荣+商业场景落地”的基础设施与应用同的演进路径,未来AI智能体应用还需进一步提升规划能力、具备更好的记忆、拥有更强的多模态理解能力,释放变现潜力。相关标的:1)推理算力:英伟达、博通;2)中间工具和数据层:谷歌、Snowflake;3)下游应用:Salesforce、SAP、Shopify;4)云服务:亚马逊、微软、谷歌。▣风险提示:AI技术进展不及预期:AI商业化进展不及预期:投资回报不及预期等飘险。目录A发展阶段:从推理者转向智能体,开始学会调用工具二、Agent模型层:底座智能水平提升,推理能力成为核心三、Agentr中间层:中间工具厚积薄发,开发者生态积极构建四、Agent应用层:初代产品创收加速,商业化应用曙光作现五、相关标的及风险提示1.1AI等级:AI发展水平划为五大等级,当前正从推理者转向智能体分为五大等级:一是聊天机器人(Chatbot),能够用自然语言进行对话;二是推理者,基于推理模型,解决人类级别的智力问题;三是智能体(Agent),能够代表用户采取行动;四是创新者;五是组织。过去,在ChatGPT等聊天机器人产品推出时,大模型通常采取一次性推理,用户与聊天机器人的交互形式呈现为简单的一问一答。而在推理模型的不断发展之下,A模型逐渐能够与自己对话,实现内部思考,具备推理能力。当前,随着大模型在交互认知泛化/自主等多维度能力持续提升,AI正从推理者转向智能体,逐步具备采取行动及处理任务的能力,智能体产品加速推进。A发展水平划分为五大等级AI等级天机器人推理者智能体创新者组织定义>具各语言对话能力的人工智能平问题的能力作的人工智能交互能力葡单式一问一答认知能力处理事实能式推理泛化能力局限于特定倾城任务自主能力设定月标自主完成复杂任务31.1AI等级:AI发展水平划为五大等级,当前正从推理者转向智能体产品目前处于中间过渡形态,智能体有望革新交互效率。过去,传统聊天机器人只能执行明确指令,用户需要逐次下达任务指令,AI模型根据一个指龄进行一个动作;当前,中间形态的A产品已初步具备目标理解和推理能力,可以根据用户的模糊需求主动采取一部分行动,但仍然需要依赖用户反馈进行下一步操作;未来,真正的AI智能体将能钧够根据最终目标自主规战划任务步骤、调用多种工具、识别错误并给出修正策略,具备完成任务的能力。用户与不同A产品形态的互动以及第一轮交互结果示例用户与传统聊天机器人的交互结果用户与推理者产品的变互结果用户与智能体产品的交互结果41.2 Agent等级:初阶能够使用工具,高阶可自主完成长时任务▣智能体(Agent)=大模型(LLM)+记忆(Memory)+主动规划(Planning)+工具使用(Tool use).大模型:在基于LLM的智能体中,山M充当智能体的大脑。主动规划:可以将大型任务分解为子任务,并规划执行任务的流程,同时能够对任务执行的过程进行思考和反思,从而决定是继续执行任务,或判断任务完结并终止运行。记忆:短期记忆指在执行任务的过程中的上下文,会在子任务的执行过程产生和暂存,在任务完结后被清空;长期记忆即可以长时间保留的信息,一般指外部知识库,可用向量数据库存储或检索。工具使用:为智能体配备工具API,如计算器/搜索工具/代码执行器/数据库查询工具等,从而与物理世界实现交互,解决实际问题。智能体公式:Agent=LLM+Memory+Planning+Tool useShort-term memoryLong-term memoryCalendar()MemoryCalculator()ReflectionCodeInterpreter()ToolsAgentPlanningSelf-criticsSearch()Chain of thoughts...moreActionSubgoal decomposition51.2 Agent等级:初阶能够使用工具,高阶可自主完成长时任务自主决策能力是基础,解决长时任务是关键。根据智能体“推理+记忆+使用工具+规贱划”的四大核心能力来看,截至目前,聊天机器人产品逐步具备推理能力,副驾驶和工具型助手可以建立外部记忆,但仍然不具备使用工具和自主规划的能力,只能根据用户指令按步骤执行,不属于能够自主Aget:AI模型可以通过编排组合,把重复性高、需要一定灵活性的任务从人替换成数字员工,实现任务的自动化,在郊阶段,Agt尚不具备完全开放的决策空间,自主决策范围主要局限于任务流程和有限选项之中,决策行为将受到安全条件、访问权限等限制,是有限决策的智能体。2)高级Agent:智能体不只是LLM calling的组合,而是能够更自主、更主动地规划,完成多步骤、长时任务,可以在多个选项之间做出自主选择,不需要人工指示,实现高度自治。根据自主化程度划分AI Agent等级自主性扩展聊天机器人受限制的智能体完全自主代理ChatbotsCopilots&AsssistantsAgents with guardrailsFully autonomous agents推理能力推理能力推理能力推理能力口外部记忆√外部记忆口使用工具口使用工具使用工具使用工具口自主规划口自主规划口自主规划√自主规划61.3AI产业链:AI Infra奏响主旋律,AIAgent拉开新画布口AI Infra:核心算力、半导体产链、硬件设备、电力能源为AI大模型的训练与推理奠定硬件基础。口AI Agent:B端软件、C端应用、端侧AI及具身智能等环节在Agent应用上蓄势待发。A产业链示意图Al Infra》》》》》》》》》》》》》》Al Agent端侧AI半导体产业链云计算AI+游戏核心算力硬件设备数据库AI+文旅电力&能源网安AI+音乐软件&服务AI+通讯资料来源:西南证券71.3 Agenti产业链:智能体基建厚积薄发,商业化应用曙光乍现口模型层:Agent本质是大模型能力的工程化载体,大模型智能水平仍是打造Agent的底层支撑,未来依旧需要通过预训练、后训练和测试时计算进行扩展。口应用层:Agt应用形态随着以上底层大模型和中间原生基础设施的发展逐步从构想更加贴近现实。AI Agenti产业链示意图中间层应用层·检索增强生成RAG等产、传播优化、互动增数据,提供高精度标注服务强的下一代蝶体形态,析,表现为ILM驱动下更强的BI能偏好优化算法等水线(AI Copilot)管成百上千个预训练摸型平台等增强人奏能力的算力算法数据资料来源:Z Research,西南正劳整理81.3 Agenti产业链:智能体基建厚积薄发,商业化应用曙光乍现基础设施加速发展推动新应用诞生,新应积极引导基础设施下一步健全方向。智能体生态正在经历波浪式发展进程,每一波创新应用的诞生,都会带动基础设施的迭代升级,底层技术的进步又会进一步催生出更智能的应用,如OpenAI的GPT系列(从GPT-1到GPT-4)和o系列(从o1到o3)模型、Anthropic的Claude型(Sonnet-3迭代至3.7)、谷歌Gemini模型(从1.5Pro迭代至2.5Pro)。智能体中间层则陆续出现LangChain、Tool Calling、MCP和A2A等工具;应用层相继出现Cursor、Claude Desktop、OpenAI Operato等。新应用对基础设施提出更复杂的需求,基础设施的进步又将反哺新的智能体应用,两者相互塑造、共同演进,加速A的商业化落地。Agent基础设施建设与应用协同演进2021年2月G1en2024◆11月Ce生产力2024年10月Bolt.new中2024年1月LangG mph2025年4月Go0A2A2024年11月-202543月2022年11月mhdaOpenAI GPT 5Llama 4Bebemoth2025年1月DeepSeck-R12025年2月Claode8onet3.7·2023年3月GPT-42025年3月Gemini25Po料来源:Madrona,西南正券整理9目录AI发展阶段:从推理者转向智能体,开始学会调用工具二、Agent模型层:底座智能水平提升,推理能力成为核心三、Agentr中间层:中间工具厚积薄发,开发者生态积极构建四、Agent应用层:初代产品加速创收,商业化应用曙光作现五、相关标的及风险提示102.1A摸型扩展法则:扩展法则迎来范式转变,主次扩展曲线逐步切换口扩展法则迎来范式转变,推理模型迭代节奏加速。从OpenAI旗下AI模型迭代进程来看:2018年6月至2023年3月一预训练扩展阶段:OpenAI,大模型预训练快速推进,在五年内从GPT-1迭代至GPT-4模型,模型基础能力2023年3月之后,预训练扩展进程逐渐放缓,截至目前仍未推出下一代预训练大模型GPT-5。2023年下半年至2024年5月一一后训练扩展阶段:基于微调技术开始打磨多模态、上下文等能力,提升特定指标性能。2024年9月至今一测试时扩展阶段:2024年9月0 penAI-o1模型预览版亮相,标志正式进入推理模型时代;2025年4月17日,OpenAI推出完整版o3模型和o4-mini模型,截至目前,半年内已迭代多次,测试时扩展正加速发展。OpenA旗下模型送代进程梳理2018062019D22020D52022112023032023.092023.112024052024092024122025012025D22025D4GPT-1GPT-2GPT-3GPT-35GPT-4GPT-4VGPT-4-GPT-4oOpenAIOpenAI-OpenAIGPT4.5:GPT-4.1:117亿:15亿:1750(Chat:万亿参TurboGPT):数:数据觉能力时处理多mini模最大LM理复杂任约750充力提升:版亮相用户开放型发布化能力升数NLP亿参数,型,提升下代界知识丰任务强大的理后处理和长、价格响应速度富,情商解能力更低、性和性能OpenAI03预览o4mini横型发布112.1A摸型扩展法则:扩展法则迎来范式转变,主次扩展曲线逐步切换规模法则从训练阶段延伸至推理阶段,推动计算需求特续提升。预训陈法则和后训练法则均与模型的训练阶段有关,而测试时扩展法则与推理阶段有关,深度推理有望对算力需求进一步增加。①预训练扩展法测(Pre-training Scaling Law):关注计算资源、模型大小和训练数据三大要素,当三要素同时增加时,模型性能将同步提升,打造优质基座模型。②后训练扩展法则(Post-training Scaling Law):关注在预练完成后对模型的进一步优化和微调,可以针对特定任务进行改进,从而提升模型在特定领域的性能,有助于打造垂类模型。③测试时扩展法则(Test-time Scaling Law):针对在模型的实际推理或应用中,根据问题的复杂程度实时分配计算资源,面对复杂问题能韵够进行分步骤多阶段推理,在多个解法中寻求最优解。A三大扩展法则对比测试时扩展法测名称后训练扩展法测Pre-training Scaling LawPost-training Scaling LawTest-time Scaling Law阶段训练(training)阶段的scaling law训练(training)阶段的scaling law推理(reasoning)阶段的scaling law指在训练过程中,通过增加训练数据、模型参数指在预训笃之后,利用强化学习、人工反馈等技指在模型的实际应用中,模型根据需要动态分配定义和计算资源来提升模型能力。模型在预训练阶段术对模型进行进一步优化,后训练通常涉及对模计算资源来提升推理效率,更加关注模型如何在需要通过大量数据进行训练、学习基础知识。型的精细化调整,提高在特定任务上的表现。卖时推理时优化自身的计算策路。①主要依赖大量的数据(多模态数据,如文本①在模型初步训销完成后,使用人类反馈成强化①重点是在实际使用中,通过调整计算资源的分图像、视频等)和计算资源。学习的方式帮助模型在特定任务上改进。配来提升决策过程的质量。③模型通过大规模数据集进行自我学习,获取广③强调通过模拟“自我提升”的方式逐步提升模②模型可以在推理时进行“深度思考”,将问题特点泛的知识。型能力(如通过解决复杂的数学问题等),拆解成多个步骤,逐步推理或产生多个解法,评③是训笃过程中的初步阶段,主要帮助模型建立③可以看作是“训练后的进步”或“微调”过基座能力程,帮助模型在特定领域变得更精通。③强调推理过程中的灵活性和高效性,目的是在卖时环境中产生高质量的结果,模型OpenAI GPT系列模型:GPT-l至GPT-4GPT-4 turbo0 penAI-o1至o3系列模型122.1A摸型扩展法则:扩展法则迎来范式转变,主次扩展曲线逐步切换口模型性能提升路径持续探索,主次增长曲线发生转变。2020年1月和2022年3月,OpenAI和谷歌先后发布论这《Scaling Laws for Neural Language Models》)和《Training Compute-OptimalLarge Language Models》,两者认为预训练阶段的扩展法则是提升大语言模型性能的有效路径。2024年8且谷歌发表论这《Scaling LLM Test-Time Compute Optimally can be More Effectivethan Scaling Model Parameters,》,提出在测试时对大语言模型的计算进行最优扩展,可能t比扩展模型参数来提升模型性能更有效。根据英伟达CS大会信息,除预训练和后训练扩展法则之外,测试时扩展法测同样推动慎力需求持续增长,以OpenAI-o系列模型为代表的推理模型通过测试时计算,带动推理算力高增,Scaling Law持续有效。随着模型性能提升曲线丛训练扩展转向推理扩展,投资方向也随之向推理侧转变。英伟达:扩展法则推动算力需求提升英伟达:扩展法则从一个扩展至三个Al Scaling Laws Drive Exponential Demand for ComputeNew OpenAl o1 Long "thinking time"creates a new way to scaleFROM ONE TO THREESCALING LAWSTEST-TIME SCALINGREASONING"POST-TRAINING SCALINGPRE-TRAINING SCALING132.2预训练扩展:三要素影响模型性能,高质量数据成为瓶颈算力决定Transformer模型性能上限,模型参数与训练数据比例影响模型最佳性能。根据OpenAI和G0oge相关研究,模型性能随着模型参数大小训练数据集大小计算量的增加而提高。对于基于Transformer架构的大语言模型,模型性能三要素的关系为C≈6N*D,其中,N代表模型参数规模,D代表预训练数据集大小;C代表预训练算力资源。大语言模型若要获得最佳性能,需同时扩展三大要素。当其中一个因素受限时,模型的智能表现可以随着另外两个因素的增加而变好,但边际效应会逐步递减。在给定预训练计算的情况下,可以确定最佳的参数量和数据集之比,从而确定模型的最佳能力。因此,在总计算量越多的情况下,模里型能力的上限会越高。然而当前模型参数量与数据量的扩展比例尚存争议,OpenAI在论文中指出模型参数规模比数据集大小更重要,两者比例在0.73:0.27时计算效率最优;谷歌论文则认为模型参数和数据大小同等重要,随着预训练计算资源的增加,模型参数量和训练数据量应该等比例增长。预训练扩展法则“算力+数据+模型”三要素4.26L=(D/5.4101)-0.0955.6L=(W/8.8-1013)-0.0763.954.83.64.043.33.23.02.42.710-710-510-310-110110910510710ComputeDataset SizeParametersPF-days,non-embeddingtokensnon-embedding14
请如实的对该文档进行评分-
-
-
-
-
0 分