首页研究报告行业研究投资金融金融行业:DeepSeek银行部署加速,AI金融应用迎来跃迁-中泰证券
汤白小白

文档

2547

关注

1

好评

0
PDF

金融行业:DeepSeek银行部署加速,AI金融应用迎来跃迁-中泰证券

阅读 756 下载 5 大小 1.41M 总页数 0 页 2025-04-21 分享
价格:¥ 9.90
下载文档
/ 0
全屏查看
金融行业:DeepSeek银行部署加速,AI金融应用迎来跃迁-中泰证券
还有 0 页未读 ,您可以 继续阅读 或 下载文档
1、本文档共计 0 页,下载后文档不带水印,支持完整阅读内容或进行编辑。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
中泰证券证券研究报告DeepSeek银行部署加速A金融应用迎来跃迁2025.03.13分析师:闻学臣分析师:苏仪执业证书编号:S0740519090007执业证书编号:S0740520060001分析师:王雪晴联系人:蒋丹执业证书编号:S0740524120003Email:jiangdan@zts.com.cn中泰证券核心观点■DeepSeek开源使金融机构能梦轻松获得前沿模型能力,且大幅降低部暑成本。其通过对训练方式、算法架构和推理方法的工程化优化大幅降低了部署成本。近期采用大规模RL训练方法的阿里QWQ-32B等模型也在编小规模的同时达到了DeepSeek R1671B的应用效果,有望进一步催生银行落地应用。■我们认为金融行业人工智能的应用价值大体可以分为三个层次:降本增效,价值创造与决策赋能。在实际银行落地应用中,可能包括:1)降本增效:智能客服、信贷审批、合同质检:2)价值创造:A编程、智能风控、智能管销等:3)决策赋能:深度分析和决策辅助。■从实际落地应用情况看,大行发力更平,中小银行正在快速追赶。如工商银行、建设银行、招商银行等大行布局更早,邮储银行、浦发银行、江苏银行等也有较为领先布局应用。A一体机的出现为机构提供了全渐的解决方案,凭借其开箱即用、软硬件一体化设计等优势,正在成为很多中小银行智能化转型的重要选择。■建议关注:宇信科技、京北方、天阳科技、长亮科技、百融云等。■风做提示:A技术落地不及预期、竞争加刷、信息更新不及时等。2中泰证券●DeepSeek开源、低成本、强推理助推银行业应用中泰证券性能:后训练阶段大规模应用强化学习,表现推理能力扩展■DeepSeek模型在Post-Trainl阶段大规模应用了强化学习方法。R1使用了冷启动+大规模强化学习方法,R1-Zero版本模型使用纯强化学习方法。随训练过程推进,模型展现出了推理能力的扩展(高准骑率和og-CoT能力涌现等)。8DeepSeek-R1-Zero的能力随步数提升DeepSeek-R1-Zerolong-CoT资秆来添:DeepSeek-R1:Incentivizing Reasoning Capability in LLMs via4中泰证券性能:DeepSeek推理架构优化,可适配银行高并行、高响应的业务场景■DeepSeek通过优化训练方法显著降低了算力消花,使其在大规模数据处理中的成本更具优势。它在MoE架构的基础上,通过多头潜注意力机制(Muti-Head Latent Attention,MLA)进行优化:在后训练阶段采用冷启动+大规模强化学习方式,不再使用传统SFT做大规模监督微调,甚至绕过了一些CUDA,采用PTX汇编来提升能力:在推理场景下通过大规模跨节,点专家并行(Expert Parallelism,EP)来优化通信开销,尽可能实现负载均衡。API ServerDecode ServiceExternal KVCache Storage (Optional)5中泰证券开源易获得:DeepSeek使私有化部署模型也能够追平前沿闭源模型水平■以DeepSeek R1为代表的优秀开源模型的能力离闭源模型越来越近。行业普遍认为如果开源软件达到闭源80%以上能力,就足以压编闭源的生存空间。DeepSeeki能力能够比肩OpenAl o1,开源使各行业机构能够轻松获取前沿模型能力,且可直接进行私有化部署或商业化开发。图表:DeepSeek DAU快速增长1551466中泰证券成本:DeepSeek低价策略下理论成本利润率依旧可达545%,部署成本极低■DeepSeek理论本利涧率极高,成本还有优化空间。通过优化,能够在白天负荷高的时侯,用所有节点部署推理服务。晚上负荷低的时侯,减少推理节点,以用来做研究和训练。以2025年2月27-28日数据为例,DeepSeek V3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800GPU)。假定GPU租赁成本为2美金/小时,总成本为$87,072/天。如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为$562,027,成本利润率545%。图表:DeepSeek R1成本与理论收入中泰证券性能:开源QWQ-32B性能比肩满血R1,再次降低部署成本■阿里近期开源的QQ-32B模型基于320亿参数规模,在数学推理、代码生成及通用任务中表现亮眼,综合性能对标DeepSeek-R1(6710亿参数,激活量370亿)。该模型大幅降低部署成本,支持在消货级显卡(如英伟达RTX4090)上本地运行,满足快速响应及数据安全需求。同时,QwQ-32B集成智能体(Aget)能力,可调用工具并基于环境反绩调整推理逻辑,为定制化AI方案提供基础。图表:QQ-32B模型表现中泰证券性能:蒸馏小型模型展现Test-time Scaling,可支持多项基础业务场景■通过将DeepSeek-R1的推理能力燕物到更小的模型中,较小的模型也能具各获大的撞理能力。DeepSeek开源了从15亿到700亿参数的R1蒸馏版本。这些模型基于Qwen和Lama等架构蒸馏,表明复杂的推理能力可以被封装在更小、更高效■2025年2月,科学家李飞飞团队带领以不到50美元的费用训练了一个能力比肩DeepSeek-R1的s1模型,也展现了蒸馏模型的更多应用潜力。Mathematical100CompetitionPhD-LevelProblem SolvingMathScience Questions(MATH500)(AIME24)(GPQA Diamond)95r-distill95●●60Bespoke-Stratos85409050ol-preview208540●204851220488192102440968100017000Average thinking time (tokens)Number of Examples模型展现出随推理时间增加准确度增加的Test time ScalingS1仅使用1000个微调际例就达到了类似r1的准确度9中泰证券数据:大规模L提升非结构化数据分析能力,释放私域数据价值■DeepSeek可以通过API接口或者数据中台来构,尖现与传航银行技术系航的数据交互,从而尖现各夹业务高效高质的无缝对接,有望释放海量私城教据价值。Post-Trair阶段大规模强化学习的训练方法使模型拥有了更强的自主推理能力,不再依赖传统提示工程。根据DeepSeek的官方使用指南,在使用模型时不建议添加系统提示(system prompt),而是所有指令都应当包含在用户提示(user prompt)中。这也显示出了模型通用推理能力在应用中的扩展。预训练数据微调数据强化学习数据海量通用的世界知QA对:通用、强推理数据:识和语料数据:CoT思维链示例:行业数据:Post-Train阶段10中泰证券多模态:Janus-Pro等开源多模态模型有望进一步提升应用能力■Janus-Pro结合了优化的训练策略,扩展了训练数据集和模型规模。通过这些改进,Janus-Pro在多模态理解和文本到图像的指令跟踪功能方面都取得了重大进步,同时还增强了文本到图像生成的稳定性。■作为在GenEval-等评测中超越DALL-E3和Stable Diffusion3-Medium的开源模型,Janus-Pro也展现出了更多应用潜力。Janus-Pro-7B★Janus-Pro-1864★Law-v1.5-78*VILA-UEmu3-Chat52●4624681012LLM Parameters (Billions)GenEvalDPG-Bench11中泰证券理解金融应用的“降本增效-价值创造-决策赋能”三个层次中泰证券金融行业人工智能的三层价值创造■我们认为金秋行业人工智能的应用价值大体可以分为三个层次:降本增效,价值创造与决策赋能。其中当下应用最广泛的是降本增效,即对简单人力的替代,具体场景可能包括智能客服、简单的办公文件问答与内容生成等。随着模型能力提升将展现真正的价值创造能力,即Al对高价值人力的赋能,具体场景可能包括办公Agent、管销、Coding等:随着A分析能力进一步提升,将能够为决策层直接赋能,提升决策效率和精确度。决策赋能基于模型通用生成能力,较少依非常依赖垂域知识和私域数据微依赖模型本身强大的推理和分析能力,直接服务于决策:具体场景可能包括智能客服。简单办公文件问答和内容生成等:营销.Coding等:简单人力哲代高价值人力赋能决策层人力赋能13中泰证券降本增效场景之一:大模型承担智能客服角色降本增效场景通常基于大模型的生成能力,进行人力普代或赋能,在银行业应用场景中落地录平。■商业银行主要通过人工客服和智能客服两种方式为客户提供咨询服务。人工客服工作强度高、处理和响应时问相对较长,而当下智能客服难以覆盖全部服务场景。如工商银行在远程银行业务中将知识搜索与大模型生成能力结合,实现基于实时通话向坐席人员主动推送答复话术或知识的能力。客服智能助手事前事中知识库助手话术推荐助手质检助手工单助手14中泰证券降本增效场景之二:大模型助力信贷审批■在传统银行信贷审批过程中,贷前调查、审批、放款以及贷后管理等诸多环节,均高度依赖人工操作,导致整个流程十分复杂且效率低下。DeepSeek为银行信贷审批注入新动力,助力审批流程实现智能化与自动化。■苏商银行应用DeepSeek-VL2多模态模型,通过构建“多模态技术+混合专家框架”的创新体系,实现对嵌套表格、影像资料等复杂场景材料的精准解析,将信贷材科综合识别准骑率提升至97%以上,信贷审核全流程效率提升了20%。用星智能办公算力法数据15
文档评分
    请如实的对该文档进行评分
  • 0
发表评论

特惠

限量优惠活动

正在火热进行

站长

添加站长微信

领取新人礼包

下载

便携运营智库

立即下载APP

工具

运营导航

工具推荐

帮助

帮助中心

常见问题

分销

50%直推收益

30%间推分成

AI

智能对话

办公助手

顶部