首页研究报告机构研究人工智能DeepSeek与新媒体运营
策划大佬

文档

6274

关注

0

好评

0
PDF

DeepSeek与新媒体运营

阅读 878 下载 18 大小 17.44M 总页数 122 页 2025-04-24 分享
价格:¥ 9.90
下载文档
/ 122
全屏查看
DeepSeek与新媒体运营
还有 122 页未读 ,您可以 继续阅读 或 下载文档
1、本文档共计 122 页,下载后文档不带水印,支持完整阅读内容或进行编辑。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
Deepseek内部研讨系列DeepSeek与新媒体运营AI肖容团队(相洪波、刘春艳、伊丽娜、李娜)2025年3月8日U N I V E I北大青鸟人工智能研究院北大计算机学院北大教育学院学习科学实验室摘要都1.本次讲座为DeepSeek原理和应用系列研讨的讲座之一,旨在帮助新媒体从业者理解A技术在运营中的应用策略、场景落地以及未来发展趋势,同时探讨A1技术带来的挑战与应对方法。2.本讲座的内容分为5个主要部分:①介绍了DeepSeek的背景与发展,重点分析了DeepSeek R1推理模型与V3生成模型的特点与适用场景,对比了不同规模模型的性能表现,帮助用户选择适合自身需求的版本。②介绍了大模型三层能力模型,生成式模型和推理型模型的对比,以及大棋型的应用场景,通过提示词工程借助Dee即Seek的能力将各领域专家思维赋能于日常学习、工作和生活。③在新媒体运营的应用策略部分,资料详细阐述了A在内容生产、用户运营、数据驱动运营、直播电商等全链路场景中的具体应用。(④A技术在新媒体行业的落地案例30个,展示了如何通过DeepSeek提升内容创作效率、优化传播策略、增强用户互动体验,并结合实际数据说明A技术对新媒体运营效率的显著提升。⑤分析了A技术带来的挑战,如内容同质化、隐私风险、伦理争议等,并提出了应对策略。强调了新媒体运营人员如何应对人工智能对行业的冲击,以及营销全链路变革等方面的发展趋势:3.在技术学习的道路上,优质学习资源至关重要。推荐大家参考《人工智能通识教程(微课版)》这本系统全面的入门教材,结合B站“思睿观通”栏目的配套视频进行学习。此外,欢迎加入ai.kgc,cn社区,以及“A1肖睿团队”的视频号和微信号,与志同道合的A1爱好者交流经验、分享心得。0102DeepSeek和AI认知A在新媒体中的落地使用1,DeepSeek的背景和发展1.A在新媒体中的应用策略2.A1的能力边界和发展认知2,A1在新媒体中的应用场景3.A在新媒体中的挑战与展望现象:DeepSeek快速出圈2024年12月26日,DeepSeek推出对标DeepSeek全球增速最快AI应用OpenAI GPT-4o的语言模型DeepSeek V3,A智能助手Web端榜单随后在美国A行业内部引起轰动。2025年1月20日,DeepSeek发布对标OpenAl o1的语言模型DeepSeek R1,并于1月24日引起美国投资界KOL关注。回·2025年1月26日,关于DeepSeek颠覆了大模主流市场型的商业模式的讨论,引发英伟达股价大跌,DeepSeek首先在美国出圈,引发社会讨论。春节前后,DeepSeek在中国出圈,并上升到中美竞争高度,企业纷纷接入DeepSeek,技术置好者DeepSeek成为AI和大模型的代名词。eepSeek发送消息早采用者早期大众2.5%13.5%34%34%16%DeepSeek让AIl跨越了鸿沟。到底谁是DeepSeek?公司、模型、产品DeepSeek发展历程DeepSeek模型家族正式发布公司简介deepseek宣布开源弟二DeepSeek RIdeepseek代MoE大模型DeepSeek R1 Lite成立DeepSeek V2开源模型权重◆DeepSeek于2023年5月成立北京公司,2023年7月2024年5月2024年11月2025年1月DeepSeek V3DeepSeek Coder V22023年7月成立杭州公司,是幻方量化2024年1月2024年9月2024年12月DeepSeek V2孵化出的一家大模型研究机构,160人发布第一版大合并DeepSeek Coder V2.宣布DeepSeek V.3和DeepSeek V2Chat两DeepSeek Math的团队分布在中国杭州和北京,是中国DeepSeek LLM个模型,升级推出全新的DeepSeek V2.5新模型步开源模型权重AI2.0(大模型)时代的七小龙之一。ModelBase Model注:A11.0(深度学习)时代的四小龙:DeepSeek-R1-Distill-Qwen-1.5BQwen2.5-Math-1.5B商汤、旷世、云从、依图蒸馏模型,能力稍弱DeepSeek-R1-Distill-Qwen-7BQwen2.5-Math-7B◆除了DeepSeek之外,其它六家大模型DeepSeek-R1-Distill-Llama-8B实际上是增加了推理能力的Qwen模型和公司也被投资界称为中国大模型企业六DeepSeek-R1-Distill-Qwen-14BQwen2.5-14BLama模型,不能称为DeepSeek模型小虎(智谱A、百川智能、月之暗面、DeepSeek-R1-Distill-Qwen-32BQwen2.5-32B市场上有误解,厂商有误导,Oama工具的模阶跃星辰、MiniMax、零一万物)·DeepSeek-R1-Distill-Llama-70BLlama-3.3-70B-Instruct型选项中也有误导DeepSeek-R1-671BDeepSeek-V3-Base满血版,能力最强到底谁是DeepSeek?公司、模型、产品AI系统的技术实现A!系统的部署方案(公有云、私有云、本地化)生产办公系统:目前多数为定制开发(RAG、LangChain、Agent等)SaaS对话机器人:目前多数为标准产品,使用云服务应用服务(网页、APP、桌面软件、设备软件)·收费(月费:充值):文心一言、通义千间、Liblib、ChatGPT等开源模型:DeepSeek、Qwen、Lama、SD、微调模型等MaaS·向上提供:私有化部署,公有云服务(DeepSeek官网、硅基流动、火山引擎等)模型服务(数据工程、推理加速、训练框架、AP调用)闭源模型:OpenAl、Claude、百度等向上提供:公有云服务PaaS私有化部署平台服务(存储、计算、数据、安全)·本地:个人设备或电脑、企业服务器laaS·数据中心(IDC):企业服务器、服务器集(私有云)硬件服务(设备/电脑/服务器/GPU、网络)公有云服务:阿里云、火山云、腾讯云、金山云、华为云等;AWS、Azure等出圈的是模型:DeepSeek R1模型1.对于大模型研发企业,更加重视ira工程的价值了。出圈的核心原因2.对于大模型应用企业,有了更多高效低成本解决方案。对于社会大众,认识到A1是一个趋势,不是县花一现。■能力突破:推理模型的全球第一梯队。3.4.对于市场,用户开始主动引入A,不再怀疑了。■加分项:开源、低成本、国产自主。5.对于国家,大幅缩小了中美的核心技术差距。6.对于全人类,技术平权,造福一方。US China:Fro混合专家多头潜注意力Token预测强化学习测试时计算混合精度训练通讯优化并行训练框架直接硬件编程MOEMLAMTPGRPOTTCFP8DualPipeHAIPTX0102DeepSeek和AI认知A在新媒体中的落地使用1,DeepSeek的背景和发展1.A在新媒体中的应用策略2.A的能力边界和发展认知2,A1在新媒体中的应用场景3.A在新媒体中的挑战与展望大模型相关术语感知理解世界生成创造世界■人工智能:让机器具备人类智能,让机器具备非人类智能(超人类智能)■传统:知识+规则:专家系统(知识库+推理机)ChatGPT■现代:数据+学习:机器学习(模型、目标、菊略):数据模型(心)■深度学习:深度神经网络(DNN)2OO6传统神经网络架构:DBN,CNN,RNN,ResNet,Inception,RWKV,1956年2022年Alpha Fold ChatGPTImageNet(超过人跟):AlphaGO(超过人类棋手):AlphaFold(超过人类科学家)2017 Transformer.架构:并行矩阵计算(GPU),注意力机制(Attention)·传统架构:编码器(BERT)、混合网络·GPT架构:解码器(GPT)1,大语言模型(山M,大模型)ChatGPT(4.5、4o、o1、o3)、Claude:Grok、Gemini:Uama、…2,视觉模型(Di币usion+Transformer),多模态模型图片:Stable Diffusion、Midjoumey、.DALE、Janus等视频:Sora、可灵、海螺等3.通用模型V5垂直模型(行业模型):传媒、教育、医疗、金融等大模型的三层能力解决方案1.严谢内容+垃圾信息的混合提示词(Prompt).2.知识量大,但缺少内在关联能力2.语言能力:理解和生成3.知识能力1.来源:有损压缩,NTP的温度知识图谱(KGE)2.2.观点:创意和创新5.模型微调(Fine Tune)幻觉(生成不符合事实的内容)知识库限制(公开、私有、即时)Generative上下文窗口限制(记忆、成本)推理能力Pre-trainedP3.果用Transformer架构处理token(预练)T概率预测+文字接龙Transformer4基于上下文预测下一个token整的句子LLM:Large Language Model大模型的三层能力语言能力:理解和生成蓄力期拓展期突破期2知识能力幻觉(生成不符合事实的内容)知识库限制(公开、私有、即时)上下文窗口限制(记忆、成本)推理能力LLM Post-Training A Deep Dive into Reasoning。生成模型推理模型h,快思考类比推理摸里(o,DeepSeek-R1等慢思考生成模型与推理模型的适用场景比较项模型定位专注于通用自然语言处理,多模态能力突出,适合日常对话、侧重于复杂推理与逻辑能力,擅长数学、编程和自然语言推理任务,适合高内容生成、甜译以及图文、音频、视频等信息处理。难度问题求解和专业领域应用。在日常语言任务中表现均衡,但在复杂逻辑推理(如数学题推理能力在复杂推理任务表现卓越,尤其擅长数学、代码推理任务。求解)上准确率较低。多模态支持当前主委支持文本输入,不具备图像处理等多模态能力:未来可能通过社区支持文本、图像、音频乃至视频输入,可处理多种模态信息。贡献扩展相关功能。适合广泛通用任务,如对话、内容生成、多模态信息处理以更适合需要高精度推理和逻辑分析的专业任务,如数学竟赛、编程问愿和科应用场景及跨语言交流:面向大众市场和商业应用。学研究:在思路清晰度要求高的场景具有明显优势,比如采访大纲、方案。提供流畅的实时对话体验,支持多种输入模态:用户界面友可展示部分链式思考过程,便于用户理解推理过程:界面和使用体验具有较用户交互体验好,适合大众使用。高的定制性,但整体交互节奏较慢。■生成模型是玩知识和文字的,推理大模型是玩逻辑和推理的,至于计算问题,还是找计算器吧■推理模型也不是万能的,其幻觉通常比生成模型大,很多不需要强推理的场合还是传统的生成模型比较适合DeepSeek R1的主要应用场景推理密集型任务>编程任务中的代码生成、算法设计,媲美Claude3.5 Sonnet。.>数学问题求解、科学推理和逻辑分析等需要复杂推理的场景。■长链推理型任务>需要基于大量知识,进行长链推理的复杂任务。>例如:工作方案、科研实验、病理诊断、命理玄学、市场分析、奥情分析、教育教学等。中文要求高的任务>理解和使用中国文化背景、习惯用语、古文诗词(如生成春联。优于ChatGPT的中文能力.>这一部分用DeepSeek-V3也可以做到.DeepSeek R1应用场景举例010203专业场景提效教育与学术赋能商业创新&生活服务办公提效教学设计市场营销病理诊断学术研究电商运营去AI味儿优化家庭财务管理知识付费新媒体运营命理玄学·具体内容可以参考AI肖睿团队的《提示词工程和场景落地》大模型的提示词工程:多变、规律、衰落清晰的表达!把AI当人看!对于推理模型(R1),少指手画脚!1,问题、表达、评价:把自己当老板,像对待你的员工一样,对待A2,镜子理论:提示词是人激发和控制A能力的手段,如同一个骑手的骑术一样·具体内容可以参考A肖容团队的《提示词工程和场景落地》
文档评分
    请如实的对该文档进行评分
  • 0
发表评论

特惠

限量优惠活动

正在火热进行

站长

添加站长微信

领取新人礼包

下载

便携运营智库

立即下载APP

工具

运营导航

工具推荐

帮助

帮助中心

常见问题

分销

50%直推收益

30%间推分成

AI

智能对话

办公助手

顶部