查看: 157|回复: 4

[聊技术] 未来大模型突破点在于循序渐进思维链的强化。

[复制链接]

6

主题

21

回帖

57

积分

注册会员

Rank: 2

积分
57
发表于 2025-5-18 09:29:16 | 显示全部楼层 |阅读模式
人会利用前面所学循序渐进学后面的东西,在这个模式下,人类学习效率较高,如果不循序渐进,除少量结构过于复杂的知识网络外,效率都会变得很差,理工科尤其如此。此模式下,学会了前置与后续的关联利用架构,逻辑结构的建构就较优了,现实中就体现出了这个人的逻辑思维泛化创造性、条理层次性优良。
回复

使用道具 举报

4

主题

20

回帖

47

积分

一年会员

Rank: 2

积分
47
发表于 2025-5-18 09:29:45 | 显示全部楼层
当前大模型的后训练、思维链强化,部分无意识、偶然性的利用了已有循序渐进语料例如理科教材的文字加工版,但这不够,要提高训练效率与思维链质量,需要针对性组织语料。可以人工结合大模型来加工、重整教材、已有语料。
回复 支持 反对

使用道具 举报

发表于 2025-5-18 09:30:45 | 显示全部楼层
要让大模型把前置、后续结构强化,它自然就优化、泛化了复杂逻辑,哪怕是未知,它也有足够强足够高成长的创新泛化能力。
回复 支持 反对

使用道具 举报

发表于 2025-5-18 09:31:31 | 显示全部楼层
预训练之后,如果微调后训练特别思维链强化也仍沿用预训练那样随机乱序,也许效率难以提升,至少会损失掉隐含的自然关联的优势,因为灾难性遗忘会优先灭失前置后续权重被忽略的关键。
回复 支持 反对

使用道具 举报

3

主题

15

回帖

35

积分

一年会员

Rank: 2

积分
35
发表于 2025-5-18 22:20:49 | 显示全部楼层
支持一波~~加油啊~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

特惠

限量优惠活动

正在火热进行

站长

添加站长微信

领取新人礼包

下载

便携运营智库

立即下载APP

工具

运营导航

工具推荐

帮助

帮助中心

常见问题

分销

50%直推收益

30%间推分成

AI

智能对话

办公助手

顶部