萧萧易水 发表于 2025-5-18 09:29:16

未来大模型突破点在于循序渐进思维链的强化。

人会利用前面所学循序渐进学后面的东西,在这个模式下,人类学习效率较高,如果不循序渐进,除少量结构过于复杂的知识网络外,效率都会变得很差,理工科尤其如此。此模式下,学会了前置与后续的关联利用架构,逻辑结构的建构就较优了,现实中就体现出了这个人的逻辑思维泛化创造性、条理层次性优良。

夜深人未静ゅ 发表于 2025-5-18 09:29:45

当前大模型的后训练、思维链强化,部分无意识、偶然性的利用了已有循序渐进语料例如理科教材的文字加工版,但这不够,要提高训练效率与思维链质量,需要针对性组织语料。可以人工结合大模型来加工、重整教材、已有语料。

演绎都市繁华℡ 发表于 2025-5-18 09:30:45

要让大模型把前置、后续结构强化,它自然就优化、泛化了复杂逻辑,哪怕是未知,它也有足够强足够高成长的创新泛化能力。

霸道菇凉最给力i 发表于 2025-5-18 09:31:31

预训练之后,如果微调后训练特别思维链强化也仍沿用预训练那样随机乱序,也许效率难以提升,至少会损失掉隐含的自然关联的优势,因为灾难性遗忘会优先灭失前置后续权重被忽略的关键。

夕阳一抹红颜 发表于 2025-5-18 22:20:49

支持一波~~加油啊~
页: [1]
查看完整版本: 未来大模型突破点在于循序渐进思维链的强化。