DeepSeek-R1-通过以下方式激励LLMs中的推理能力强化学习(英文)
时间:2025-12-26 18:41 栏目:培训课件
社科院-通过 prompt 调试并比较国内外大模型“人情味”的小实验
时间:2026-01-05 18:14 栏目:公关传播