爱你是心 发表于 2025-5-19 07:20:15

初学者求助!!!!

老师让做一个自然语言处理的任务作为期末大作业,但是没有具体要求,用大模型就可以

我自己的电脑是3060的,之前使用llamafactory训练过一个deepseekR1的1.5B的蒸馏模型
我现在就想训练这个模型完成一个医患对答的模型,我就在Huggingface上下载了一个数据集
这个数据集差不多800MB,我问GPT甚至他都说有点小,本来我就想要训练五十轮试一试水。
结果悲剧了,训练五十轮要1000多个小时,我作业还有一周就交了

训练一轮就要20多个小时,没时间了,问问万能的贴吧,有没有办法

还有老师说要找一种可以提高性能的办法,告诉我们要从数据增强,提示学习,之类的角度解决。
这个应该怎么处理啊
求求大佬救救

酒杯病患 发表于 2025-5-19 07:21:00

救救孩子吧

独自渲染离殇 发表于 2025-5-20 10:18:41

顶起来······
页: [1]
查看完整版本: 初学者求助!!!!