初学者求助!!!!
老师让做一个自然语言处理的任务作为期末大作业,但是没有具体要求,用大模型就可以。
我自己的电脑是3060的,之前使用llamafactory训练过一个deepseekR1的1.5B的蒸馏模型
我现在就想训练这个模型完成一个医患对答的模型,我就在Huggingface上下载了一个数据集
这个数据集差不多800MB,我问GPT甚至他都说有点小,本来我就想要训练五十轮试一试水。
结果悲剧了,训练五十轮要1000多个小时,我作业还有一周就交了
训练一轮就要20多个小时,没时间了,问问万能的贴吧,有没有办法
还有老师说要找一种可以提高性能的办法,告诉我们要从数据增强,提示学习,之类的角度解决。
这个应该怎么处理啊
求求大佬救救 救救孩子吧
顶起来······
页:
[1]