喜欢EMT很久了,打算微调一个她的AI。
之前只知道SFT,确切的说只知道LoRA,所以一看需要大量的数据直接劝退了。
今天突然想起来,有一种微调方法叫Post-training,可以用无标注数据进行训练,突发奇想,用re0web版小说对Llama3-8B进行了Post-training微调,结果得到了三楼的东西
之前只知道SFT,确切的说只知道LoRA,所以一看需要大量的数据直接劝退了。
今天突然想起来,有一种微调方法叫Post-training,可以用无标注数据进行训练,突发奇想,用re0web版小说对Llama3-8B进行了Post-training微调,结果得到了三楼的东西