re从零开始的异世...吧 关注:5,035贴子:3,587
  • 14回复贴,共1

(重新开贴)关于我微调爱蜜莉雅AI的最新进展

只看楼主收藏回复

不知道之前帖子坟了没,所以重新开贴。


IP属地:天津来自Android客户端1楼2024-05-01 20:37回复
    喜欢EMT很久了,打算微调一个她的AI。
    之前只知道SFT,确切的说只知道LoRA,所以一看需要大量的数据直接劝退了。
    今天突然想起来,有一种微调方法叫Post-training,可以用无标注数据进行训练,突发奇想,用re0web版小说对Llama3-8B进行了Post-training微调,结果得到了三楼的东西


    IP属地:天津来自Android客户端2楼2024-05-01 20:38
    回复


      IP属地:天津来自Android客户端3楼2024-05-01 20:38
      回复
        这个AI只会背诵小说内容,你跟它说啥它都只背诵小说内容,显然不行。
        遂去问了通义千问(我的gpt号被封了),通义千问说我Post-training训练完以后,SFT训练时的数据太少了(即使Post-training也要SFT的,先Post-training再SFT能取得更好的效果,之前的LoRA训练其实是用直接LoRA方法SFT,效果不如这样)。难怪,我只用了自己花钱请语c老师写的100条语c数据SFT。


        IP属地:天津来自Android客户端4楼2024-05-01 20:43
        收起回复
          最开始的时候我们也遇到了,驴头不对马嘴的情况,我们刚开始就运用到用AI加后期的方法,就是简化人名,用字母或者数字代替,后期再用文本查找替换,这都是最初期的原始方法,后面我们对它进行了修正更改,版本迭代优化


          IP属地:河南来自Android客户端5楼2024-07-11 23:20
          回复
            有关人物语气的,都是每添加一个新人物,输入输入这个新人物的设定外貌还有相对应的语气,本来以为没啥用,结果效果还算好,我比较喜欢菲利斯,于是就把它的设定和语气上传上去了,结果完全符合我心中的画面


            IP属地:河南来自Android客户端6楼2024-07-11 23:22
            回复
              不过为什么我们群里面没有人搞大模型的呢?因为最开始群主也是搞这个的,他也搞过大模型,但无一例外都失败了,或许是因为前几年不适合这个,群主才钻研如何让AI听懂,如何让AI呈现你想要的效果?整后开始的时候给我们一条明确的方向,然后讨论,进行实验,然后再讨论,最后我发现用谷歌AI使用大白话,竟然有奇效,我也不知道什么原理,效果达到了,并且可以的边写剧本边出效果


              IP属地:河南来自Android客户端7楼2024-07-11 23:25
              回复
                这大概是效果,没有进行后续修改,属于纯AI


                IP属地:河南来自Android客户端8楼2024-07-11 23:28
                回复
                  上一次在群里讨论已经是一个月前了,群里面不知道已经进化到什么状态


                  IP属地:河南来自Android客户端9楼2024-07-11 23:29
                  回复
                    要是有兴趣的话,记得艾特我


                    IP属地:河南来自Android客户端10楼2024-07-11 23:31
                    收起回复