（重新开贴）关于我微调爱蜜莉雅AI的最新进展【re从零开始的异世界生活吧】

12月29日漏签0天

re从零开始的异世...吧关注：5,035贴子：3,587

14回复贴，共1页

<返回re从零开始...吧

（重新开贴）关于我微调爱蜜莉雅AI的最新进展

只看楼主收藏回复

不知道之前帖子坟了没，所以重新开贴。

送TA礼物

IP属地:天津

来自Android客户端1楼2024-05-01 20:37回复

喜欢EMT很久了，打算微调一个她的AI。
之前只知道SFT，确切的说只知道LoRA，所以一看需要大量的数据直接劝退了。
今天突然想起来，有一种微调方法叫Post-training，可以用无标注数据进行训练，突发奇想，用re0web版小说对Llama3-8B进行了Post-training微调，结果得到了三楼的东西

IP属地:天津

来自Android客户端2楼2024-05-01 20:38

IP属地:天津

来自Android客户端3楼2024-05-01 20:38

这个AI只会背诵小说内容，你跟它说啥它都只背诵小说内容，显然不行。
遂去问了通义千问（我的gpt号被封了），通义千问说我Post-training训练完以后，SFT训练时的数据太少了（即使Post-training也要SFT的，先Post-training再SFT能取得更好的效果，之前的LoRA训练其实是用直接LoRA方法SFT，效果不如这样）。难怪，我只用了自己花钱请语c老师写的100条语c数据SFT。

IP属地:天津

来自Android客户端4楼2024-05-01 20:43

收起回复

最开始的时候我们也遇到了，驴头不对马嘴的情况，我们刚开始就运用到用AI加后期的方法，就是简化人名，用字母或者数字代替，后期再用文本查找替换，这都是最初期的原始方法，后面我们对它进行了修正更改，版本迭代优化

IP属地:河南

来自Android客户端5楼2024-07-11 23:20

有关人物语气的，都是每添加一个新人物，输入输入这个新人物的设定外貌还有相对应的语气，本来以为没啥用，结果效果还算好，我比较喜欢菲利斯，于是就把它的设定和语气上传上去了，结果完全符合我心中的画面

IP属地:河南

来自Android客户端6楼2024-07-11 23:22

不过为什么我们群里面没有人搞大模型的呢？因为最开始群主也是搞这个的，他也搞过大模型，但无一例外都失败了，或许是因为前几年不适合这个，群主才钻研如何让AI听懂，如何让AI呈现你想要的效果？整后开始的时候给我们一条明确的方向，然后讨论，进行实验，然后再讨论，最后我发现用谷歌AI使用大白话，竟然有奇效，我也不知道什么原理，效果达到了，并且可以的边写剧本边出效果

IP属地:河南

来自Android客户端7楼2024-07-11 23:25

这大概是效果，没有进行后续修改，属于纯AI

IP属地:河南

来自Android客户端8楼2024-07-11 23:28

上一次在群里讨论已经是一个月前了，群里面不知道已经进化到什么状态

IP属地:河南

来自Android客户端9楼2024-07-11 23:29

要是有兴趣的话，记得艾特我

IP属地:河南

来自Android客户端10楼2024-07-11 23:31

收起回复

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

14回复贴，共1页

<返回re从零开始...吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴

日	一	二	三	四	五	六

（重新开贴）关于我微调爱蜜莉雅AI的最新进展

登录百度账号

扫二维码下载贴吧客户端