很多人认为4o是个很垃圾的模型？【deepseek吧】

01月31日漏签0天

deepseek吧关注：23,402贴子：30,664

13回复贴，共1页

<返回deepseek吧

很多人认为4o是个很垃圾的模型？

只看楼主收藏回复

那我拿出lmarena这个图你不炸了吗bro
closeai真的相思了，o1被缩水到打不过4o了，还能卖我20美元一个月。

送TA礼物

IP属地:山东

来自Android客户端1楼2025-01-31 08:22回复

天天说4o路边一条被ds暴打的但凡用过也不会说出来这个话

IP属地:山东

来自Android客户端2楼2025-01-31 08:27

还有这个o1真是笑死我了，从发布以来一直在缩水，每个月的体验都不一样，现在缩到20美元一个月体验连自家4o都打不过了

IP属地:山东

来自Android客户端3楼2025-01-31 08:30

要发o3当然先缩水o1咯，不过lmarene证明不了什么，前五差距基本都在5%以内，实际使用很难感觉出来差距。

IP属地:湖南

来自Android客户端4楼2025-01-31 08:32

收起回复

这榜有时候会被吐槽公信力低，谷歌倒是很重视在这个榜的排名，基本一掉榜就加算力，a社和openAI不太理这个榜单，导致出现claude3.5sonnet飞榜，o1评分还比4o低的情况

IP属地:浙江

来自Android客户端5楼2025-01-31 10:38

收起回复

claude3.5sonnet和deepseek-r1都算偏科生，deepseek数学和推理能力较强但编程能力弱，两个偏科生在aider的榜里面甚至还能兄弟齐上互相取长补短（deepseek指导claude写代码）

IP属地:浙江

来自Android客户端7楼2025-01-31 10:52

收起回复

closeai最恶心的就是降智，最开始的gpt4-turbo很强，后面越用越拉，后推出的4o感觉还不如4turbo

IP属地:山东

来自Android客户端8楼2025-01-31 11:38

主要是o1还限制使用次数啊，每月20刀还没法随便用，坑人呢这是

IP属地:湖南

来自iPhone客户端9楼2025-01-31 13:03

deepseek v3能赢4o和claude3.5sonnet吗

IP属地:四川

来自Android客户端10楼2025-01-31 14:55

收起回复

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

13回复贴，共1页

<返回deepseek吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴

日	一	二	三	四	五	六

很多人认为4o是个很垃圾的模型？

登录百度账号

扫二维码下载贴吧客户端