deepseek吧 关注:23,402贴子:30,664
  • 13回复贴,共1

很多人认为4o是个很垃圾的模型?

只看楼主收藏回复

那我拿出lmarena这个图你不炸了吗bro
closeai真的相思了,o1被缩水到打不过4o了,还能卖我20美元一个月。


IP属地:山东来自Android客户端1楼2025-01-31 08:22回复
    天天说4o路边一条被ds暴打的但凡用过也不会说出来这个话


    IP属地:山东来自Android客户端2楼2025-01-31 08:27
    回复
      还有这个o1真是笑死我了,从发布以来一直在缩水,每个月的体验都不一样,现在缩到20美元一个月体验连自家4o都打不过了


      IP属地:山东来自Android客户端3楼2025-01-31 08:30
      回复
        要发o3当然先缩水o1咯,不过lmarene证明不了什么,前五差距基本都在5%以内,实际使用很难感觉出来差距。


        IP属地:湖南来自Android客户端4楼2025-01-31 08:32
        收起回复
          这榜有时候会被吐槽公信力低,谷歌倒是很重视在这个榜的排名,基本一掉榜就加算力,a社和openAI不太理这个榜单,导致出现claude3.5sonnet飞榜,o1评分还比4o低的情况


          IP属地:浙江来自Android客户端5楼2025-01-31 10:38
          收起回复
            claude3.5sonnet和deepseek-r1都算偏科生,deepseek数学和推理能力较强但编程能力弱,两个偏科生在aider的榜里面甚至还能兄弟齐上互相取长补短(deepseek指导claude写代码)


            IP属地:浙江来自Android客户端7楼2025-01-31 10:52
            收起回复
              closeai最恶心的就是降智,最开始的gpt4-turbo很强,后面越用越拉,后推出的4o感觉还不如4turbo


              IP属地:山东来自Android客户端8楼2025-01-31 11:38
              回复
                主要是o1还限制使用次数啊,每月20刀还没法随便用,坑人呢这是


                IP属地:湖南来自iPhone客户端9楼2025-01-31 13:03
                回复
                  deepseek v3能赢4o和claude3.5sonnet吗


                  IP属地:四川来自Android客户端10楼2025-01-31 14:55
                  收起回复