claude吧 关注:21,423贴子:128,336
  • 6回复贴,共1

gpt4o vs claude3.5sonnet

只看楼主收藏回复

两个有趣的测试,gpt4o vs claude3.5sonnet
1. 甲、乙、丙、丁四个人各说了一句话,甲:“我没有吃饭。”乙:“我说的是真话。”丙:“乙在骗人。”丁:“如果甲说的是假话,则丙说的也是假话,如果甲说的是真话,则丙说的也是真话。”已知其中三人都是说的真话,只有一人说的假话,则说假话的是
2. 我今天有3个苹果,昨天吃了一个,我现在还有几个苹果
用了十来个号每个号都测了几次
gpt4有回答正确有回答错误的,十来个号测试下来两个问题正确率基本都是一半一半
claude有点离谱,第一个问题每个号都回答正确,第二个问题每个号都回答错误,而且不同号每次回答内容都一样,像是看了答案一样
结论:gpt上下起伏大,时好时坏,claude知道的就是准确的,不知道都就是完全错误的


IP属地:重庆来自iPhone客户端1楼2024-07-26 17:04回复
    前段时间会给部分免费账号用haiku的模型,你往下瞄看是不是两个账号模型不一样


    IP属地:福建来自Android客户端2楼2024-07-26 18:43
    收起回复
      2025-08-07 03:54:40
      广告
      不感兴趣
      开通SVIP免广告
      实测用英文的话,不管gpt还是claude,每个号,每次回答都是正确的,可能是问题的中午呢语境的原因,也可能是模型都是用英文训练的,用英文效果好一些


      IP属地:重庆来自iPhone客户端3楼2024-07-26 20:19
      回复
        ot


        IP属地:上海来自Android客户端4楼2024-07-29 15:09
        收起回复