网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
08月06日
漏签
0
天
chatgpt吧
关注:
142,934
贴子:
458,478
看贴
图片
吧主推荐
游戏
3
回复贴,共
1
页
<返回chatgpt吧
>0< 加载中...
gpt4.1和o4迷你在arena排名的elo分数好低
只看楼主
收藏
回复
覆灭不见沉沦
自然语言
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
真有这么低吗,是elo评分权威性不够还是真的很拉胯,感觉没那么差吧,都排到免费的ds后面去了
送TA礼物
IP属地:广东
来自
Android客户端
1楼
2025-05-07 11:19
回复
覆灭不见沉沦
自然语言
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
看了一下live bench,感觉可信度高一点,今早用o3和gemini pro整合了一下数据,感觉o3好一点,但是思考时间很长,动不动就是五六分钟,gemini 2.5pro经常思考两三分钟就不思考了,还表示计算量过大只给出部分例子,不知道有没有人能做到让gemini 2.5 pro长思考
IP属地:广东
来自
Android客户端
2楼
2025-05-07 11:29
回复
收起回复
2025-08-06 14:55:57
广告
不感兴趣
开通SVIP免广告
覆灭不见沉沦
自然语言
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
gpt表示gemini才是第一,不知道什么情况, 难道看的不是global average?
IP属地:广东
来自
Android客户端
3楼
2025-05-07 11:37
回复(1)
收起回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
贴吧预言帝海外遭“通缉”
2470020
2
奔驰亮证姐被抓,行拘5天太轻?
2206900
3
吧友爆料黑神话820藏大招
1648164
4
复旦教授怒斥豆瓣群组挺诬女打拳
1392579
5
全民强交社保,不交彻底凉凉
1087138
6
小米汽车被曝霸王条款:交钱再验车
817950
7
8月5日乐子内容限定
608760
8
小丑来了!我被大13岁姐姐拿捏
540868
9
翻身了?Bin成功入选LPL梦幻阵容
462682
10
魂味太纯正,明末销量或将破千万
398202
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示