网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
01月13日
漏签
0
天
deepseek吧
关注:
136,150
贴子:
376,312
看贴
图片
吧主推荐
游戏
1
2
3
4
5
6
下一页
尾页
79
回复贴,共
6
页
,跳到
页
确定
<返回deepseek吧
>0< 加载中...
市面上具有代表性的22款模型深度测评
取消只看楼主
收藏
回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
之前发过一个测评帖,坑开的有点大,出现了各种问题,所以整理了一下重新开一个。
测试包括市面上具有代表性的22款优秀模型,20个问题,共440多轮对话,涵盖各个方面进行全面的总结。
送TA礼物
IP属地:陕西
1楼
2025-02-17 22:43
回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
测了一部分了已经,贴吧排版太难受了,我先测完整理好再发。
IP属地:陕西
3楼
2025-02-17 22:48
回复
收起回复
2026-01-13 23:01:03
广告
不感兴趣
开通SVIP免广告
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
总算测完了
IP属地:陕西
来自
Android客户端
6楼
2025-02-19 09:41
回复
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
坑开的太大了全文总结了5万多字,我勒个天。
IP属地:陕西
来自
Android客户端
7楼
2025-02-19 09:44
回复
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
本来我寻思给百度的面子加了一个百度的免费小模型。然后发现那玩意儿是真的不行,然后换成通义千问的一个小模型了。
IP属地:陕西
来自
Android客户端
8楼
2025-02-19 09:45
回复
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
IP属地:陕西
9楼
2025-02-19 09:46
回复(2)
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
IP属地:陕西
10楼
2025-02-19 09:47
回复(1)
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
先介绍以下参赛选手。
deepseek全家桶自不必多说
Anthropic,openai,谷歌家的旗舰也很出名
IP属地:陕西
11楼
2025-02-19 09:48
回复
收起回复
2026-01-13 22:55:03
广告
不感兴趣
开通SVIP免广告
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
Doubao-1.5-vision-pro和qwen2.5-vl-72b大家可能不太熟,算是国内乃至国际最强的两个视觉模型了。除去GPT这样的多模态大模型,他俩的识别能力可以说是天花板了。
有时候deepseek没有图像输入能力就很难受,就可以试试他俩,语言能力也不差,视觉能力顶呱呱
IP属地:陕西
12楼
2025-02-19 09:51
回复
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
Llama-3.3-70b和deepseek-70b应该是一个模型,然后从r1蒸馏的参数。可以对比一下看看进步大不大
IP属地:陕西
13楼
2025-02-19 09:52
回复
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
doubao-1.5-lite,gpt-4o-mini以及qwen-Turbo都是蛮好用的轻量级模型,价格都在1元/百万token以内,非常划算。不需要太高智商的话,单纯问个问题聊聊天啥的,或者当个翻译工具足矣。
IP属地:陕西
14楼
2025-02-19 09:54
回复
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
第一题,豆包的视觉模型拉跨了,其余全对。
其实这一题不太能代表什么,就是一个幻觉而已。看个乐子吧。
IP属地:陕西
15楼
2025-02-19 09:56
回复
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
2,3题也一样,代表不了什么智商。尤其是第三题,全军覆没,只能说现在的AI缺乏常识。
deepseek1.5B数字母都能数对,和智商关系不大的。
IP属地:陕西
16楼
2025-02-19 09:59
回复(8)
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
个人感觉Claude不一定是最聪明的,但是是最能体会用户潜台词的模型。
豆包这一题发挥也还行。
总结太多了,大伙看个分儿就行了
IP属地:陕西
17楼
2025-02-19 10:03
回复
收起回复
2026-01-13 22:49:03
广告
不感兴趣
开通SVIP免广告
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
前五题用处都不大,体现不出智商。
这题以前是个经典的幻觉,现在基本都修复了。
deepseek-7B和1.5B实际上不是识别不出来,是话都说不利索。
IP属地:陕西
19楼
2025-02-19 10:06
回复
收起回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
彩礼逆天论:1年养育=1万彩礼
2147190
2
真败家!娇妻竟挪97万养野男
1911419
3
反向催生,退休人员产检可报销
1540140
4
版本真神,鸣潮爱弥斯技能曝光
1420632
5
领导狂揽30w,员工质疑反遭打
1415830
6
LPL死期将至!3大金主集体跑路
1189500
7
逆天网红店公然拒接男客
985728
8
懂王出手狠辣,鲍威尔惨遭调查
746649
9
《逆战:未来》双端今日上线!
669614
10
2岁儿被拦女浴室,宝妈喊冤卖惨
523320
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示