40hx跑AI图512x512要14秒一张图。比m40 12g的13秒还慢比p104的11秒还慢比p106的18秒快stable_p106吧

p106吧关注：29,385贴子：278,434

26回复贴，共1页

40hx跑AI图512x512要14秒一张图。比m40 12

40hx跑AI图512x512要14秒一张图。
比m40 12g的13秒还慢
比p104的11秒还慢
比p106的18秒快
stable diffusion，软件是绘世ai画图整合包
目前很抱怨速度太慢了，没啥提升
不过3d性能好
1080p烤鸡，有158fps
720p 有220fps
温度稳定在73度，功耗保持在180w
待机功耗显示12w
功率表整机带显示器功耗90w
闲鱼从江苏徐州那个卖家买的，花了365CNY
算是满足了玩所有计算卡的小梦想了，小失望，就是嫌弃跑ai图太慢了，没有网上吹得比p104快40%的速度。

送TA礼物

IP属地:河南

来自Android客户端1楼2025-04-28 18:55回复

求解，如何优化跑图速度，我希望和2060一样，512默认，6-8秒一张图，14秒太长了时间

IP属地:河南

来自Android客户端2楼2025-04-28 18:56

收起回复

不感兴趣

开通SVIP免广告

玩艾尔登法环，1080p，最高画质，开光线追踪只有30多帧，不开有60帧，好像最高就60帧，这个游戏测不出来最高性能。
对比p104玩这个卡只有40fps
m40能有60帧

IP属地:河南

来自Android客户端3楼2025-04-28 19:07

40HX的单精度浮点有阉割，因为矿场上用不到这个，老黄就来了一刀精准的刀法……但是，Ai跑图会用到这个，所以，就杯具了。

IP属地:山东

来自Android客户端4楼2025-04-28 20:14

那是你没设置对，用全精度跑，flux模型720*1280，40hx只要130秒，p104要近200秒

IP属地:浙江

来自Android客户端5楼2025-04-28 21:04

收起回复

这卡和p106玩游戏时是不是会有一小块区域画面抖动，我两块p106和40hx都有这个问题，但贴吧和抖音都没搜到这个问题

IP属地:江苏

来自Android客户端6楼2025-04-29 06:13

收起回复

记得加参数可以替换单精度什么的，显存占用加倍，有用

IP属地:福建

7楼2025-04-29 08:44

感觉那几秒没啥用，本来想着玩ai的，n卡都买好了，结果又闲置几个月了，天天电脑刷抖音玩游戏的，你是觉得跑大图很浪费时间吗？小破站上也有图片放大教程啊，先跑小图再放大，1024*1024就是很严格的刚好512*512的4倍时间，2048*2048就是16倍时间，对比起那种直接跑大图花更多几十倍时间，找对方法才是关键，靠显卡性能多那几秒有什么用，

IP属地:广东

来自Android客户端8楼2025-05-04 19:19

不感兴趣

开通SVIP免广告

我看过一个帖子。40hx要通过特殊设置,跑图才快。

IP属地:四川

来自Android客户端9楼2025-05-08 13:01

关于40HX
SD跑图相关半精度FP16：基本全被砍没，AI画图显存占用大，并且目前SD模型多是基于FP16，所以40HX效率较差和出图结果与使用FP16有些许差别。
以下优化感谢4tzR23大佬的帖子。
40HX基于目前测试结果，SD1.5目前我测试的最佳跑图设置：
设置方法就是修改源码及加参数--no-half --no-half-vae（如果使用lora和controlnet较多时还需要加--medvram），目的是关闭半精度设置以单精度为主的混合精度模式，载入显存模型是fp16，但计算以fp32为主。在SD根目录下modules\devices.py的最后一行，将return torch.autocast ("cuda")改为torch.autocast("cuda", dtype=torch.float32, enabled=True)，这样启动显存占用减半
跑第一次图慢一点，第二次就好多了。

IP属地:四川

来自Android客户端10楼2025-05-08 13:10

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

26回复贴，共1页

<返回p106吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴

日	一	二	三	四	五	六

40hx跑AI图512x512要14秒一张图。比m40 12

登录百度账号

扫二维码下载贴吧客户端