p106吧 关注:29,385贴子:278,434
  • 26回复贴,共1

40hx跑AI图512x512要14秒一张图。比m40 12

只看楼主收藏回复

40hx跑AI图512x512要14秒一张图。
比m40 12g的13秒还慢
比p104的11秒还慢
比p106的18秒快
stable diffusion,软件是绘世ai画图整合包
目前很抱怨速度太慢了,没啥提升
不过3d性能好
1080p烤鸡,有158fps
720p 有220fps
温度稳定在73度,功耗保持在180w
待机功耗显示12w
功率表整机带显示器功耗90w
闲鱼从江苏徐州那个卖家买的,花了365CNY
算是满足了玩所有计算卡的小梦想了,小失望,就是嫌弃跑ai图太慢了,没有网上吹得比p104快40%的速度。








IP属地:河南来自Android客户端1楼2025-04-28 18:55回复
    求解,如何优化跑图速度,我希望和2060一样,512默认,6-8秒一张图,14秒太长了时间


    IP属地:河南来自Android客户端2楼2025-04-28 18:56
    收起回复
      2025-08-04 10:13:03
      广告
      不感兴趣
      开通SVIP免广告
      玩艾尔登法环,1080p,最高画质,开光线追踪只有30多帧,不开有60帧,好像最高就60帧,这个游戏测不出来最高性能。
      对比p104玩这个卡只有40fps
      m40能有60帧


      IP属地:河南来自Android客户端3楼2025-04-28 19:07
      回复
        40HX的单精度浮点有阉割,因为矿场上用不到这个,老黄就来了一刀精准的刀法……但是,Ai跑图会用到这个,所以,就杯具了。


        IP属地:山东来自Android客户端4楼2025-04-28 20:14
        回复
          那是你没设置对,用全精度跑,flux模型720*1280,40hx只要130秒,p104要近200秒


          IP属地:浙江来自Android客户端5楼2025-04-28 21:04
          收起回复
            这卡和p106玩游戏时是不是会有一小块区域画面抖动,我两块p106和40hx都有这个问题,但贴吧和抖音都没搜到这个问题


            IP属地:江苏来自Android客户端6楼2025-04-29 06:13
            收起回复
              记得加参数可以替换单精度什么的,显存占用加倍,有用


              IP属地:福建7楼2025-04-29 08:44
              回复
                感觉那几秒没啥用,本来想着玩ai的,n卡都买好了,结果又闲置几个月了,天天电脑刷抖音玩游戏的,你是觉得跑大图很浪费时间吗?小破站上也有图片放大教程啊,先跑小图再放大,1024*1024就是很严格的刚好512*512的4倍时间,2048*2048就是16倍时间,对比起那种直接跑大图花更多几十倍时间,找对方法才是关键,靠显卡性能多那几秒有什么用,


                IP属地:广东来自Android客户端8楼2025-05-04 19:19
                回复
                  2025-08-04 10:07:03
                  广告
                  不感兴趣
                  开通SVIP免广告
                  我看过一个帖子。40hx要通过特殊设置,跑图才快。


                  IP属地:四川来自Android客户端9楼2025-05-08 13:01
                  回复
                    关于40HX
                    SD跑图相关半精度FP16:基本全被砍没,AI画图显存占用大,并且目前SD模型多是基于FP16,所以40HX效率较差和出图结果与使用FP16有些许差别。
                    以下优化感谢4tzR23大佬的帖子。
                    40HX基于目前测试结果,SD1.5目前我测试的最佳跑图设置:
                    设置方法就是修改源码及加参数--no-half --no-half-vae(如果使用lora和controlnet较多时还需要加--medvram),目的是关闭半精度设置以单精度为主的混合精度模式,载入显存模型是fp16,但计算以fp32为主。在SD根目录下modules\devices.py的最后一行,将return torch.autocast ("cuda")改为torch.autocast("cuda", dtype=torch.float32, enabled=True),这样启动显存占用减半
                    跑第一次图慢一点,第二次就好多了。


                    IP属地:四川来自Android客户端10楼2025-05-08 13:10
                    回复