高通吧 关注:171,480贴子:4,116,326
  • 29回复贴,共1

苹果开发者网站昨天出了一个视频介绍dynamic cache

只看楼主收藏回复

这是m3和a17的最新特性,这两个的gpu演进到第九代。


IP属地:江苏1楼2023-11-11 19:36回复
    用cuda领域的专有名词解释就是:在苹果gpu上寄存器,share memory,L1缓存,只读缓存这几个东西全部合并了,不再有物理区分,gpu会根据应用自动分配。


    IP属地:江苏2楼2023-11-11 19:38
    回复
      同晶体管感觉没啥进步。。。a17甚至翻车了


      IP属地:江苏来自Android客户端3楼2023-11-11 19:41
      收起回复
        对于ampere架构来说,每个SM的寄存器大小是64K个32bit,L1缓存、shared memory、constant memory共享192KB


        IP属地:江苏4楼2023-11-11 19:45
        回复
          最开始,老黄家的卡也是分的很开的,到ampere这代,只有寄存器和L1缓存两个了。
          苹果更进一步,把寄存器也合并了。


          IP属地:江苏5楼2023-11-11 19:46
          回复
            在ALU方面,苹果的视频说,m3和a17支持fp32 fp16 整数三种运算同时执行。
            也就是说,对于优化好的程序来说,速度提升很大。


            IP属地:江苏6楼2023-11-11 19:47
            收起回复
              前排支持


              IP属地:上海来自Android客户端7楼2023-11-11 20:09
              回复
                主要是lds动态分配吧
                然后rc加了排序


                IP属地:中国澳门来自iPhone客户端8楼2023-11-11 20:47
                回复
                  那a17pro的gpu也是真的弱,今年的a17pro的gpu完全可以给到8核的


                  IP属地:福建来自iPhone客户端9楼2023-11-11 21:53
                  回复
                    1 :dynamic caching跟我之前猜的差不多,但没想到更进一步直接合并线程栈/寄存器/缓存。但这样延迟会变大,厨子是想用海量warp切换来掩盖延迟,为此还做到了Execute instructions from different warps
                    2 :rt core是l4的,三角与盒子求交/加速结构遍历/光线排序,结合dc一起blender渲染提升3-5倍不等。
                    3 :mesh shader加速也跟之前猜测的一样,通过在这个统一缓存上flexible更大的占用与访存优化,去缓解mesh payload因为不够存lds,导致spill到内存带来的延迟。
                    物理fp16管线又回来了,可以跟fp32/sfu/ld/st并行跑,但需要开发者自己在shader里做数据类型适配。


                    IP属地:上海来自iPhone客户端10楼2023-11-11 22:13
                    回复
                      没有吧a17好像不支持动态融合


                      IP属地:福建来自iPhone客户端11楼2023-11-11 22:19
                      收起回复
                        楼主认为本地llm达到gpt3.5水平多少参数就够了


                        IP属地:江苏来自iPhone客户端12楼2023-11-12 00:15
                        收起回复
                          大佬,我用andspec mod跑x3超大核也是显示failed to set xxxx's affinity:invalid argument,该怎么解决


                          IP属地:河南来自Android客户端13楼2024-03-23 01:27
                          回复