联发科D1100/1200:缓存,延迟和性能
我在前面一个视频里说了,联发科可能会很带劲。哈,看样子是不行了,让我来说说这事。
这事天玑1100和1200的配置
D1100 | D1200 |
A78 3GHz *1 512KiB L2 | |
A78 2.6GHz *4 256KiB L2 | A78 2.6GHz *3 256KiB L2 |
A55 2.0GHz *4 | |
G77 MP9 | G77 MP9 OC |
4*16bit LPDDR4X 2133 |
缓存配置就三级缓存不知道。
CPU:本可以大有作为
可以知道台积电的6nm工艺基本功耗降低10%左右,在有了SS N5的A78的完整曲线以后,而且知道SS N5的功耗和TSMC N7P相似。当然是可以绘制出台积电N6的整个曲线。
但是,已知了D1100的表现之后,明显要逊于你可以想象的。这就是缓存和内存延迟的影响,所以我在这里就需要建模分析这种影响。当然这个问题实际并不困难,但是有意思的是可以帮助我理解缓存配置对DRAM bound的影响。当然,GB5的表现要好些,因为GB5对内存子系统没那么依赖。
我在这里标注了每一个关键点,和相应的可能的缓存配置和内存延迟。
可以看到,至少对于D1100,他很可能拥有2MB的三级缓存。取决于内存延迟,我觉得以联发科的以往内存性能水平,64KiB的一级缓存是更有可能的,也就是大约137ns的实现。
接下来对于D1200的缓存,有两种可能:一种是D1100本身就是屏蔽了部分三级缓存,这样最大可以拥有4MB的三级缓存,如果内存延迟和同一级缓存大小的D1100一样的话,那D1200可以拥有和K9000几乎一样的CPU性能,同时功耗略微会高一些。
可是实际,联发科,不抠门,你信么。反正联发科这种,老缩水带师,实际可能还是2MB的三级缓存。这意味着,D1200的CPU性能会略微强于E1080一点,介于865+和865之间。功耗在大约2.7W附近。这也就是说,这大核放这一带还不如870,870可以拥有和D1200几乎一致的功耗,同时性能还能很接近于4MB三级缓存的3GHz的A78。
在讲实际数据之前,可以先这么理解一下。就像我之前说的,A78和X1本身是拥有完全一样的INT/LS管线的。这两者的差距完全是由内存子系统的差距造成的,也就是A78比X1低下去的性能实际上是因为CPU后端更多的在空载造成的。
A78 CPU内的MOPs Cache和Buffer等等的缩水,本身就意味着CPU需要更加频繁的从延迟更高的缓存读写数据,而A78和X1相比,缓存都是更小的,那自然会更加频繁要从内存里读写数据。这也是这里的核心,A78相对于X1,自然更加高度的依赖缓存的配置和内存的延迟。这也会造成,A78的性能很大程度上与缓存和内存延迟相关,上下限的差距是非常大的。
这也是实际A78的缓存配置对性能的影响:
SPEC2006 INT | A78 3GHz | A78 3GHz | A78 3GHz | A77 3.2GHz |
L1 | 64KiB | 64KiB | 32KiB | 64KiB |
L2 | 512KiB | 256KiB | 256KiB | 512KiB |
L3 | 4MiB | 4MiB | 2MiB | 4MiB |
DRAM latency | ≈137ns | ≈137ns | ≈137ns | ≈139ns |
DRAM bound | ≈34% | ≈42.2% | ≈45.5% | ≈20% |
performance | 100% | 88% | 83% |
GPU:超频重置
GPU上,D1100和D1200都是和上一代D1000+一样的G77 MP9。这也就是说,基本性能全靠超频和TSMC N6降下去的10%功耗。而不管怎么样,都和865都有相当的差距,更别说865+和870。
D1000+ | D1100 @same perf.with D1000+ | SD865 | |
76 | 76 | 89 | Manhattan 3.1 |
5.4 | 4.86 | 4.2 | power |
14.07407407 | 15.63786008 | 21.19047619 | Perf./Poewer |
定位:被迫中高端
可以看出来,不管怎么样D1200几乎板上钉钉的会被870全面的压制,而870几乎就是代替刚出的时候的765G这个定位的产品。这意味着,D1200必须要安排在更低的定位,这几乎是被迫安排到了可能比刚出的天玑820略高一点的定位。
而性能上,G78相对于G77最关键就是有Async这样一个异步总线,可以预期这个总线可以提高大约8%的性能。这也使得G78MP10的E1080几乎性能和G77MP11同频是完全对位的。而只有2MB的三级缓存的D1200的缓存性能甚至会逊于E1080,即使是3GHz也不会比E1080高出多少。有了TSMC的N6,虽然功耗会更低,但是性能也不会领先太多,所以定位也不会比E1080这种高多少。
整个D1200最高的期待就是能够拥有4MB的三级缓存,如果联发科在这基础上,内存延迟还能做的更低。那D1200的大核本有能力甚至超越K9000的A77,但是现在看,这终究是那个联发科,以及这终究不是一个定位次旗舰的东西。这一点上来说,我还蛮失望的。
余生之年期待,高通不炒冷饭