引用:
”pvr6系相对于5系,同定位的20X倍提升,其中5倍来自新架构
G6200 2 cluster
G6230 2×(2 cluster)
G6400 4 cluster
G6430 2×(4 cluster)
假设G6200最低端,100GFlops的性能,那个单个cluster能达到50G Flops
假设28nm下频率是500MHz,那么每个时钟周期100 Flops
单个ALU做一次MAD为2Flops,那么需要50个ALU
也就是说一个cluster里50个ALU, 比AMD GCN的一个CU(4×SIMD16 = 64 ALU)要少一些
如果是5系列一样的Vector4结构,那差不多是12个Vec4的SIMD,换句话说就是个“543MP3”
当然,继续用Vec4的话,肯定是不利于OpenCL的计算了,效率也不如纯标量处理器高。所以,6系列用纯标量流处理器的可能性高一点。
那么,姑且计算下,假设一个SGX6的cluster是48 ALU 或者 12 Vec4 (实际上32(2×16SIMD)或者64(4×16SIMD)的可能性更高点,48很别扭)
那么:
G6200: 2cluster, 96ALU,500MHz, 100G Flops
G6230: 2x2cluster, 192ALU,500MHz, 200G Flops
G6400: 4cluster, 192ALU,500MHz, 200G Flops
G6430: 2x4cluster, 384ALU,500MHz, 400G Flops “
1t的话,要mp2以上高频。
gt210是16个管线,589mhz,44.86gflops,带宽11.2g/s.
gt520照海育云是155.5gflops,48管线,810mhz,带宽14.1g/ s.
h训d2000的6个处理单元,650-850mhz,31.2 - 52.8 gflops,带宽17 - 21.训祖敌类放爱读倍衡3 GB / s。
hd1000就是hd20缩00的更差体质版。
单从理论性能gflops来算,一个g6230已经超过gt520,6系目前最低端的g6200是gt210,hd2000的两倍性能。
低频的hd2000也就相当目前adreno320的水平,高频的hd2000也就目前exynos5410的sgx544mp3 533mhz的水平。
实际上,由于目前手机gpu不是独立,要和cpu分享带宽,实际带宽要远少于gt210,hd2000等,导致gpu能够发挥的性能要低于理论。
根据百度笔记本吧,移动gpu天科松装色倍行套面玉梯图3.0(自行搜索),以hd4600为一倍的话,tegra3,sgx543mp2,是0.1的水平,tegra4,sgx543mp4是0.3左右的水平,gt210和hd3000是0。值杆杆胶力督灯封板历唱5倍左右。
那么g6200的100g是sgx543mp4的32g的3倍左右,即相当gt210的2倍不到,1.8倍左右的水平。
hd3000是 81,6 - 129,6 GFLOPs,12eu,850mhz,相当hd2000的2.6-2.46倍左右,即g6200 500mhz相当4-4.5倍左右(考虑到hd3000,hd2000是核芯显卡,和手机gpu一样与cpu分享带宽)。
gt610是0.较告绿和二牛也8倍,gt620就是gt510的马甲,即gt520和g6200相当甚至略弱。