热门关键词:爱游戏,爱游戏登录,爱游戏app,爱游戏官网  
当前位置:首页 > 企业新闻
“吓人技术”到底是个啥?华为GPUTurbo两大流言深度辨析_爱游戏app
2021-08-19 [20319]
本文摘要:GPUTurbo自6月荣光Play和荣光9i发表会以恐怖不赔偿生命的姿态登场以来,不怕死的人们带着瓜子饮料矿泉水的长椅在城外有三楼以外的三楼,暂时流言四起。

GPUTurbo自6月荣光Play和荣光9i发表会以恐怖不赔偿生命的姿态登场以来,不怕死的人们带着瓜子饮料矿泉水的长椅在城外有三楼以外的三楼,暂时流言四起。其中,有些低级谣言一眼就能看出真伪,有些谣言利用人的心理,故意不知道高深,所以打倒也记得。

但是,这些不能相信,可靠的人百里无一。今天以后和大家一起,分析玩家传达的两个类似的传闻。GPUTurbo只是花钱优化吗?GPUTurbo发表后,馀承东回答说,GPUTurbo技术在提高GPU处理性能60%的同时(注意同时)也可以减少GPU的功耗30%。Really?业绩提升60%,耗电减少30%,居然提升不可思议!笔者的反应是,手中的荣耀9不能慢慢掌握哦~为了检查官宣的真实性,我们不参考安卓测试,简单蛮横地辨别。

测试中搭载麒麟970的华为Mate10取得了37.66fps的成绩,在此基础上提高60%的应该是60.26fps的消耗电力为6.33W,在此基础上减少30%的应该是4.43W。因此,根据官方宣传的数据,麒麟970在GPUTurbo保护后,GPU的性能必须完全保持平龙845,GPU的功耗比小龙845高,对应的功耗比为13.60fps/W,小龙845的三星S9这样的计算结果很幸福,但从性能上看,只能追上小龙845,明显接近秒杀和胜利。功耗仅下降到4.43W,就足以完全避免频率下降(比4.43W低的小龙821、820、835也下降)。

爱游戏登录

这件事很有趣。根据发表会上的现场展示和之后的媒体铺天盖地的算,GPUTurbo显然提高了麒麟970的游戏性能和功耗痉挛,事实胜于雄辩,测试结果比理论推算的成绩好。此时,华为官方公开发表的GPUTurbo明确提出了支援游戏列表,首次优化的游戏有6种,分别是王者的荣耀QQ飞车通过前线性刺激战场全军迎击荒野行动。眼睛明亮的人一看,这6个游戏中,腾讯系产品中有5个,只1个是网易。

腾讯系的游戏是典型的收费优化,尼克花钱的话,蓝绿工厂的小龙660可以秒杀其他品牌的小龙845。不是华为想再开一次吗?你想给腾讯里斯钱吗?实质上,对游戏行业和公司有点了解的朋友,这种说法基本上相当于出租车司机谈内参新闻,听起来很有力,但不符合常识和逻辑。华为与腾讯的合作远远密切于外界想象。

从2017年12月2日起,华为和腾讯正式成立了领先实验室,用于交流和实时日常技术的升级和优化。看起来像性刺激战场这样的头部产品的改版,华为派工程师驻场,确保手机和游戏之间更加兼容,优化双方用户业务在线后的体验。

因此,GPUTurbo只是华为花钱买优化这个流言蜚语,只需要稍微了解一下,然后就需要打印fake的标签扔进垃圾堆。但是,这也带来了新的问题。

GPUTurbo既然不花钱优化,华为是怎么做到的呢?这需要理解麒麟970的硬件设计。华为对GPU做了什么?根据海外网站techinsights对三星Exynos的x射线投影照片,Exynos9810芯片面积为10.37mm*11.47mm=118.94mm,其中三星自主设计的猫鼠狼M3大核心集群面积为20.23mm,CortexA55小核心集群面积为1.87mm,Malig72MP8Exynos9810的x射线透视图根据透视图显示的核心内模块的比例,可以大致计算出Exynos9810中单个MalioG72的面积约为1.072mm。根据techinsights的研究数据,麒麟970的芯片面积为9.75mm*9.92mm=96.72mm,其中CortexA73的核集群面积为5.66mm,Cortex的A53的核集群面积为2.45mm,Mali的G72MP12的GPU集群面积为18.04mmm。麒麟970的x射线透视图在某种程度上,可以根据透视图上显示的核心内模块的比例大致计算出麒麟970中单个Malig72的面积约为1.344mm,比Exynostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostostos据此前详细了解7nm工艺的文章数据显示,Exynos.9810用于三星10nmLPP工艺与麒麟970用于台积电10nmFF工艺在特征尺寸和晶体管密度等指标上完全相同。

因此,Exynos9810和麒麟970中单个MaliG72的核心形状和面积的不同,表示两者都是MaliG72的构造,但GPU内部电路的设计和投入的晶体管的规模相当不同。此外,华为在设计麒麟970时,不仅在Arm的公版Malig72上展开了非常简单的六边形,还展开了巨大的斧头改善。

减少的面积是内存吗?GPUTurbo发表后,网上发表后,中国专利发表公告网上埋入了优化核函数的方法和装置专利(许可公告号CN104866297B),围绕着这个专利进入了大脑。这些分析家指出,华为在15年后设计的麒麟芯片GPU中作为全球变量寄存器设计,为了维持专利申请前的应用,保持GPU的大外保管结构。简而言之,华为没有改变MaliG72的核心,也没有提高MaliG72的实际性能,但在GPU区域特别保管的同时,改变了数据总线,提高了MaliG72的函数数数据的读取速度和效率。

(这是分析家的各种意见,不是笔者的意见),这些分析家笑着说:GPU里你也是Cache吗?华而富人,为了想做的事,也指出华为在GPU技术上已经悬挂了NVIDIA。那么,麒麟970的MaliG72之所以因为华为在GPU减少了高速缓存吗?笔者个人指出,这种可能性不能说,但知道很小。

首先,被迫缺少这些分析家的不是寄存器和Cache(高速缓存)。在存储系统中,Register的方向比高速缓存更高,其速度比高速缓存慢,容量大为运算单元提供指令存储空间(IR)、程序计数缓冲器(PC)、累加器(ACC)等多方面的服务。

高速缓存在存储系统中位于Register之后。它有两个特点:第一,慢,速度低于Register;第二,个是极度消耗晶体管,每个bit(不是byte)需要6个晶体管。但是,根据未知的消息,世界上第一个构建高速缓存的民间级GPU是NVIDIA2001年发售的NV20,也就是Geforce3系列显示卡,在GPU内构建了128KBCache作为纹理缓存器。2004年,NVIDIA在Geforce6800Ultra的NV40中心增加了128KB的L2TextureCache,之后Geforce7800GTX的G70中心减少到了288K。

ATI方面是Radeon。1800XT的R520核心加入了原始的L2TextureCache,在Radeon上扩展到29000XT的R600核心。

Mali系列GPU从2008年Mali-400开始,已经全面加入了Cache设计。根据Arm的官方设计参数,MaliG72可以根据市场需求自己配备128KB2MB平均L2Cache。

爱游戏app

GPU设置高速缓存不是新技术,更不用说白技术了。NVIDIA、ATI、Arm等GPU设计公司从10年到20年前已经实现了。内存对GPU性能的提高有多大?以上,麒麟970中单个MaliG72的面积约为1.344mm,Exynos9810中单个MaliG72的面积约为1.072mm,根据semiwiki的资料,三星和台积电10nm工艺的晶体管密度约为55MTr/mm麒麟970MaliG72出现的这部分面积可以容纳约1500万晶体管,即使全部用于Cache也只有300KB。与Arm官方设计参数中的128KB~2MB可以裁定权利的L2Cache配置范围相比,这300KB不是很重要吗?OK,关于存储器的信息被推测到这里,几乎可以说已经被政治宣传了一半,其馀的问题是,如果麒麟970知道存储器规模扩大,GPU性能的提高有多大?为了检查这个问题,我们已经抓住了四年半的老敌人:索尼PlayStaion4和微软公司XBOXONE。

也许读者可能已经明白了这一点。毕竟,微软公司为XBOXONE处理器设计的32MBESRAM。这里不再重复这两台机器的配置。

简而言之,PS4的GPU规模更大,有1152个流处理器。XBOXONE的GPU只有768个流处理器,但微软设计了32MB的ESRAM作为缓存。

XBOXONE中Jaguar,APU的x射线透视图可以从透视图中显示,右侧的SRAM区域占有芯片整体相当大的空间,比位于中部的GPU部分大。这个32MBESRAM可以说是吞噬巨兽,消耗了16亿晶体管,XBOXONE的整个APU也只有50亿晶体管,至少ESRAM吃了三分之一。与PS4相比的结果也需要很多话。

与XBOXONE相比,PS4没有广泛相似的30%性能差异,与两者的GPU基础规模差异基本非常大,不足以证明这32MBESRAM对GPU性能的补充微乎其微。实质上,从技术角度来看,Cache多用于应对整个GPU运算系统的寄存缓冲器堵塞。其速度和延迟比寄存器差得多,但在编程环境适当处理的前提下,可以充分发挥良好的延迟掩盖。此外,Cache只用于会议GPU和RAM。

MaliG72,无法支持的阿斗在(公共编号:)之前分析过Arm的新MaliG76,MaliG71/G72的Bifrost结构使用了4宽线程粒度,比竞争对手结构的线程粒度(16~32度)多。一般来说,线程粒度体现了资源/面积密度和性能的平衡点,小的线程粒度可以节约控制逻辑单元的数量(单个32宽度线程粒度只1个控制逻辑单元,8个4宽线程粒度必须有8个控制逻辑单元)。MaliG724宽度线程粒度的设计,控制逻辑单元和ALU的比率过高,浪费了很多硬件规模,在实际游戏中完全使用了这么小的尺寸。随着技术和应用的发展和移动GPU在VR和高画质游戏领域的压力大幅减少,Quad结构的运算效率无法满足市场需求。

从Anandtech的测试可以看出,Exynos、9810的GPU虽然能源消耗率低,但最终以巨大的芯片面积交换。那个18核MaliG72的面积比高吞吐量Adreno大130%(Adrenove630面积为10.69mm),但性能比Adrenove630差。与三星的狂堆核心数相比,麒麟970只用于中等数量的核心,通过提高核心频率来获得性能。

但是,各个核心结构在某个技术下,有能源消耗比最高的频率区间,超过该区间后,接受高频需要大量的能源消耗成本。麒麟970的Mali·G72MP12频率为746MHz,耗电量下降非常明显,耗电量比仅用于Mali·G71的Exynos895略高。

结果,性能不好的黑锅还是Arm的Malig72架构设计,完全无法与高吞吐量Adreno这样的高效架构对抗。这不是一个非常简单的问题,在GPU中塞上数百KB缓存就能解决。微软公司为XBOXONE减少ESRAM的意图也不是为了填补PS4。之间有很大的GPU规模差距,在设计之初GDR5粒子的价格很高,所以微软公司不能用于DDR3的存储系统。

68GB/s比特率远于PS4的下降176GB/s,因此必须设置比特率达到216GB/s的ESRAM。GDDR5降价后,微软公司在去年推出的增强版XBOXONETOX主机上,一起ESRAM出马寸土寸金筹码。因此,GPUTurbo依赖于在GPU中设置高速缓存来提高性能的意见,可以完全宣布结束。所有华为特地公开发表失望的是,我们用数字爱好者唯一的平凡科学知识分析了这么长时间,不能攻下上述两个谣言,石锤GPU的Turbo是什么?但是,这是华为的独门白科学技术,总是对同行的罗永浩也表示赞赏,其技术水平和可玩性很明显,真的很奇怪能让我们五六千字鸡变得干净。

但是,在华为至今为止的EMUI公开课上,华为消费者业务软件工程部总裁王成录博士特意回答了GPUTurbo技术的信息,揭露了GPUTurbo谜团的一角。据说游戏画面是一帧一帧地出现的,相邻的两帧有很多完全相同的地方,GPU的Turbo技术不仅仅是图形画面变化的地方。也就是说,如果两帧之间可能有80%的画面完全一致,GPUTurbo就不会让芯片只有图形变化的20%,从而增加GPU离开80%的工作量。图形工作量的增加大大提高了下一帧的帧数延迟,用户的眼睛感到画面丢弃帧必须在16.7毫秒的时间,华为GPUTurbo可以将下一帧的图形时间控制在7毫秒以内,最慢可以在3毫秒以内完成下一帧的图形工作。

合理调整GPU资源,将GPU性能节约到游戏最需要的地方是GPUTurbo运营游戏剩馀框架的秘密。当然,王成录博士只是对GPUTurbo技术的工作原理进行了详细的回答,关于GPUTurbo是如何判断和计算两帧画面之间的差异,王成录博士没有回答,这可能是隐藏在MalionG72以上的0.272mm的商业秘密。GPUTurbo从立项到研究开发需要5年以上的时间,王成录博士对这项技术非常热情,其技术门槛非常低,其他家庭不太可能在短时间内第一次。迄今为止在国外XDA论坛上经常出现的GPUTurbo密码包也很快被证明是恶作剧,被国内数码爱好者戏称为安装x不谈基本法。

很明显,GPUTurbo的一切必须由华为特地公开发表。原始文章允许禁止发布。下一篇文章发表了注意事项。


本文关键词:爱游戏,爱游戏登录,爱游戏app,爱游戏官网

本文来源:爱游戏-www.thbyy.com