aihot  2017-08-12 07:15:44  云计算 |   查看评论   
前身的微软Windows NT 也曾部援MIPSAlphaPowerPC RISC 指令集,Alpha 版的Windows NT 还有FX!32 这个x86 赢咖4平台模拟器,但随着时间流逝,只见x86 在服务器市场的版图越长越大,到今天几乎垄断整个市场的程度,这里不提Intel 还耗费很大的力气,发展今日已边缘化的IA-64Itanium)指令集。

 

  以铜为镜,可以正衣冠;以史为镜,可以知兴替;以人为镜,可以知得失;没有镜子,可以跪Google,瞧瞧过去二十多年众多RISC 服务器逐渐被x86 逐出市场的历史带给我们的殷鉴。

 

  爬文至此,恐怕义愤填膺的RISC 十字军和ARM 亲卫队准备带布袋和家伙出门堵笔者了,但改弦易辙,我们把命题改为「现有Intel AMD x86 处理器,真的是服务器与数据中心大户的最佳选择吗?」那又是另一个截然不同的冒险故事了。

 

SunThroughput Computing」的教训

 

  看着当下这些ARM 服务器芯片,大部分越看越像「更换为ARM 核心的多核心网络处理器」,就不得不重提十多年前Sun 的大冒险了:Throughput Computing 与首款产品UltraSPARC T1Niagara」,和后来因耗电量失控激增到250W 而一再改版一再延期、在Oracle 购并Sun 的关键时刻、不幸惨遭腰斩的UltraSPARC RKRock」。

 

  简而言之,Sun 既然在「传统」服务器处理器领域失去竞争力(不提一如往昔很争气的Fujitsu SPARC64,连Opteron Xeon 都足以取代后期的UltraSPARC),抓住网络云端服务开始快速扩展的关键时刻,购并了Afara Websystem,将发展重心转移至「高压力网络服务的前端」与「高密度数据处理的后端」的高吞吐量多执行绪处理器,Niagara Rock 分别对应天平两端的需求,x86 服务器产品线则填补于两者的中间,Sun 还特别提出了「CoolThreads」这个言简意赅、标榜极高电力效率的行销名词,也暗指肥大的非循序指令执行超纯量处理器是大而无当的耗电怪物。

 

  在此,提醒各位一件事:任何企业IT 应用都要软硬兼备,如果Sun 手头没有当时世界最先进的服务器作业系统Solaris 和满手的企业级赢咖4平台为后盾,CoolThreads 根本不可能有任何踏出第一步的可能性。

 

  我们先来一窥CoolThreads 首发Niagara 的概要,规格细节就不谈了,请自行Google。如其开发代号,Sun 的目标就是创造出像瀑布一样的效能吞吐量,但却以牺牲单执行绪效能「等价交换」:

  • 八核心,每个低时脉(1.2GHz)的纯量循序指令执行核心提供4 个很简单的粗质(碰到快取误失之类的长延期才会切换执行绪)执行绪,总计32执行绪,因目标需求「应该」用不太到浮点运算,整颗处理器只有一个浮点运算器。
  • 快取记忆体容量不大,但有很巨大的记忆体频宽,摆明设定的应用场景快取能够发挥的作用不会太明显。
  • 耗电量不高,仅72W

  Niagara 推出之际,Sun 不但狂抛像叶问一样厉害「一人打十人」的惊人效能测试数据与效能功耗比,台湾某本IT 周刊的某位吃不饱但也是闲闲没事干的技术编辑写篇封面故事,想测试Niagara 的能耐,找上台湾最大的电玩资讯网站,实际导入一台SunFire T2000,「一台抵十台」上线中的前端网站服务器,长达整整一周的时间,证实其惊人效能所言不假,性能表现竟然优异到网络才是最大的瓶颈。

 

  开第一枪的Niagara 规格算有点两光,后继的Niagara 2 才更能充分彰显Throughput Computing 的真正全貌:

  • 大幅强化每个核心的性能,一个核心提供两组个别被四条执行绪共用的整数逻辑运算单元,扩展成八核心64 粗质多执行绪的瀑布,也改善执行绪排程以强化单一执行绪的效率,每个核心拥有独立的浮点运算器(有没有感觉苗头开始不对了?)和加密辅助处理器,让它看起来更像如假包换的网络处理器。
  • 整合两组10GbE 网络控制器与PCIe x8 介面。
  • 聊胜于无的微幅增加快取记忆体容量。
  • 记忆体改为又贵又热的FB-DIMM 介面。
  • 因为更高的整合度,耗电量稍稍提升到95W

  问题来了,那为何后来Niagara 家族没有在市场上得到重大胜利?尚无Google 之类的云端服务业者大举导入?连前面提到的台湾最大电玩资讯网站最后也没采用?甚至为高压力网络服务的前端量身订做的特化风格,从此中止发展,整个Throughput Computing 慢慢重回更加传统的超纯量同时多执行绪非循序指令执行的过气路线?时脉与耗电量又重回了3GHz 和两百多瓦的水准?结果CoolThreads 一点都不Cool

  1. 因为这是从头全新发展的产品,为摊平研发成本,产品单价还是太高,即使你知道在特定的应用,它真的可以一人打十人。
  2. 单执行绪效率太差,作业系统太特别,降低了泛用性,代表日后想要淘汰服务器,也不容易找出从第一线退休后的第二春。
  3. 需特别为这独树一帜的「特殊番号」投入不少时间精力进行效能调校与后继维护,以前述台湾最大电玩资讯网站为例,导入上线前,光熟悉Solaris、效能调校与前导测试,就没日没夜整整花了将近一个月,早上不知吃了多少次Sun 的行销送来「赈灾」的鼎泰丰,事后也评估「产品很棒,但不那么适用」。原因很简单,套句军事用语:增加后勤负担。

  二战时的苏联规划装备笃信的原则:在能到手的武器中,挑选出最好的,型号宜少不宜多,尽量简单实用,然后大量生产。但德军就因各类武器的型号、功能与设计过于繁复,亦不乏难以供养的「超级兵器」,对后勤维护与作战部署带来诸多不便。以上的战争经验,其实对企业选择合用的服务器,也一体适用。

 

  很不幸的,针对ARM 阵营可能的突破点,Intel 策略性推出通用性还不赖、产品价格区间涵盖范围够完整、同样整合多核心多执行绪10GbE 网络与加密处理器──而且毋需操心缺乏软件与单执行绪效能不佳的问题──Xeon D(初代是Broadwell-DE)产品线,很精确的狙击到想如法炮制昔日Sun CoolThreads 策略的ARM 服务器处理器厂商,如果AMD 也「共襄盛举」推出类似的x86 芯片(AMD Sony 微软打造的游戏机芯片很有这样的味道),ARM 阵营的处境只会更加严峻,尤其缺乏服务器环境验证经验,绝对是ARM 阵营的大罩门。

 

服务反应时间就是钞票的Google

 

  电玩资讯网站顶多几十台服务器,仅导入几台SunFire T2000 这样的特殊服务器肯定不划算,但一次就部署个数千数万台,形成经济规模后,不就没这样的问题了?对,我就在讲Niagara 刚推出时,一谈到潜在大客户,几乎所有人第一时间想到的Google。近年来,一扯到ARM 服务器,众人的雷达也毫不犹豫的锁定现今云端服务的霸主。

 

  Google 就快快乐乐的导入Niagara……才怪,Google 最重视的是服务反应速度,这背后的逻辑跟不务正业推出Chrome 浏览器与积极推广高速网络有87% 相似度。你现在可能马上脑袋打结了,处理器和浏览器和建设高速网络有什么瓜葛?

 

  请先思考一下Google 的业务基础是什么。对,就是广告,Google 渴望在最短的时间内让使用其服务的人看到最多广告,也因此,他们需自行打造高效能的浏览器,并努力推广高速网络,同时也需要可缩短服务反应时间的服务器,因为对Google 而言,越短的服务反应时间,除了更好的使用者体验,更代表越多白花花的钞票。

 

  所以Google 数据中心塞满一堆Intel x86 处理器也不是令人意外的结局,而且有极高比例还是理论上延迟时间最短的单处理器平台,甚至很可能连同时多执行绪都不想打开,只为了缩短运算延迟。当年Sun 的「瀑布理论」,撞上Google 的商务模式,马上就破功了。谁说高时脉与高单执行绪效能对网络服务不重要?

 

  按照同样的「87%」逻辑,同样谣传「被导入」ARM 服务器与已经公开宣布测试IBM Power,为何Google 玩后者看起来就比较像「玩真的」?因为从来没人敢怀疑IBM Power 绝对可在很多数据处理领域提供远胜同时期Intel Xeon 的能力,不仅可拥有更多和Intel 讨价还价的筹码,Power

 

除特别注明外,本站所有文章均为 赢咖4注册 原创,转载请注明出处来自云端是未来,那ARM 在服务器市场到底有没有搞头?

留言与评论(共有 0 条评论)
   
验证码:
[lianlun]1[/lianlun]