搜索
❏ 站外平台:

驳《国产龙芯究竟水平如何?》

作者: 常逛大漩涡哪有不栽坑

| 2015-04-06 21:45   评论: 32    

编者按:《国产龙芯究竟水平如何?》(原文来自雷锋网)发布后,引来了不少争论,这里转载 常逛大漩涡哪有不栽坑 的一篇驳斥文章(原文)分享给大家(略有错别字和语气调整)。我们相信,这篇文章不会终结关于龙芯的争论,是与非只有通过抽丝剥茧披露更多的信息,公正的看待才能接近真相。

此文充满误导性和选择性的数据和误导性的解读。虽然这个文章可以让99.9%的一般人认为中国搞了这么多年就搞一个手机芯片都不如的垃圾出来。

首先文章中几个基本的错误:

三个测试数据中唯一一个使用的是龙芯3b的成绩(编者注:此处原文及下面所写的龙芯2b,应该是3b误写为2b,径改)


测试结果如上 选择测试项目是SPEC_INT,也就是整数通用计算性能

龙芯3b频率 1.2ghz,龙芯3b的设计是 一款256bit浮点 全速64位FPU并行设计的矢量计算CPU 主要面向科学计算和浮点计算的超算CPU。而整数执行管线部分继承的是2008年设计的龙芯3A的部分 

拿向量计算型的CPU的整数性能去和通用计算CPU去比? 为什么跑SPEC 只选整数部分故意不提SPEC_fp浮点计算部分的成绩? 因为它列举的这些芯片SPEC_fp测试成绩连龙芯3b边都摸不到的原因吗?


龙芯3B 1Ghz下 实测122Gflops。它选取的对比芯片跑浮点什么成绩? 就是i7 4770k 3.9ghz也就86.36Gflops 。也就是说浮点性能 i7 4770k 同频率也只有 龙芯3B-1500的 18% 接近1/5。

用浮点向量处理器去比通用处理器不合理,确实。

那么用通用计算处理器去和一个设计就是跑浮点运算的向量处理器 而且是使用8年前设计的整数执行管线的处理器 去比通用处理性能 这就是编辑所想要的对比条件?

用一个大家比较理解的一个比喻告诉大家这个测试的本质是什么?

这就是拿一辆设计上是百吨级重载卡车的东西 去和大家常用私家车去比公路上的舒适型和加速性能 这种无厘头的测试

龙芯3A是2010年正式进入投产的一款老芯片,GS464构架设计基本上2008年就完成的老构架。龙芯3A不是一款成功的产品,整数计算能力只能满足最基本的桌面应用要求。龙芯3A-1500才是龙芯3A家族的最新构架,GS464V构架,面向桌面应用和以后军队政府信息化应用的桌面级CPU。但周期不同指令类型整数管线执行效率提升2-3倍,部分指令性能提升5倍,2014年末已经在流片第一个版本阶段。

测试中使用来大量龙芯3a SPEC_int 测试成绩,然后感叹一下:

那么在2015年的今天,他们的产品究竟达到了什么水平呢?

我只能说 编辑 你要点脸好嘛? 用2008年前的构架来说2015年的水平? 

龙芯小组这些年期间把工作重心刚在了众核并行构架和龙芯2B超算向CPU和龙芯2J军用加固CPU方面。 

新的面向桌面定位的龙芯3A1500也已经进入流片阶段。对照上面放出的成绩我们来估算一下龙芯3A的水平。


i7 965 满载睿频3.46ghz,spec_int 成绩184 按照1ghz 性能也该是53.1。

龙芯3a 工作频率是900mhz~1Ghz,就当样品是1ghz 测试结果spec_int 25,整数性能但周期效率是 i7 965的 1/2。
那么2014年末流片的龙芯3a-1500呢?根据大部分指令效率提升2~3倍的流片测试结果看:龙芯3A-1500 1Ghz spec_int的成绩应该是 50~75之间。

这个成绩还很差么? 啧啧。

应大家的要求 列一下现有的几款超算CPU的浮点计算能力

  • intel xeon phi 5110 60核 1011Gflop 225w 2013年 (intel的制造工艺是怪物 不过60核功率是225w 相当于3~4颗龙芯3b )
  • 中科龙芯 龙芯2B-1500 8核 192GFlop 45~85w 2013~2014
  • 富士通 Sparc64 VIIIfx 8核心 128Gflops 功率? 2009
  • IBM CELL BE 9核心 192Gflops 2007年发布 但是因为功耗太高 实际获得性能效率太低 cell项目已经死了
  • 江南计算所 申威-1600 140Gflops 16核心 45~75w 2011年

曙光已经在部署新一代基于龙芯3B家族的全国产CPU超算,当龙芯3B方案的超级计算机排名刷榜的时候,看看这个编辑还有没有脸来提手机芯片都不如?有本事编辑用高大上的手机芯片来超算排行刷榜吧。 


返回顶部

分享到微信

打开微信,点击顶部的“╋”,
使用“扫一扫”将网页分享至微信。