驳《国产龙芯究竟水平如何?》
| 2015-04-06 21:45 评论: 32
编者按:《国产龙芯究竟水平如何?》(原文来自雷锋网)发布后,引来了不少争论,这里转载 常逛大漩涡哪有不栽坑 的一篇驳斥文章(原文)分享给大家(略有错别字和语气调整)。我们相信,这篇文章不会终结关于龙芯的争论,是与非只有通过抽丝剥茧披露更多的信息,公正的看待才能接近真相。
此文充满误导性和选择性的数据和误导性的解读。虽然这个文章可以让99.9%的一般人认为中国搞了这么多年就搞一个手机芯片都不如的垃圾出来。
首先文章中几个基本的错误:
三个测试数据中唯一一个使用的是龙芯3b的成绩(编者注:此处原文及下面所写的龙芯2b,应该是3b误写为2b,径改)
测试结果如上 选择测试项目是SPEC_INT,也就是整数通用计算性能
龙芯3b频率 1.2ghz,龙芯3b的设计是 一款256bit浮点 全速64位FPU并行设计的矢量计算CPU 主要面向科学计算和浮点计算的超算CPU。而整数执行管线部分继承的是2008年设计的龙芯3A的部分
拿向量计算型的CPU的整数性能去和通用计算CPU去比? 为什么跑SPEC 只选整数部分故意不提SPEC_fp浮点计算部分的成绩? 因为它列举的这些芯片SPEC_fp测试成绩连龙芯3b边都摸不到的原因吗?
龙芯3B 1Ghz下 实测122Gflops。它选取的对比芯片跑浮点什么成绩? 就是i7 4770k 3.9ghz也就86.36Gflops 。也就是说浮点性能 i7 4770k 同频率也只有 龙芯3B-1500的 18% 接近1/5。
用浮点向量处理器去比通用处理器不合理,确实。
那么用通用计算处理器去和一个设计就是跑浮点运算的向量处理器 而且是使用8年前设计的整数执行管线的处理器 去比通用处理性能 这就是编辑所想要的对比条件?
用一个大家比较理解的一个比喻告诉大家这个测试的本质是什么?
这就是拿一辆设计上是百吨级重载卡车的东西 去和大家常用私家车去比公路上的舒适型和加速性能 这种无厘头的测试
龙芯3A是2010年正式进入投产的一款老芯片,GS464构架设计基本上2008年就完成的老构架。龙芯3A不是一款成功的产品,整数计算能力只能满足最基本的桌面应用要求。龙芯3A-1500才是龙芯3A家族的最新构架,GS464V构架,面向桌面应用和以后军队政府信息化应用的桌面级CPU。但周期不同指令类型整数管线执行效率提升2-3倍,部分指令性能提升5倍,2014年末已经在流片第一个版本阶段。
测试中使用来大量龙芯3a SPEC_int 测试成绩,然后感叹一下:
那么在2015年的今天,他们的产品究竟达到了什么水平呢?
我只能说 编辑 你要点脸好嘛? 用2008年前的构架来说2015年的水平?
龙芯小组这些年期间把工作重心刚在了众核并行构架和龙芯2B超算向CPU和龙芯2J军用加固CPU方面。
新的面向桌面定位的龙芯3A1500也已经进入流片阶段。对照上面放出的成绩我们来估算一下龙芯3A的水平。
i7 965 满载睿频3.46ghz,spec_int 成绩184 按照1ghz 性能也该是53.1。
龙芯3a 工作频率是900mhz~1Ghz,就当样品是1ghz 测试结果spec_int 25,整数性能但周期效率是 i7 965的 1/2。
那么2014年末流片的龙芯3a-1500呢?根据大部分指令效率提升2~3倍的流片测试结果看:龙芯3A-1500 1Ghz spec_int的成绩应该是 50~75之间。
这个成绩还很差么? 啧啧。
应大家的要求 列一下现有的几款超算CPU的浮点计算能力
- intel xeon phi 5110 60核 1011Gflop 225w 2013年 (intel的制造工艺是怪物 不过60核功率是225w 相当于3~4颗龙芯3b )
- 中科龙芯 龙芯2B-1500 8核 192GFlop 45~85w 2013~2014
- 富士通 Sparc64 VIIIfx 8核心 128Gflops 功率? 2009
- IBM CELL BE 9核心 192Gflops 2007年发布 但是因为功耗太高 实际获得性能效率太低 cell项目已经死了
- 江南计算所 申威-1600 140Gflops 16核心 45~75w 2011年
曙光已经在部署新一代基于龙芯3B家族的全国产CPU超算,当龙芯3B方案的超级计算机排名刷榜的时候,看看这个编辑还有没有脸来提手机芯片都不如?有本事编辑用高大上的手机芯片来超算排行刷榜吧。
- 来自 - 浙江杭州 的 Chrome/Linux 用户 2015-04-11 14:42 12 赞 回复
- 我这个人比较实在,你整一块出来给消费者用,消费者用得好,市场能接受, 你就赢了。 别在这里扯这一些乱七八糟的东西,找理由,找接口,捞偏门,是没用的,你也只能沉浸在自己的世界里。
- [1]海南小蟋蟀 发表于 2015-04-07 19:37 的评论:既然是用了“驳”字,也麻烦多点诚意来驳,就跟原来一样上几张图,几个数据,就重新反驳了。跑分,测试这些乱七八糟的,一般用户看不懂有什么意义。如果龙芯真的水平不错了,为什么市场不普及。用户会用脚投票!
如果作者能够拿出真实例子,真实运行视频来说,那自然谁都会心服口服。但是能拿出来吗?简单几句话就可以掩盖龙芯的失败?
我对龙芯黑是源于之前看过的一个视频,视频里面,一台龙芯笔记本,打开一个word文档,大家猜用了多久?5分钟!整整5分钟word文档才被缓慢的打开,然后是打字,我的天,字符输出的速度简直比用脚写字还慢,最后还演示了拖动窗体,然后就是一大片的残影停留在屏幕上。这就是龙芯的计算力!说是比手机芯片还弱有什么不可以,现在中高端配置的手机哪个不可以流畅开word文档。
既然说道了通用计算CPU,通用计算CPU的复杂度难道还不远超其他类型的CPU吗?i7都敢拿出来提,AMD都不敢抬头仰望,拿龙芯来比?英特尔的制程已经14纳米了,14纳米!AMD还停留在28纳米,谁的技术先进?制程的提升才是最难的好不好,AMD预计还要两三年才能进化到20纳米,到时候英特尔都10纳米,7纳米了,手机处理器都能跑英雄联盟了!TDP降到1W都不是没有可能的事情。
人类[2]来自 - 北京 的 Chrome/Windows 用户 发表于 2015-04-09 12:26 的评论:外行大喷子 - 海南小蟋蟀 2015-04-10 22:46 1 赞 回复
- 内行 你好
- [1]老沙 发表于 2015-04-06 23:02 的评论:无论如何,龙芯距离成功还有段距离。我说的不仅仅是技术上的,而是客户认可度上的。Intel的技术是不是很优秀都有争议,ARM和GPU之类也各有千秋,但是大家都认可Intel,这就是成功。龙芯现在需要做的,一是继续提高性能,降低功耗,就像其它厂商一样,二是扩展周边,如果没有合适的OS和应用,再好的CPU也没法普及[2]来自 - 黑龙江哈尔滨 的 Firefox/Windows 用户 发表于 2015-04-07 01:31 的评论:intel的tick-tock路线图早已深入人心,跟它比市场就是作死,AMD尚且被打的满地找牙。龙芯的出现绕不开军方背景,首先解决的就是国家的核心IT安全问题,先解决有无再谈好坏向来是中国军工发展的特点,我觉得有无的问题解决了,可堪一用,这就是成功。[3]老沙 发表于 2015-04-07 08:23 的评论:有道理,确实是要先迈出第一步再说以后的事情。我们领导就喜欢说:先解决有没有,在解决好不好的问题。[4]pumpkin 发表于 2015-04-08 16:32 的评论:你们领导一定也是政工干部出来的,哈哈!
- 老沙 2015-04-08 19:17 7 赞 回复
- 我们领导做技术出身的,后来上的行政岗位。我觉得挺有道理,要是什么都想一次做完,那任务量能把人吓退的
- [1]海南小蟋蟀 发表于 2015-04-07 19:45 的评论:补充一点,作者竟然敢说别人偷换概念,作者文中大量强调CPU的浮点计算能力,看到这都快崩溃了。通用型计算CPU浮点计算根本就不是主打,日常数据计算大部分都是整型,另外除了整型,浮点,还有逻辑运算,缓存读取等等。如果英特尔想搞浮点运算,这能秒出龙芯几百倍。浮点运算主要运用是在游戏中,游戏是非常特殊的应用程序,里面大量的数学公式,尤其是光线,阴影,三维空间运算等等,所以显卡被设计成拥有变态的浮点运算能力。龙芯不是要比浮点吗,去跟显卡比呀,谁秒谁!几年前的的显卡都秒了你![2]来自 - 广东深圳 的 Chrome/Windows 用户 发表于 2015-04-07 20:29 的评论:你认真看了别人的文章没有啊?人家说的很清楚了,龙芯是做科学计算用的,以浮点运算为主。有人偏要拿它不擅长的整数运算来证明龙芯是垃圾,那么我们是不是也可以拿龙芯擅长的浮点运算说那些处理器也是垃圾呢?
显卡的浮点运算是很快,可惜只能做图像处理,不是通用的,而龙芯是通用的浮点单元,这是科学计算所必须的,两者没有可比性。不要拿没有可比性的东西来对比,否则结论是荒谬的。 - 海南小蟋蟀 2015-04-08 18:19 5 赞 回复
-
我认真看了批判龙芯的文章,但没有认真看这篇文章。
显卡只能做图形运算?大学计算机基础教育——图形学,有shader编程,可以去百度一下打自己脸。
NV在推通用计算,GPU完全可以进行通用计算来减轻CPU的运算压力。游戏中大量的物理运算都已经是用GPU来运算实现,英伟达的这项技术叫物理加速,详情去百度。
再说龙芯的浮点计算很强了?哪怕是像这篇文章里说的,也只是比一般的CPU稍好点,而且还是理论数据。这样的浮点运算能力也能做科学运算?如果要用龙芯,那么科学家还不如去买几块显卡来算,性能几百倍
- [1]来自 - 北京 的 Chrome/Windows 用户 发表于 2015-04-06 21:49 的评论:飙浮点请和NV的GPU比.和CPU比浮点这不搞笑.[2]来自 - 广东深圳 的 Chrome/Windows 用户 发表于 2015-04-07 20:42 的评论:龙芯的浮点单元是通用的,NV的GPU不是通用的,没有可比性,一点不搞笑。
- 海南小蟋蟀 2015-04-08 18:14 赞 回复
- NV的GPU是可以通用计算的好不好,说结论前最好自己去百度一下。一般大学里的图形课都会有shader编程,就是用GPU而不是CPU计算,浮点计算能力极快!所以才有显卡挖矿这一说。
- [1]海南小蟋蟀 发表于 2015-04-07 19:37 的评论:既然是用了“驳”字,也麻烦多点诚意来驳,就跟原来一样上几张图,几个数据,就重新反驳了。跑分,测试这些乱七八糟的,一般用户看不懂有什么意义。如果龙芯真的水平不错了,为什么市场不普及。用户会用脚投票!
如果作者能够拿出真实例子,真实运行视频来说,那自然谁都会心服口服。但是能拿出来吗?简单几句话就可以掩盖龙芯的失败?
我对龙芯黑是源于之前看过的一个视频,视频里面,一台龙芯笔记本,打开一个word文档,大家猜用了多久?5分钟!整整5分钟word文档才被缓慢的打开,然后是打字,我的天,字符输出的速度简直比用脚写字还慢,最后还演示了拖动窗体,然后就是一大片的残影停留在屏幕上。这就是龙芯的计算力!说是比手机芯片还弱有什么不可以,现在中高端配置的手机哪个不可以流畅开word文档。
既然说道了通用计算CPU,通用计算CPU的复杂度难道还不远超其他类型的CPU吗?i7都敢拿出来提,AMD都不敢抬头仰望,拿龙芯来比?英特尔的制程已经14纳米了,14纳米!AMD还停留在28纳米,谁的技术先进?制程的提升才是最难的好不好,AMD预计还要两三年才能进化到20纳米,到时候英特尔都10纳米,7纳米了,手机处理器都能跑英雄联盟了!TDP降到1W都不是没有可能的事情。
人类[2]来自 - 广东深圳 的 Chrome/Windows 用户 发表于 2015-04-07 20:40 的评论:龙芯只能用linux,linux上面没有word,那是windows上才有的软件。
龙芯有好几种型号,别拿笔记本上的龙芯2来说事,龙芯3B才是最高档次的。
正因为你们普通人看不懂,所以才容易被忽悠。水平和市场是两回事,水平相对单纯点,跑个测试程序就能看出来,市场要的是性价比、软件兼容性。如果龙芯的性能世界第一,价格几万块,不能兼容windows,你买吗?可能你觉得是吹牛,那就用IBM的power7吧,它的性能也是世界数一数二的,只能用在服务器上,跑的是linux,你会买吗? - 海南小蟋蟀 2015-04-08 18:09 8 赞 回复
-
就是会预料到有人拿word来说事,所以专门没有写office,而是写的word。word文档和office不是一个概念好吗?linux不能运行word?问这个问题之前,请先自己去百度。
OK,龙芯强调浮点运算是吧,今天上一篇批判龙芯的作者又发了后续,专门写了龙芯的真实浮点运算能力,实际成绩只有理论的是二十分之一不到!连5年前的赛扬都比不上。那作者还专门列出了龙芯的内存访问性能,作为内存的读取,跟SSD的缓存速度差不多,还要继续说国货骄傲吗?混钱的项目,混不出真正的民族自尊心。
- [1]来自 - 陕西西安 的 Chrome/Windows 用户 发表于 2015-04-08 08:29 的评论:龙芯好,好到连中国的计算机里面都没有装上。两弹一星的先辈,从一穷二白的基础开始,15年时间,原子弹成功了。龙芯15年成就呢,敢拍着胸脯说:“全国产”?我认为技术管理不行,向管理两弹一星的张爱萍将军学习。你们才行。
- pumpkin 2015-04-08 16:17 3 赞 回复
- 其实最主要的是cpu已经垄断了,不是说你CPU做出来了就可以直接上市,还有驱动硬件的支持,你的驱动不兼容怎么搞呢,英特尔的移动cpu不同样是因为各种软硬件不兼容,至今还在砸钱呢,搞不过高通和htk,这有什么办法呢,应该走服务器路线,这样自己配的服务器减少兼容性的成本
- 来自 - 云南昆明 的 Mozilla/Mac 用户 2015-04-08 16:01 1 赞 回复
- 10多年了,都没能在市场上冒出个泡,而且还是在大天朝这个处处行政垄断的神奇国度,一句话,这就是骗钱的垃圾货
- [1]老沙 发表于 2015-04-06 23:02 的评论:无论如何,龙芯距离成功还有段距离。我说的不仅仅是技术上的,而是客户认可度上的。Intel的技术是不是很优秀都有争议,ARM和GPU之类也各有千秋,但是大家都认可Intel,这就是成功。龙芯现在需要做的,一是继续提高性能,降低功耗,就像其它厂商一样,二是扩展周边,如果没有合适的OS和应用,再好的CPU也没法普及[2]来自 - 黑龙江哈尔滨 的 Firefox/Windows 用户 发表于 2015-04-07 01:31 的评论:intel的tick-tock路线图早已深入人心,跟它比市场就是作死,AMD尚且被打的满地找牙。龙芯的出现绕不开军方背景,首先解决的就是国家的核心IT安全问题,先解决有无再谈好坏向来是中国军工发展的特点,我觉得有无的问题解决了,可堪一用,这就是成功。[3]老沙 发表于 2015-04-07 08:23 的评论:有道理,确实是要先迈出第一步再说以后的事情。我们领导就喜欢说:先解决有没有,在解决好不好的问题。
- 幸运猴子 2015-04-08 08:02 2 赞 回复
- 其实我觉得龙芯可以多点详细的介绍,做一些更好的宣传。龙芯这方面的资料不怎么多啊,难免有人误解的。
- 来自 - 山东潍坊 的 Safari/Linux 用户 2015-04-07 23:28 9 赞 回复
- 原来龙芯是专注于浮点运算的通用处理器,一个处理器不可能只用浮点运算就能完成各种任务,如果觉得和通用CPU比不公平那应该去和显卡比啊,现在显卡也支持通用计算,
- [1]海南小蟋蟀 发表于 2015-04-07 19:37 的评论:既然是用了“驳”字,也麻烦多点诚意来驳,就跟原来一样上几张图,几个数据,就重新反驳了。跑分,测试这些乱七八糟的,一般用户看不懂有什么意义。如果龙芯真的水平不错了,为什么市场不普及。用户会用脚投票!
如果作者能够拿出真实例子,真实运行视频来说,那自然谁都会心服口服。但是能拿出来吗?简单几句话就可以掩盖龙芯的失败?
我对龙芯黑是源于之前看过的一个视频,视频里面,一台龙芯笔记本,打开一个word文档,大家猜用了多久?5分钟!整整5分钟word文档才被缓慢的打开,然后是打字,我的天,字符输出的速度简直比用脚写字还慢,最后还演示了拖动窗体,然后就是一大片的残影停留在屏幕上。这就是龙芯的计算力!说是比手机芯片还弱有什么不可以,现在中高端配置的手机哪个不可以流畅开word文档。
既然说道了通用计算CPU,通用计算CPU的复杂度难道还不远超其他类型的CPU吗?i7都敢拿出来提,AMD都不敢抬头仰望,拿龙芯来比?英特尔的制程已经14纳米了,14纳米!AMD还停留在28纳米,谁的技术先进?制程的提升才是最难的好不好,AMD预计还要两三年才能进化到20纳米,到时候英特尔都10纳米,7纳米了,手机处理器都能跑英雄联盟了!TDP降到1W都不是没有可能的事情。
人类 - 来自 - 四川德阳 的 MSIE/Windows 用户 2015-04-07 23:09 1 赞 回复
- 嗯,是骡子是马,拉出来溜溜。没溜出来就,就继续努力。龙芯没有可溜的骡子,却总是溜广告,是个人都不得不怀疑他是一个骗钱东西。确实因特尔的胜利不完全是技术上的。不过我想放在人类历史长河中一定是最有效率的。
- [1]来自 - 浙江杭州 的 Chrome/Windows 用户 发表于 2015-04-07 08:45 的评论:傻吊,没水平就是没水平还在洗地要点脸好吗?
- 来自 - 广东深圳 的 Chrome/Windows 用户 2015-04-07 19:36 2 赞 回复
- 你分得清楚讲道理和洗地的区别吗,喷子。
- softpaopao 2015-04-07 15:05 3 赞 回复
- 不看不知道。。。这下长知识了