阿里云远超 Spark,取得四个全球排序基准竞赛冠军!
| 2015-10-28 17:13 评论: 7
10月28日,Sort Benchmark在官方网站公布了2015年排序竞赛的最终成绩。
阿里云飞天分布式计算系统(FuxiSort)在其含金量最高的两项比赛中,打破全部四项世界纪录。
其中,阿里云用时不到7分钟(377秒)完成100TB的数据排序,将Apache Spark的纪录23.4分钟快了三倍。
What's Sort Benchmark
Sort Benchmark是一个专门从事排序基准评估的非盈利机构。该机构每年都会举办一次排序基准评估比赛,被誉为计算界的奥运会。所以,很多公司和学术机构都会带着他们最新的研究成果来参加这个比赛,以评估他们的研究成果。
之前的排序基准评估比赛的主办和管理主要都是由Jim Gray来负责。他是数据库界的超级牛人、1998年图灵奖获得者。2007年Jim Gray海上失踪后,该机构由他过去的同僚和历届比赛冠军组成的委员会接班管理。
阿里云破四项世界纪录
Sort Benchmark的排序竞赛包含4项比赛,其中GraySort和MinuteSort主要评测计算系统的规模和效率,是4项比赛中含金量最高的两项。每一项比赛又分通用目的排序和专用目的排序两个类别。
阿里云飞天分布式计算系统,在这两项重量级测试中打破了全部4项世界纪录。
其中,GraySort通用目的排序测评,阿里云飞天成绩是377秒,也就是说1分钟能够完成15.9TB的数据排序。去年Apache Spark成绩为4.35TB/分钟。MinuteSort通用目的排序测评中,阿里云飞天的速度为7.7TB/分钟,去年冠军三星的速度为3.7TB/分钟。
阿里云的计算能力
排序是最基础的数据算法,能够反映平台的整体计算性能。100TB排序,是把1万亿条无规律的100字节纪录,严格按照从小到大的顺序排序。GraySort和MinuteSort这两类测试,充分证明了阿里云在计算方面的核心能力。
阿里云首席架构师唐洪表示:
“未来视频、音频数据、生物数据等非结构化数据将爆发式增长,我们需要在最短的时间、用最小的资源计算准确。面对大数据,如何算得快、算得准、算得起?这是未来云计算的核心能力。”
- [1]hsyan2008 [Chrome 46.0|GNU/Linux] 发表于 2015-10-29 11:20 的评论:阿里云飞天分布式计算系统开源的吗,之前的回复删掉吧,没登陆
- 刚叔叔 [Firefox 42.0|Ubuntu] 2015-11-22 12:17 4 赞 回复
- 你暴露了, 哈哈。
- 来自北京的 Chrome 46.0|Windows 7 用户 2015-10-29 20:02 1 赞 回复
-
阿里真是财大气粗,搞了3000台机器来参加这么个没啥意义的比赛,首席架构师都投入进去了,碉堡了!
百度去年拿冠军是个在百度实习的牛X的实习生根据百度当时的研究成果搞的。
- hrj294055233 [Chrome 46.0|Windows 7] 2015-10-29 11:08 4 赞 回复
- 不得不服啊