提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多东西发生了变化,版本也从0.x 进化到目前的2.6版本。我把2012年后定义成后Hadoop平台时代,这不是说不用Hadoop,而是像NoSQL (Not Only SQL)那样,有其他的选型补充。我在知乎上也写过Hadoop的一些入门文章 如何学习Hadoop - 董飞的回答,为了给大家有个铺垫,简单讲一些相关开源组件。
2015-04-23 09:23 董飞
说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱。弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,100%的大公司会采用Hadoop。Market Research的一份报告预测,到2011年,Hadoop市场会以58%的年复合增长率(CAGR)高速增长;到2020年,市场产值会超过10亿美元。IBM更是非常看好开源大数据工具,派出了3500名研究人员开发Apache Spark,这个工具是Hadoop生态系统的一部分。 这回我们推出了最新的顶级开源大数据工具排行榜。这个领域最近方兴未艾,许多新项目纷纷启动。许多最知名的项目由A
2015-08-11 09:31 Cynthia Harvey, 布加迪
Facebook的MySQL数据库,是世界上最庞大的MySQL数据库之一,在不同地区有数千个数据库服务器。因此,备份对他们来说是个巨大的挑战。为了解决这个问题,他们构建了一个高度自动化、非常有效的备份系统,每周移动多个 ...
2013-05-15 21:10
在大数据领域内,每一毫秒的性能损失都影响巨大。然而,像Python这样通常被认为性能不是太好的编程语言,在过去一年中却变得越来越流行了。大数据社区最近出现的一些文章和讨论,又一次点燃了用于数据科学以及大数据 ...
2014-01-30 08:31
大数据的出现带来了许多新的术语,但这些术语往往比较难以理解。因此,我们通过本文给出一个常用的大数据术语表,抛砖引玉,供大家深入了解。其中部分定义参考了相应的博客文章。当然,这份术语表并没有100%包含所有的术语,如果你认为有任何遗漏之处,请告之我们。 A 聚合(Aggregation) 搜索、合并、显示数据的过程 算法(Algorithms) 可以完成某种数据分析的数学公式 分析法(Analytics) 用于发现数据的内在涵义 异常检测(Anomaly detection) 在数据集中搜索与预期模式或行为不匹配的数据项。除了Anomalies,用来表示异常的词有以下
2015-02-19 22:07 小胖妞妞
文章的标题看上去很幼齿很科普,但实际上那些天天观赏大数据演讲的管理层技术小白来说,他们永远不会公开问出这个问题。 大数据是个铺天盖地的词,而谈论大数据又不可避免地要提到Hadoop,遗憾的是今天大多 ...
2013-05-30 07:24
据国外调查称:企业需要Linux的IT专业人员,而且现在需求Linux的专业人员,并且企业为了他们愿意付出更多的钱。 调查显示 本次调查了850名招聘经理和2600名Linux专业人士发现: 93%的招聘经理表示,他 ...
2013-03-08 10:34
大数据的兴起,为数据库实时汇总和报告信息带来了巨大的压力。为此,实时数据库专家MemSQL发布了最新版本,以进一步提升这款面向企业的实时数据库解决方案。MemSQL 4能够快速响应,并提升物联网、金融服务、以及移动应用等领域的业务表现。更给力的是,MemSQL推出了一个全新的社区版本,并将之免费提供给全球用户。
2015-05-22 08:46
IBM Insight 峰会今日在美国拉斯维加斯召开。在峰会中,IBM发布了名为DataWorks、dashDB和Cloudant的三款云数据服务,组成了基于云计算的、面向企业的大数据分析工具链。这三款云数据服务分别涵盖了企业大数据分析的数据准备、实时分析以及分享使用三大环节,目前已经进入IBM BlueMix云计算商店中,供企业选用。 三种云数据库服务图示 构建大数据分析工具链 据调研机构Nucleus Research今年9月的一份报告显示:在今天,企业每投入1美元到数据分析领域,将产生13美元的新价值。也就是说,在各类数据泛滥的当下,企业拥有数据分析和洞察的
2014-10-28 21:30
分享到微信
打开微信,点击顶部的“╋”,
使用“扫一扫”将网页分享至微信。