找回密码
 骑士注册

QQ登录

微博登录


相关文章

  • 后Hadoop时代的大数据架构

    提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多东西发生了变化,版本也从0.x 进化到目前的2.6版本。我把2012年后定义成后Hadoop平台时代,这不是说不用Hadoop,而是像NoSQL (Not Only SQL)那样,有其他的选型补充。我在知乎上也写过Hadoop的一些入门文章 如何学习Hadoop - 董飞的回答,为了给大家有个铺垫,简单讲一些相关开源组件。

    2015-04-23 09:23     董飞

  • Hadoop和大数据:60款顶级开源工具

    说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱。弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,100%的大公司会采用Hadoop。Market Research的一份报告预测,到2011年,Hadoop市场会以58%的年复合增长率(CAGR)高速增长;到2020年,市场产值会超过10亿美元。IBM更是非常看好开源大数据工具,派出了3500名研究人员开发Apache Spark,这个工具是Hadoop生态系统的一部分。 这回我们推出了最新的顶级开源大数据工具排行榜。这个领域最近方兴未艾,许多新项目纷纷启动。许多最知名的项目由A

    2015-08-11 09:31     Cynthia Harvey, 布加迪

  • 构建你的数据科学作品集:机器学习项目

    数据科学公司在决定雇佣时越来越关注你在数据科学方面的作品集。这其中的一个原因是,这样的作品集是判断某人的实际技能的最好的方法。好消息是构建这样的作品集完全要看你自己。只要你在这方面付出了努力,你一定可以取得让这些公司钦佩的作品集。

    2016-10-28 10:21     Vik Paruchuri, kokialoves, zky001, vim-kakali, cposture, ideas4u

  • 大数据工具比较:R 语言和 Spark 谁更胜一筹?

    本文有两重目的,一是在性能方面快速对比下R语言和Spark,二是想向大家介绍下Spark的机器学习库。 背景介绍 由于R语言本身是单线程的,所以可能从性能方面对比Spark和R并不是很明智的做法。即使这种比较不是很理想,但是对于那些曾经遇到过这些问题的人,下文中的一些数字一定会让你很感兴趣。 你是否曾把一个机器学习的问题丢到R里运行,然后等上好几个小时?而仅仅是因为没有可行的替代方式,你只能耐心地等。所以是时候去看看Spark的机器学习了,它包含R语言大部分的功能,并且在数据转换和性能上优于R语言。 曾经我尝试过利用不同的机

    2015-12-08 10:04     Vivek Murugesan, 冷逸

  • 这 9 个关键字,妹子和你聊聊 2015 年的大数据

    2015年,大数据市场的发展迅猛,放眼国际,总体市场规模持续增加,随着人工智能、物联网的发展,几乎所有人将目光瞄准了数据产生的价值。行业厂商 Cloudera、DataStax 以及 DataGravity 等大数据公司已经投入大量资金研发相关技术,Hadoop 供应商 Hortonworks 与数据分析公司 New Relic 甚至已经上市。而国内,国家也将大数据纳入国策。 数梦工场邀请专家和您聊聊 2015 年大数据行业九大关键词,管窥这一年行业内的发展。 战略:国家政策 今年中国政府对于大数据发展不断发文并推进,这标志着大数据已被国家政府纳入创新战略层面,成为国

    2015-12-30 17:30     大白

  • 极客漫画:大数据婚姻

    单身的时候,自己的生活过的清净而惬意。一旦你结了婚,你的妻子为了生活而忙碌,便开始关注生活中的点点滴滴,会给你说大量的话,传递大量的信息,这何尝不是一种“大数据”呢?

    2017-05-04 14:33     Daniel Stori, Bestony

  • 大数据探索:在树莓派上通过 Apache Spark on YARN 搭建 Hadoop 集群

    今天我将向你展示对大数据的一点探索,不过有点变化,使用的是全世界最流行的微型电脑————树莓派

    2017-05-07 09:27     Pk, sfantree

  • 让大数据运转更快:MemSQL推出完全免费的社区版

    大数据的兴起,为数据库实时汇总和报告信息带来了巨大的压力。为此,实时数据库专家MemSQL发布了最新版本,以进一步提升这款面向企业的实时数据库解决方案。MemSQL 4能够快速响应,并提升物联网、金融服务、以及移动应用等领域的业务表现。更给力的是,MemSQL推出了一个全新的社区版本,并将之免费提供给全球用户。

    2015-05-22 08:46     

  • Apache Spark 不过时的六大理由

    在极短的时间内,Apache Spark 迅速成长为大数据分析的技术核心。这就使得保守派担心在这个技术更新如此之快的年代它是否会同样快的被淘汰呢。我反而却坚信,spark仅仅是崭露头角。 在过去的几年时间,随着Hadoop技术爆炸和大数据逐渐占据主流地位,几件事情逐渐明晰: 对所有数据而言,Hadoop分布式文件系统(HDFS)是一个直接存储平台。 YARN(负责资源分配和管理)是大数据环境下一个适用的架构。 或许是最为重要的一点,目前并不存在一个能解决所有问题的框架结构。尽管MapReduce是一项非常了不起的技术,但是它仍不能解决所有问题。

    2015-08-27 10:09     Peter Schlampp, 刘崇鑫

  • Cassandra 和 Spark 数据处理一窥

    Apache Cassandra 数据库近来引起了很多的兴趣,这主要源于现代云端软件对于可用性及性能方面的要求。

    2016-07-17 17:35     Jon Haddad, KevinSJ

12下一页
返回顶部

分享到微信

打开微信,点击顶部的“╋”,
使用“扫一扫”将网页分享至微信。