❏ 站外平台:

硅谷风投最青睐的 25 个开源项目

作者: Dharmesh Thakker 等人 译者: Lambda Lab

| 2017-08-08 10:14   评论: 2    

投资过 Google,Oracle,Salesforce,Linkedin 等公司的硅谷传奇风险投资机构 Battery Ventures 在 TechCrunch 上发布了自己对热门开源项目和开源社区的研究和思考,并且从几个不同角度综合为 40 个最流行的开源项目进行了排名。

当今很多最新最热面向企业的技术核心都是免费“开源”的技术。于是很多大公司,从金融巨头到零售以及到服务公司,都把他们的业务围绕着全新的、基于社区的技术,这些技术与过去的 IT 实践有着天壤之别。

不过企业客户和投资者们要如何评估这些开源项目呢?他们如何分辨哪些项目(通常有这奇怪的名字:Ansible、Vagrant、Gradle)能产生最多的用户使用趋势?哪些被最多的软件开发者追捧,哪些又有最多的市场份额潜力?

这些问题尤其难以回答,因为大部分开源公司依然是私有公司,所以并不需要披露关键的用户和财务数据(不过这一点也正在改变,开源巨头 Cloudera 最近公布了上市计划,此举让市场更加注意开源技术)。

这也是为什么我们决定创建一个新的、详尽的指数来跟踪流行的开源软件项目,同时得到一些关于使用这些开源技术的公司的洞察。我们引入这个被称为 Battery 开源软件指数(BOSS Index)的指数,为之我们花了数月的时间将公开的信息整理好。我们希望每季度更新这个指数,而且它会随着更多的使用这些项目开源公司上市,这个指数会变得越来越准确。

该指数包含了 40 个开源项目,都是从 Github 和 Datamation 的开源项目列表中挑选出来。前 25 位在下面的表中,全部列表可以在我们的网站上找到。

我们着重关注企业级IT相关的领域,诸如IT运营,包括技术驱动的运营和服务开通系统;数据和分析,包括人工智能,机器学习和数据库的相关工具;DevOps,包括关注最新的“容器”技术趋势,这种技术可以帮助开发者在指定的环境中快速开发。

THE BATTERY OPEN-SOURCE SOFTWARE INDEX
排名 项目名 综合项目评分 领域 相关公司
1 Linux 100.00 IT Operations Red Hat, Ubuntu
2 Git 31.10 DevOps GitHub, GitLab
3 MySQL 25.23 Data & Analytics Oracle
4 Node.js 22.75 DevOps NodeSource, Rising Stack
5 Docker 22.61 DevOps Docker
6 Hadoop 16.19 Data & Analytics Cloudera, Hortonworks
7 Elasticsearch 15.72 Data & Analytics Elastic
8 Spark 14.99 Data & Analytics Databricks
9 MongoDB 14.68 Data & Analytics MongoDB
10 Selenium 12.81 DevOps Sauce Labs, BrowserStack
11 NPM 12.31 DevOps NPM
12 Redis 11.61 Data & Analytics Redis Labs
13 Tomcat 11.04 IT Operations NA
14 Jenkins 10.47 DevOps CloudBees
15 Vagrant 8.15 IT Operations HashiCorp
16 Postgres 8.02 Data & Analytics EnterpriseDB
17 Gradle 7.68 DevOps Gradle
18 Nginx 7.57 IT Operations Nginx
19 Ansible 7.42 IT Operations Ansible
20 Kafka 7.22 Data & Analytics Confluent
21 GitLab 6.42 DevOps GitLab
22 Hbase 6.41 Data & Analytics Cloudera, Hortonworks
23 Chef 6.37 IT Operations Chef*
24 TensorFlow 5.97 Data & Analytics Google
25 Cassandra 5.74 Data & Analytics DataStax

名单中有一些众所周知的名字,包括那些催生了一些大公司的项目,有 Linux,衍生出了 Red Hat;MySQL,衍生出了同名公司,这家公司后来被 Sun Microsystems 在 2008 年以 10 亿美元收购(现在被 Oracle 并购了);以及 Hadoop,衍生出了 Cloudera 和 Hortonworks。

不过也有些较为陌生的名字,比如 Selenium,也排名很高,说明在开源社区中有很多草根的创新,而且很多也在孕育新的公司。不过,我们的研究也表明,开源项目拥有很多用户并不一定代表也可以有商业上可行的公司。

我们按照以下四点为这些项目排名:

  • 公众兴趣,以 Google 搜索活动来衡量
  • 用户活跃度,以项目在注明技术讨论社区 Stack Overflow 上被提到的次数衡量
  • 职业影响力,以工作网站 IndeedSimply Hired 上提到这些开源项目的工作数量来衡量
  • 开源社区中的影响力,以项目在 Github 上的影响力来衡量。具体说,我们追踪了项目被“分支”的数量;被 Github 上标星的数量;以及被观察的数量,数据更新到 2017 年 2 月 9 日。

因为有些项目在某一点上做的极好,或者极差 - 比如有个项目有着傲视群雄的 Google 搜索数据,但是职位数量却不怎么样 - 我们去掉了每个项目最好和最差的单项得分。这种统计方法被叫做“切尾均值”,有点类似于奥运会上体操项目的打分(我们团队里并没有东德裁判,但是我们还是得小心点)。

编者注:这里原文作者提到的梗的是 1988 年汉城奥运会上美国体操队受到了来自东德的裁判的不公待遇

即便如此,我们总还是有进步的空间。有些采纳度和流行度的标准,比如下载数量,显然很难衡量,而且我们也肯定没有抓到所有的最新最热的工具。不过随着我们每季度更新数据,我们应该能捕捉到最新的行业领袖。所有我们希望慢慢能从开源社区中听取意见来提高我们的指数。如果你对指数有更好的想法欢迎邮件到 opensource@battery.com

下面是基于我们研究的一些重要的结论。

Linux、Git 和 MySQL 傲视群雄

应该不太让人惊讶,在我们的指数上夺冠的开源项目是 Linux,这个 1991 年第一次发布从此成为最被广泛采纳的开源项目之一。它被几家公司商业化了,其中包括 Red Hat,为数不多的几家上市的开源公司,以及 Ubuntu 和 SUSE。

我们的第二名 Git,激发了 Github 和 Gitlab 两家公司的出现。这个极其流行的开源项目是一种“版本控制系统”,用来追踪变动和协调软件开发者之间的工作。

高居第三位的 MySQL 是一个 1995 年开发的开源技术。MySQL 目前帮助 Google、Facebook 和 Twitter 这样的大型 Web 端产品的公司。不过要注意的是有一些“NoSQL”的项目也排名靠前。

这些 NoSQL 的技术包括 MongoDB,排名第九,正在被 Redis Labs 商业化的 Redis 排名 12;Cassandra 排名 25,被数据库公司 DataStax 所支持; ElasticSearch 在第七位,目前在被 Elastic 公司商业化。

MongoDB 在 2015 年末进行了最新一轮融资 - 公司现在估值大概是 15 亿美金 - 现在正跟像甲骨文,IBM 和微软这样的巨头在数据库领域竞争。总的来说,这几个 NoSQL 的供应商都在彼此独立的成长,而不是合并成一个大的系统。这也预示着今后数据基础架构领域会更加碎片化,几个 NoSQL 领域的强者在未来也能成为上市公司。

大数据驱动开源

随着很多机构都在努力管理海量的结构化和非机构化数据 -- 由安全软件、 tweet 到工厂中联网的传感器产生 -- 它们日益需要新的数据管理和存储系统。这个趋势在我们的 Index 中也有所体现。40 个项目中有 15 个都是帮助数据库和数据处理的项目。

前面提到的 Hadoop 就是这样的项目。另一个是被 Databricks 正在商业化的 Spark,排名第 8。

另一些值得一提的项目

Docker,容器技术领域的宠儿,能帮助软件开发更快更有效,在我们的指数中排名第五。很多人都认为 Docker 是巨头 VMware 的可能替代者,而且 Docker 能够容易又廉价的在开源社区中使用更是加速了它的采用。

Docker 也在和诸如排名第 33 的 Google 的 Kubernetes,以及软件开发中的制编配层的 Mesos 正在竞争。

另一个很热的开源方向是“持续集成和持续交付”,一种将开发的代码不断的和别的平台整合的能力。这个领域的工具包括 Jenkins,目前正被 CloudBee 商业化,以及 TravisCI。同样在 DevOps 相关的技术包括 Maven(排名 30),以及高速成长的二进制管理软件 Artifactory,正在被 JFrog 商业化。

商业化之路

正如我们之前所说,用户数量众多虽然对于最终取得商业增长至关重要,但并不一定保证开源项目就一定能变成好的商业项目。好的商业项目还需要更多的工作和创新,特别是需要创造出新的商业模式;合理利用复杂的开源许可证;对传统的企业销售时间做出适合开源项目的调整,正如我们去年在 TechCrunch 上讨论过的一样

另外,我们发现如果基于开源项目的IT企业能提供多种开源技术并且把他们组成一个技术栈,那么这些企业商业成功就会增加。比如 Elastic 就有“ELK”技术栈,包括开源的 Elasticsearch(排名第 7),Kibana(排名 36),和 Logstash(排名 29)。

时间序列数据库公司 InfluxData,类似的也有 TICK 技术栈,代表 Telegraf、InfluxDB、Chronograh 和 Kapacitor。最后一个例子是 DevOps 公司 HashiCorp,也商业化了很多开源项目,包括我们名单上的 Vagrant(排名 15)和 Vault(排名 40)。软件开发者喜欢从这些技术栈中选取他们最喜欢的组件,这也和当今软件开发领域的“最佳组合”思路相契合。

这些开源项目不再是你父辈的 Sun 或者甲骨文这样的公司。不过很清楚的一点是,跨国公司的 CIO 们,包括我们在名单里提到的一些,需要依靠这些开源技术来运行他们的技术架构,而且这些项目都是会长期存在的。确实,从我们去年举办的开源峰会来看,从高盛到 CapitalOne 的 IT 高管们都纷纷表示他们的“开源为先”态度。而随着接下来几年开源公司们纷纷上市,我们能得到更多的这些领先的项目的表现和对于产业的影响。



最新评论

来自北京的 Firefox 54.0|Windows 7 用户 2017-08-08 11:33 6 回复
啥时候,gimp inkscape也能成为硅谷最青睐的,就好了
来自湖北武汉的 Chrome 59.0|GNU/Linux 用户 2017-08-08 10:30 5 回复
棒棒棒

返回顶部

分享到微信

打开微信,点击顶部的“╋”,
使用“扫一扫”将网页分享至微信。