王旭:Docker的核心是什么?

2015-05-06 12:47


不久前Docker刚刚完成了9500万美元的新一轮投资,市场估值已经达到10亿美金,而到目前为止Docker还没有真正的商业产品,那么为什么Docker这么火呢?针对这个问题,DVM创始人兼CTO王旭给出了专业的解答。

在基础技术创业这个圈子里,Docker算是最火的独角兽了。不久前Docker刚刚完成了9500万美元的新一轮投资。要知道Docker是个纯开源,完全底层Building Block的技术,而且到目前为止Docker还没有真正的商业产品。

那么, 究竟什么让Docker这么火呢?

大家都知道:

Docker = LXC + AUFS

从一方面看,Docker从诞生至今都定位于Container之上,那么Docker的核心是Container么?而从另一方面,Docker在标准的LXC之上又融合AUFS这样的分层镜像管理机制,那么AUFS是Docker的核心?

话还是从我们的DVM项目说起吧。DVM是一个混合了Hypervisor(虚拟化)和Docker的开源项目。你可以使用DVM在物理机上启动任何Docker镜像。不同之处是,DVM没有使用LXC,而是使用了Hypervisor (KVM, Xen, ESX),创建了一个VM来运行Docker镜像。

乍听起来,DVM有点像基于VM运行的CoreOS或者RancherOS。但实际上,DVM的虚机内部不是一个完整操作系统(CoreOS虽然精简,但仍然是个完整的OS)。DVM的虚机内部只有一个Linux Kernel。而这个kernel会从物理机的硬盘上加载并运行Docker镜像。更重要的是:DVM创建VM的时候,由于这个kernel能在毫秒级完成启动,所以使用DVM启动Docker镜像的耗时跟LXC相差无几。

而从运行性能看,虚拟化的性能虽然有一定损失,但差距并不是太大:

  • CPU性能相比物理机只有0.5-2%的损失
  • 内存消耗比LXC多10MB
  • 磁盘和网络性能,在云环境下由于SDN和分布式存储的原因,DVM也和LXC非常接近

既然DVM可以使用虚拟机直接启动Docker镜像,而且性能接近Container,那么Container就不是Docker运行的唯一选择,因此也就不是Docker的核心。

再来看AUFS,第一次看到Docker的时候,大家都被它类似于Git的镜像管理流程吸引。不过仔细想想,这个功能更多的被用来实现增量部署更新。而从"集装箱化"这个角度,AUFS并没有直接的关系。作为例子,CoreOS的Rocket并未采用类似的分层文件系统技术。另一方面,传统虚拟机镜像也能结合AUFS达到类似的效果。那么为什么虚拟化厂商之前没有想到类似Docker的idea呢?

原因很简单,Docker的真正核心在于:

它抛弃传统VM试图模拟完整机器的思路,而是以应用为单元进行"集装封箱"

这样做的好处主要有两个: 

  1. 加快启动速度:我们知道,为了兼容性,通用性的考虑,虚拟化厂商无法对OS进行优化。传统VM启动之所以慢,很大程度是因为OS启动耗时。反观Docker,由于只考虑应用本身,当Docker镜像启动时就可以做到心无杂念,自然也就快。
  2. 精简镜像:从技术角度来说,AUFS也可以应用在VM的镜像(qcow2)。但由于VM面向的是完整的OS,其中包含了各种服务,导致VM镜像一般体积较大(GB),不方便交付和部署。而Docker不关心完整的OS,只包含应用运行所需的最小集合,因此镜像体积只有200-300MB,大大缩短了镜像的下载时间。

说到这里,你可以看到"面向应用"是Docker最核心的理念。那自然而然的问题是:

既然Docker已经证明我们不需要完整的OS,那我们是否还需要一个完整的Kernel?

在DVM项目里,我们开发了一个HyperKernel, 它非常精简,资源占用极低,不过它仍然是个通用的Linux内核,仍然存在大量的简化,重构的空间。我们可不可以大胆想象,HyperKernel在未来会不会进化为一个专用的,极简的内核?

于是,我们成立了一家startup,而在5.1之后DVM也即将开源。我们希望能推动Kernel,Hypervisor,Docker技术的发展,并打造新一代Kernel Distro,也很期待有一样理想的“内核er”们的加入!