本书从工业需求角度出发,注重效率和实用性,是帮助内核研发及调试、驱动开发等领域工程师正确认识并高效利用Linux内核的难得佳作!
作者是腾讯公司资深的Linux内核专家和存储系统专家,在该领域工作和研究的10余年间,面试了数百位Linux内核工程师,深知学习Linux内核过程中经常遇到的困惑,以及在工作中容易犯的错误。基于这些原因作者撰写了本书。
本书出发点和写作方式可谓独辟蹊径,将Linux内核分为两个维度,一是基础部分和应用部分,二是内核架构和内核实现,将两个维有机统一,深入分析了Linux内核的文件系统、设备驱动的架构设计与实现原理。
全书在逻辑上分为三部分:
第一部分(第1~2章)首先将内核层划分为基础层和应用层,讲解了基础层包含的服务和数据结构,以及应用层包含的各种功能,然后对文件系统的架构进行了提纲挈领的介绍,为读者学习后面的知识打下基础。
第二部分(第3~9章)从设备到总线到驱动,逐步深入,剖析了设备的总体架构、为设备服务的特殊文件系统sysfs、字符设备和input设备、platform总线、serio总线、PCI总线、块设备的实现原理和工作机制。
第三部分(第10~13章)对文件系统的读写机制进行了深入分析,最后通过一个真实文件系统ext2,复习本书所有知识点。
作者:高剑林 机械工业出版社 2014年1月第1版第1次印刷 标准书号:ISBN 978-7-111-44585-2 定 价:59.00元
目前市面上关于Linux内核方面的书籍可以分为两类,一类是学院派书籍,其中比较有名的包括《深入理解Linux内核》(ULK)等;一类是国内特有的培训教材。大体而言,学院派的书籍体系一般很完整,在广度和深度上都有完善的阐述。可惜也正因为它的完整、复杂和庞大,使得阅读学院派的书籍往往是个艰巨的任务。ULK这本书已经有八百页的体量,还有很多细节知识没有讲述,而早期的《内核情景分析》一书更是达到上千页的体量。以至于业界公认内核的学习曲线最陡峭,学习难度最大。
而本书是从工业界角度出发,为工业界使用而写。比较关注计算机科学方面进展的工程师,应可以意识到计算机科学和计算机工业是两个不同的领域。前者注重创新和理论完备,后者注重效率和实用。从效率和实用的角度,需要在降低学习难度的基础上提供相对体系化的结构,这就必须对庞大复杂的内核进行分解和抽取,这也正是本书试图将内核分解为基础层和应用层的原因。
这些年来,笔者先后面试过上百位内核工程师,组织过多次讲座或者交流会议,和国内多家公司的一流工程师有过深入交流。总体而言,国内内核应用和开发的水平处于非常低的水平,这一方面表现在理解内核的技术人员在国内总体上不多,即使是专业的内核的工程师,对内核的一些基本问题理解不清甚至理解错误的也不在少数;另一方面是大多数人认为内核在工作中用处不大,很难发挥价值。
针对第一个问题,笔者做过调查问卷,通过调查发现,公认学习内核最大的问题就是内核代码的难懂和跳跃。从一个函数跳到另一个函数,然后又跳到下一个函数,对执行的逻辑难以理解。跳跃超过三次,基本就难以继续,只能放弃。第二个问题和第一个问题强相关。因为了解不够系统,很难形成整体的内核执行逻辑。而实际工作中碰到的问题总是千变万化,个人了解的一块未必能碰到。比如一个文件系统只读问题,是内核VFS层的问题?是文件系统自身?还是块设备或者硬盘的问题?如果不能形成清晰的视图,就很难有针对性的调试和改进。
按照方法论的观点,通常人类的学习过程是从易到难、从部分到整体、从已知到未知。而对内核的学习有其特殊之处,内核几乎是九十度的学习曲线,极难找到入门的路径,更别说快速流畅地阅读内核代码了。从那时起,笔者开始对内核进行整理,希望能找到一条学习的路径,在不断探索过程中,逐渐形成一份文档,然后通过一些培训活动验证了其有效,最终形成了本书。
本书可以归纳为两个思路。一个是对内核代码的分类。笔者把内核分为基础部分和应用部分。内核中的内存管理、任务调度和中断异常处理归为基础部分。而文件系统、设备管理和驱动归为应用部分。打开一份完整的内核代码统计一下,应用部分占了绝大多数,庞大复杂,但冗余很多,很多代码具有相似性;而基础部分则是短小精悍。应用部分经常要调用基础部分提供的内存管理、任务调度等服务。为了快速理解基础部分,首先要整理基础部分的服务,理解在内核中如何使用基础部分的服务。
第二个思路是把内核分为内核架构和内核实现。内核架构是内核中通用的、具普遍性的层次,比如块设备、字符设备、总线、文件系统的VFS层等。理解了内核架构,就对内核有了整体上的掌握,就能了解内核设计者的思路,进而快速流畅地阅读内核代码。但即使理解了内核架构,也还有很多具体问题要攻克。比如驱动中一个寄存器的使用、设备链路状态如何检测、文件系统如何使用barrier I/O、同步和异步I/O的区别等。这是需要开发人员仔细研读和琢磨的。本书试图归纳整理出内核的常用架构层,这些架构层具有举一反三的作用,它们构成了Linux内核的骨架。
发展到今天,内核已经非常庞大和复杂。本书希望通过一些架构层次代码的分析,结合简单的例子,帮助读者理解内核的整体框架。当碰到内核问题或者需要加入某些内核功能或者修改某些实现时,可以迅速流畅地阅读相关代码,确定自己的方案,而不至于茫然无措。而对于细节的实现,则需要程序员根据自己的需求来设计。
关于内核版本,本书用的是2.6.18版。内核有一套自己的不兼容策略,不同内核版本之间经常不能编译,至于函数消失和数据结构修改更是家常便饭。所以我们只能选择一个版本作为基础。
阅读内核代码前的准备:下载一份完整的内核,Linux内核的官方网站是http://www.kernel.org,这里可以下载到各个版本的内核;再准备一个好的代码阅读软件,因为内核代码经常要前后关联阅读,所以需要具有代码工程管理的软件,强烈推荐source insight,这是国内应用很广的一个软件。
另外,本书已经假设读者能编译和安装模块,并且具有计算机基本结构的知识。此外,有一台已安装了Linux系统的计算机或者虚拟机,并且经常实战练习。
由于笔者水平有限,而且从架构层次分析内核代码,可用来参考的资料很少,希望广大读者能多提意见,共同推进中国的技术水平。
任何书籍都不能替代读者自己对内核实际代码的研究和学习。但如果没有书籍,浩如云烟的内核代码让有志学习者茫然,而低效率地一点点啃代码也会浪费大量的时间。书籍的作用是带领读者入门,读者需要尽快转入自我学习阶段,对需要的部分代码自行分析和研究。
本书适合以下读者阅读参考:
本书将整个内核分为基础层和应用层。这种划分大大减少了阅读内核的难度,但是仍然需要对基础层有全面正确的理解。本书第1章介绍了内核的基础层,读者应该多做一些实践练习,才能加深理解。
第2章是本书提纲挈领的一章,重点介绍了文件系统的基础知识。文件系统在应用层的位置非常重要,因此只有掌握了文件系统的重要概念、理解了基本的操作过程才能为整体理解内核打下良好的基础。
第3~9章是关于设备的章节。建议读者结合具体的设备,从设备到总线再到驱动,逐步深入。本书的章节安排遵循从易到难、代码结合实例的方式,相信读者可以比较顺畅地阅读并理解。
第10~13章,再次对文件系统的读写和内核通用块层进行阐述。阅读的过程中,读者若能结合实际做一些小的程序,则可以帮助迅速提升能力。比如自己实现内核的I/O路径或者实现一个模拟的块设备系统,实践中应用才是能力提升的最佳途径。
由于笔者的水平有限,加之编写时间仓促,书中难免会出现一些错误或者不准确的地方,恳请读者批评指正。书中的全部源文件可以从华章网站下载。如果你有更多的宝贵意见,也欢迎发送邮件至邮箱easyblue99@hotmail.com,期待能够得到你们的真挚反馈。
感谢IBM公司的小强、中兴的老谢、百度的子旬、索尼的大A以及淘宝、Intel、微软、搜狐、新浪等公司的各位朋友。与你们的一次次讨论澄清了很多概念和问题,使我受益良多。
感谢机械工业出版社华章公司的编辑白宇,是你认真审核每一章的内容,提高了书稿的质量。编辑是个清苦的职业,远远谈不上令人羡慕,但不论多少生活的烦恼,白女士总是耐心修改,职业精神令人敬佩。
感谢我的亲人们,特别要感谢我的母亲,她是中国核工业的早期建设者,在艰难中养育了三个孩子,谨以此书献给我的母亲杨玉芳女士。感谢我的妻子和女儿,你们是我永远的动力之源。
样章地址: http://wenku.it168.com/d_001331586.shtml
活动时间:2014年01月23日-01月29日
活动奖品:
活动结束后,我们会评选出5位积极参与评论的网友奖励《Linux内核探秘:深入解析文件系统和设备驱动的架构与设计》图书1本。
(临近春节,所以本次图书的递送将在春节假期后进行)
活动要求:
1、 在Linux中国(http://linux.cn)对本书进行评论,要言之有物,不能低于20个字。
2、 本次话题主要关注Linux内核及相关技术的讨论,以及对本书样章内容的评论。