共计 6774 个字符,预计需要花费 17 分钟才能阅读完成。
导读 | Linux 内核是一个用 C 语言写成的,符合 POSIX 标准的类 Unix 操作系统,内核是操作系统中最基本的一部分,提供了众多应用程序访问计算机硬件的机制。Linux 内核的一大特点就是采用了整体式结构,有很多过程组成,每个过程都可以独立编译,其模块机制又湿得内核保持独立而又易于扩充。 |
Linux 发行版是在 Linux 内核的基础之上,与外带的应用软件和工具打包配置之后发行的版本。最初的 Linux 内核在 1991 年由当时还在芬兰赫尔辛基大学计算机系读书的 Linus Torvalds 开发,之后 Linus 很快聚集了大量来自其他自由软件项目的开发者和用户为 Linux 内核贡献代码。当前估计有上千开发者在为 Linux 内核贡献代码。
自 2.6.0 版本发布后,Linux 内核以 A.B.C.D 的方式命名。A 和 B 的变化可以说无关紧要,C 是内核的真实版本,每一个版本的变化都会带来新的特性。例如内部 API 的变化等等,改动的数量常常上万。D 是安全补丁和 bug 修复。如果你是 Linux 的初学者或用户,只需了解 stable 即可,它代表稳定版的内核更新。mainline 指当前的官方内核,由 Linus Torvalds 进行更新维护,由开发者们贡献的代码主要是合并到 mainline 当中。linux-next 和 snapshot 都是代码提交周期结束之前生成的快照,用于给 Linux 代码贡献者们做测试使用。目前 stable 版本的更新周期为六到十周,下一个稳定版本的 rc 基本上每周都会更新。新版本的内核分两种,一种是 Full Source 版本,完整的内核版本。比较大,一般是 tar.gz 或者.bz2 文件。另一种是 patch 文件,即补丁文件。patch 文件一般只有及时 K 到几百 K,但是对于特定的版本来说,你要找到自己对应的版本才能使用。
内核下载官网:https://www.kernel.org/
解压内核:tar xf linux-2.6.XX.tar.xz
参见 makefile menuconfig 过程讲解
生成内核模块和 vmlinuz,initrd.img,Symtem.map 文件
复制模块文件到 /lib/modules 目录下、复制 config,vmlinuz,initrd.img,Symtem.map 文件到 /boot 目录、更新 grub
make mrprobe:命令的作用是在每次配置并重新编译内核前需要先执行“make mrproper”命令清理源代码树,包括过去曾经配置的内核配置文件“.config”都将被清除。即进行新的编译工作时将原来老的配置文件给删除到,以免影响新的内核编译。
make dep:生成内核功能间的依赖关系,为编译内核做好准备。
使用 make menuconfig 生成的内核配置文件,决定将内核的各个功能系统编译进内核还是编译为模块还是不编译。
vmlinuz 是可引导的、压缩的内核,“vm”代表“Virtual Memory”。Linux 支持虚拟内存,不像老的操作系统比如 DOS 有 640KB 内存的限制,Linux 能够使用硬盘空间作为虚拟内存,因此得名“vm”。vmlinuz 是可执行的 Linux 内核,vmlinuz 的建立有两种方式:一是编译内核时通过“make zImage”创建,zImage 适用于小内核的情况,它的存在是为了向后的兼容性;二是内核编译时通过命令 make bzImage 创建,bzImage 是压缩的内核映像,需要注意,bzImage 不是用 bzip2 压缩的,bzImage 中的 bz 容易引起误解,bz 表示“big zImage”,bzImage 中的 b 是“big”意思。zImage(vmlinuz)和 bzImage(vmlinuz)都是用 gzip 压缩的。它们不仅是一个压缩文件,而且在这两个文件的开头部分内嵌有 gzip 解压缩代码,所以你不能用 gunzip 或 gzip –dc 解包 vmlinuz。内核文件中包含一个微型的 gzip 用于解压缩内核并引导它。两者的不同之处在于,老的 zImage 解压缩内核到低端内存(第一个 640K),bzImage 解压缩内核到高端内存(1M 以上)。如果内核比较小,那么可以采用 zImage 或 bzImage 之一,两种方式引导的系统运行时是相同的。大的内核采用 bzImage,不能采用 zImage。vmlinux 是未压缩的内核,vmlinuz 是 vmlinux 的压缩文件。
initrd 是“initial ramdisk”的简写。initrd 一般被用来临时的引导硬件到实际内核 vmlinuz 能够接管并继续引导的状态。比如 initrd- 2.4.7-10.img 主要是用于加载 ext3 等文件系统及 scsi 设备的驱动。如果你使用的是 scsi 硬盘,而内核 vmlinuz 中并没有这个 scsi 硬件的驱动,那么在装入 scsi 模块之前,内核不能加载根文件系统,但 scsi 模块存储在根文件系统的 /lib/modules 下。为了解决这个问题,可以引导一个能够读实际内核的 initrd 内核并用 initrd 修正 scsi 引导问题,initrd-2.4.7-10.img 是用 gzip 压缩的文件。initrd 映象文件是使用 mkinitrd 创建的,mkinitrd 实用程序能够创建 initrd 映象文件,这个命令是 RedHat 专有的,其它 Linux 发行版或许有相应的命令。这是个很方便的实用程序。具体情况请看帮助:man mkinitrd
System.map 是一个特定内核的内核符号表,由“nm vmlinux”产生并且不相关的符号被滤出。
下面几行来自 /usr/src/linux-2.4/Makefile:
nm vmlinux | grep -v '(compiled)|(.o$$)|([aUw] )|(..ng$$)|(LASH[RL]DI)' | sort > System.map
在进行程序设计时,会命名一些变量名或函数名之类的符号。Linux 内核是一个很复杂的代码块,有许许多多的全局符号,Linux 内核不使用符号名,而是通过变量或函数的地址来识别变量或函数名,比如不是使用 size_t BytesRead 这样的符号,而是像 c0343f20 这样引用这个变量。对于使用计算机的人来说,更喜欢使用那些像 size_t BytesRead 这样的名字,而不喜欢像 c0343f20 这样的名字。内核主要是用 c 写的,所以编译器 / 连接器允许我们编码时使用符号名,而内核运行时使用地址。然而,在有的情况下,我们需要知道符号的地址,或者需要知道地址对应的符号,这由符号表来完成,符号表是所有符号连同它们的地址的列表。
Linux 符号表使用到 2 个文件:/proc/ksyms、System.map。/proc/ksyms 是一个“proc file”,在内核引导时创建。实际上,它并不真正的是一个文件,它只不过是内核数据的表示,却给人们是一个磁盘文件的假象,这从它的文件大小是 0 可以看 出来。然而,System.map 是存在于你的文件系统上的实际文件。当你编译一个新内核时,各个符号名的地址要发生变化,你的老的 System.map 具有的是错误的符号信息,每次内核编译时产生一个新的 System.map,你应当用新的 System.map 来取代老的 System.map。
虽然内核本身并不真正使用 System.map,但其它程序比如 klogd,lsof 和 ps 等软件需要一个正确的 System.map。如果你使用错误的或没有 System.map,klogd 的输出将是不可靠的,这对于排除程序故障会带来困难。没有 System.map,你可能会面临一些令人烦恼的提示信息。另外少数驱动需要 System.map 来解析符号,没有为你当前运行的特定内核创建的 System.map 它们就不能正常工作。
Linux 的内核日志守护进程 klogd 为了执行名称 - 地址解析,klogd 需要使用 System.map。System.map 应当放在使用它的软件能够找到它的地方。执行:man klogd 可知,如果没有将 System.map 作为一个变量的位置给 klogd,那么它将按照下面的顺序,在三个地方查 System.map:/boot/System.map、/System.map、/usr/src/linux/System.map
System.map 也有版本信息,klogd 能够智能地查找正确的映象(map)文件。
当我们在执行 make menuconfig 这个命令时,系统到底帮我们做了哪些工作呢?这里面一共涉及到了一下几个文件我们来一一探讨
1.Linux 内核根目录下的 scripts 文件夹
2.arch/$ARCH/Kconfig 文件、各层目录下的 Kconfig 文件
3.Linux 内核根目录下的 makefile 文件、各层目录下的 makefile 文件
4.Linux 内核根目录下的的.config 文件、arch/$ARCH/configs/ 下的文件
5.Linux 内核根目录下的 include/generated/autoconf.h 文件
1)scripts 文件夹存放的是跟 make menuconfig 配置界面的图形绘制相关的文件,我们作为使用者无需关心这个文件夹的内容
2)当我们执行 make menuconfig 命令出现上述蓝色配置界面以前,系统帮我们做了以下工作:
首先系统会读取 arch/$ARCH/ 目录下的 Kconfig 文件生成整个配置界面选项(Kconfig 是整个 linux 配置机制的核心),那么 ARCH 环境变量的值等于多少呢?它是由 linux 内核根目录下的 makefile 文件决定的,在 makefile 下有此环境变量的定义:
SUBARCH := $(shell uname -m | sed -e s/i.86/i386/ -e s/sun4u/sparc64/ \
-e s/arm.*/arm/ -e s/sa110/arm/ \
-e s/s390x/s390/ -e s/parisc64/parisc/ \
-e s/ppc.*/powerpc/ -e s/mips.*/mips/ \
-e s/sh[234].*/sh/ )
..........
export KBUILD_BUILDHOST := $(SUBARCH)
ARCH ?= $(SUBARCH)
CROSS_COMPILE ?=
或者通过 make ARCH=arm menuconfig 命令来生成配置界面比如教务处进行考试,考试科数可能有外语、语文、数学等科,这里我们选择了 arm 科可进行考试,系统就会读取 arm/arm/kconfig 文件生成配置选项(选择了 arm 科的卷子),系统还提供了 x86 科、milps 科等 10 几门功课的考试题
3)假设教务处比较“仁慈”,为了怕某些同学做错试题,还给我们准备了一份参考答案(默认配置选项),存放在 arch/$ARCH/configs/ 目录下,对于 arm 科来说就是 arch/arm/configs 文件夹:
此文件夹中有许多选项,系统会读取哪个呢?内核默认会读取 linux 内核根目录下.config 文件作为内核的默认选项(试题的参考答案),我们一般会根据开发板的类型从中选取一个与我们开发板最接近的系列到 Linux 内核根目录下(选择一个最接近的参考答案)
4).config
假设教务处留了一个心眼,他提供的参考答案并不完全正确(.config 文件与我们的板子并不是完全匹配),这时我们可以选择直接修改.config 文件然后执行 make menuconfig 命令读取新的选项。但是一般我们不采取这个方案,我们选择在配置界面中通过空格、esc、回车选择某些选项选中或者不选中,最后保存退出的时候,Linux 内核会把新的选项(正确的参考答案)更新到.config 中,此时我们可以把.config 重命名为其它文件保存起来(当你执行 make distclean 时系统会把.config 文件删除),以后我们再配置内核时就不需要再去 arch/arm/configs 下考取相应的文件了,省去了重新配置的麻烦,直接将保存的.config 文件复制为.config 即可.
5)经过以上两步,我们可以正确的读取、配置我们需要的界面了,那么他们如何跟 makefile 文件建立编译关系呢?当你保存 make menuconfig 选项时,系统会除了会自动更新.config 外,还会将所有的选项以宏的形式保存在 Linux 内核根目录下的 include/generated/autoconf.h 文件下
内核中的源代码就都会包含以上.h 文件,跟宏的定义情况进行条件编译。当我们需要对一个文件整体选择如是否编译时,还需要修改对应的 makefile 文件,例如:
我们选择是否要编译 s3c2410_ts.c 这个文件时,makefile 会根据 CONFIG_TOUCHSCREEN_S3C2410 来决定是编译此文件,此宏是在 Kconfig 文件中定义,当我们配置完成后,会出现在.config 及 autconf 中,至此,我们就完成了整个 linux 内核的编译过程。最后我们会发现,整个 linux 内核配置过程中,留给用户的接口其实只有各层 Kconfig、makefile 文件以及对应的源文件。
比如我们如果想要给内核增加一个功能,并且通过 make menuconfig 控制其声称过程首先需要做的工作是:修改对应目录下的 Kconfig 文件,按照 Kconfig 语法增加对应的选项;其次执行 make menuconfig 选择编译进内核或者不编译进内核,或者编译为模块,.config 文件和 autoconf.h 文件会自动生成;最后修改对应目录下的 makefile 文件完成编译选项的添加;最后的最后执行 make 命令进行编译。
Linux 内核源码树的每个目录下都有两个文档 Kconfig 和 Makefile。分布到各目录的 Kconfig 构成了一个分布式的内核配置数据库,每个 Kconfig 分别描述了所属目录源文档相关的内核配置菜单。在执行内核配置 make menuconfig 时,从 Kconfig 中读出菜单,用户选择后保存到.config 的内核配置文档中。在内核编译时,主 Makefile 调用这 个.config,就知道了用户的选择。这个内容说明 Kconfig 就是对应着内核的每级配置菜单。
假如要想添加新的驱动到内核的源码中,要修改 Kconfig, 这样就能够选择这个驱动,假如想使这个驱动被编译,则要修改 Makefile。添加新 的驱动时需要修改的文档有两种(如果添加的只是文件,则只需修改当前层 Kconfig 和 Makefile 文件;如果添加的是目录,则需修改当前层和目录下 的共一对 Kconfig 和 Makefile)Kconfig 和 Makefile。要想知道怎么修改这两种文档,就要知道两种文档的语法结构,Kconfig 的语法参见参考文献《【linux-2.6.31】kbuild》。
Makefile 文件包含 5 部分:
Makefile 顶层的 Makefile
.config 内核配置文件
arch/$(ARCH)/Makefile 体系结构 Makefile
scripts/Makefile.* 适用于所有 kbuild Makefile 的通用规则等
kbuild Makefiles 大约有 500 个这样的文件
顶层 Makefile 读取内核配置操作产生的.config 文件,顶层 Makefile 构建两个主要的目标:vmlinux(内核映像) 和 modules(所有模块文件)。它通过递归访问内核源码树下的子目录来构建这些目标。访问哪些子目录取决于内核配置。顶层 Makefile 包含一个体系结构 Makefile, 由 arch/$(ARCH)/Makefile 指定。体系结构 Makefile 文件为顶层 Makefile 提供了特定体系结构的信息。每个子目录各有一个 kbuild 文件和 Makefile 文件来执行从上层传递下来的命令。kbuild 和 Makefile 文件利用.config 文件中的信息来构造由 kbuild 构建内建或者模块对象使用的各种文件列表。scripts/Makefile.* 包含所有的定义 / 规则, 等等。这些信息用于使用 kbuild 和 Makefile 文件来构建内核。