[精彩] linux-2.6内核升级文档(全)
作者:killua 发表于:2005-12-31 17:07:28
【发表评论】【查看原文】【Linux讨论区】【关闭】
序
做一件事情,首先要知道自己在干什么,而不是盲目得升级内核,现在升级内核有点泛滥,sigh
首先让我们先了解一下2.6内核的新特性
一、01.模块子系统(Module Subsystem)、统一设备模型(Unified Device Model)和 PnP 支持
模块子系统发生了重大变化。
02.稳定性有所提高
为了彻底避免内核加载或者导出正在被使用的内核模块,或者至少为了减少加载或者卸载模块的同时使用该模块的可能性
(这有时会导致系统崩溃),内核加载和导出内核模块的过程都得到了改进。
03.统一设备模型
统一设备模型的创建是 2.6 内核最重要的变化之一。它促进了模块接口的标准化,其目的是更好地控制和管理设备,例如:
更准确地确定系统设备。
电源管理和设备电源状态。
改进的系统总线结构管理。
04.即插即用(PnP)支持
1.1.1 和 1.1.2 小节中提及的变化使得运行 2.6 内核的 Linux 成为一个真正即插即用的 OS。
例如,对 ISA PnP 扩展、遗留 MCA 和 EISA 总线以及热插拔设备的 PnP 支持。
05.内核基础设施的变化
为了区别以 .o 为扩展名的常规对象文件,内核模块现在使用的扩展名是 .ko。
创建了新的 sysfs 文件系统,当内核发现设备树时就会描述它。
内存支持,NUMA 支持
支持更大数量的 RAM
2.6 内核支持更大数量的 RAM,在分页模式下最高可达 64GB。
06.NUMA
对非一致内核访问(Non-Uniform Memory Access - NUMA)系统的支持是 2.6 内核中新出现的。
07.线程模型,NPTL
相对于 v2.4 的 LinuxThreads,在版本 2.6 中新出现的是 NPTL(Native POSIX Threading Library)。
NPTL 为 Linux 带来了企业级线程支持,提供的性能远远超过了 LinuxThreads。它所基于的用户与内核线程的比率是 1:1。
在 2003 年 10 月,GNU C 程序库 glibc 中融入了 NPTL 支持,Red Hat 率先在 Red Hat Linux 9 和
Red Hat Enterprise Linux 中使用定制的 v2.4 内核实现了 NPTL。
08.性能改进
新的调度器算法
2.6 Linux 内核引入了新的 O(1) 算法。在高负载情况下它运行得特别好。新的调度器基于每个 CPU 来分布时间片,
这样就消除了全局同步和重新分配循环,从而提高了性能。
内核抢占(Kernel Preemption)
新的 2.6 内核是抢占式的。这将显著地提高交互式和多媒体应用程序的性能。
I/O 性能改进
Linux 的 I/O 子系统也发生了重大的变化,通过修改 I/O 调度器来确保不会有进程驻留在队列中过长时间等待进行输入/输出操作,
这样就使得 I/O 操作的响应更为迅速。
快速用户空间互斥(Fast User-Space Mutexes)
“futexes”(快速用户空间互斥)可以使线程串行化以避免竞态条件,引入它也提高了响应速度。
通过在内核空间中部分实现“futexes”以允许基于竞争设置等待任务的优先级而实现改进。
09.扩展性改进
处理器数目更多
Linux 内核 2.6 最多可以支持 64 个 CPU。支持更大的内存,归功于 PAE(物理地址扩展,Physical Address Extensions),在 32-位系统上分页模式下所支持的内存增加到了 64GB。
用户和组
惟一用户和组的数量从 65,000 增至 40 多亿,也就是从 16-位增加到了 32-位。
PID 的数量
PID 的最大数量从 32,000 增至 10 亿。
打开文件描述符的数量
打开文件描述符的数量没有增加,但是不再需要事先设置该参数,它将自行调节。
10.支持更多的设备
在 Linux 内核 2.6 之前,内核中有可以约束大型系统的限制,比如每条链 256 个设备。v2.6 内核彻底地打破了这些限制,
不但可以支持更多类型的设备,而且支持更多同类型的设备。在 Linux 2.6 系统中,可以支持 4095 种主要的设备类型,
每一个单独的类型可以有超过一百万个子设备。
文件系统大小
Linux 内核 2.6 所允许的可寻址文件系统大小最大为 16 TB。
11.文件系统
ext2、ext3 和 ReiserFS 等传统 Linux 文件系统得到了显著的改进。最值得注意的改进是扩展属性(或文件元数据)的引入。
最重要的是 POSIX ACL 的实现,这是对普通 UNIX 权限的扩展,可以支持更细化的用户访问控制。
12.除了对传统 Linux 文件系统的改进支持以外,新的内核完全支持在 Linux 中相对较新的 XFS 文件系统。
Linux 2.6 内核现在还引入了对 NTFS 文件系统的改进的支持,现在允许以读/写模式安装 NTFS 文件系统。
基于以上2.6的新特性,我决定用2.6的内核,我的系统为Red Hat Enterprise Linux AS release 3 (Taroon Update 3)
硬件环境为DELL 2850
一、下载解压并打上内核补丁
我以2.6.10为例子,patche以bk4的例子,目的只是让大家知道怎么打patch,
其实本人用的是2.6.6的内核,因为在AS3.0上升级到2.6.9以上的内核,
mount大的nfs网络硬盘时,df 显示不正确,明明是800G的盘变成4.2G,
不过还是能正常用,我升级过nfs和mount的包都没用,/var/log/message里
提示是[color=red]kernel: nfs warning: mount version older than kernel[/color],
还望知道的 告知一声,谢 :) BTW:2.6.8的内核没用过
内核源代码:
最新内核补丁:
cd /usr/src
rm -rf linux
tar jxf /download/linux-2.6.10.tar.bz2
ln -s linux-2.6.10 linux
cd linux
bunzip2 -dv /download/patch-2.6.10-bk4.bz2 |patch -p1
如果在/usr/src目录下就用patch -p0
二、修改内核源代码 (升级2.6就是为了优化,干脆连源代码也改了吧)
1.修改/usr/src/linux/include/linux/posix_types.h
设置fd_set支持的最大数量
#define __FD_SETSIZE 1024 --->; 65536
2.修改/usr/src/linux/include/linux/fs.h
设置最大打开文件数量(TCP连接数量)
#define INR_OPEN 1024 --->; 65536
#define NR_FILE 8192 --->; 65536
#define NR_RESERVED_FILES 10 --->; 128
3.修改/usr/src/linux/include/net/tcp.h
设置TIMEOUT的时间为1秒
#define TCP_TIMEWAIT_LEN (60*HZ) 60 --->; 1*HZ
设置在backlog队列里的半连接的重试次数,每次都会花相应的时间,本质上 也是减少重试时间
#define TCP_SYNACK_RETRIES 5 --->; 3
针对RHEL-AS3本来就是稳定+优化的,不过就算你用 RHEL-AS3 自己的内核,那也要修改一下上面的参数才好呀 :)
三、安装必要的工具
1.下载module-init-tools-3.1.tar.bz2
./configure --prefix=/
make moveold
make all install
./generate-modprobe.conf /etc/modprobe.conf
2.下载新的mkinitrd
ftp://195.220.108.108/linux/6/fedora/core/3/i386/os/Fedora/RPMS/mkinitrd-4.1.18-2.i386.rpm
它需要lvm2 device-mapper
ftp://195.220.108.108/linux/6/fedora/core/3/i386/os/Fedora/RPMS/device-mapper-1.00.19-2.i386.rpm
ftp://195.220.108.108/linux/6/fedora/core/3/i386/os/Fedora/RPMS/lvm2-2.00.25-1.01.i386.rpm
如果不更新这个包在make install时会提示以下错误:
No module mptbase found for kernel 2.6.10-bk4, aborting.
mkinitrd failed
make[1]: *** [install] Error 1
make: *** [install] Error 2
安装lvm2-2.00.25-1.01.i386.rpm时请用rpm -ivh --nodeps package name
四、make menuconfig
01.Code maturity level options --->;
[*] Prompt for development and/or incomplete code/drivers
[*] Select only drivers expected to compile cleanly
02.General setup --->;
[*] Support for paging of anonymous memory (swap)
[*] System V IPC
[*] POSIX Message Queues
[ ] BSD Process Accounting
[*] Sysctl support
[ ] Auditing support
[ ] Support for hot-pluggable devices
[*] Kernel Userspace Events
[ ] Kernel .config support
[*] Configure standard kernel features (for small systems) --->;
[*] Load all symbols for debugging/kksymoops
[ ] Do an extra kallsyms pass
[*] Enable futex support
[*] Enable eventpoll support
[ ] Optimize for size
[*] Use full shmem filesystem
03.Loadable module support --->;
[*] Enable loadable module support
[*] Module unloading
[ ] Forced module unloading
[ ] Module versioning support (EXPERIMENTAL)
[ ] Source checksum for all modules
[*] Automatic kernel module loading
04.Processor type and features --->;
Subarchitecture Type (PC-compatible) --->;
Processor family (Pentium-4/Celeron(P4-based)/Pentium-4 M/Xeon) --->;
[*] Generic x86 support
[ ] HPET Timer Support
[*] Symmetric multi-processing support 多CPU
(8) Maximum number of CPUs (2-255)
[*] SMT (Hyperthreading) scheduler support
[*] Preemptible Kernel 抢占式内核,请选上它
[ ] Machine Check Exception
< >; Toshiba Laptop support
< >; Dell laptop support
< >; /dev/cpu/microcode - Intel IA32 CPU microcode support
< >; /dev/cpu/*/msr - Model-specific register support
< >; /dev/cpu/*/cpuid - CPU information support
Firmware Drivers --->;
High Memory Support (4GB) --->; 高内存
[ ] Allocate 3rd-level pagetables from highmem
[ ] Math emulation
[*] MTRR (Memory Type Range Register) support
[*] Enable kernel irq balancing
[ ] Use register arguments (EXPERIMENTAL)
05.Power management options (ACPI, APM) --->; 电源管理 自定 (偶没选)
06.Bus options (PCI, PCMCIA, EISA, MCA, ISA) --->; 板卡支持 自定
[*] PCI support
PCI access mode (Any) --->;
[ ] Message Signaled Interrupts (MSI and MSI-X)
[*] Legacy /proc/pci interface
[*] PCI device name database
[ ] ISA support
[ ] MCA support
< >; NatSemi SCx200 support
07.Executable file formats --->;
[*] Kernel support for ELF binaries
; Kernel support for a.out and ECOFF binaries
; Kernel support for MISC binaries
08.Device Drivers --->; 设备驱动及网络支持
Generic Driver Options --->; 默认
[*] Select only drivers that don't need compile-time external firmware
[*] Prevent firmware from being built
Memory Technology Devices (MTD) --->; 不选
Parallel port support --->; 并行端口 自定(偶没选)
Plug and Play support --->; 支持热插拔 自定(偶没选)
Block devices --->;
<*>; Normal floppy disk support
< >; Compaq SMART2 support
< >; Compaq Smart Array 5xxx support
< >; Mylex DAC960/DAC1100 PCI RAID Controller support
< >; Micro Memory MM5415 Battery Backed RAM support (EXPERIMENTAL)
; Loopback device support
< >; Cryptoloop Support
; Network block device support
< >; Promise SATA SX8 support
; RAM disk support
(16) Default number of RAM disks
(4096) Default RAM disk size (kbytes)
() Source directory of cpio_list
[ ] Support for Large Block Devices
< >; Packet writing on CD/DVD media
IO Schedulers --->; IO调度器,都选上吧 可以在grub.conf指定用IO调度哪种方式,后面会讲的
<*>; Anticipatory I/O scheduler
<*>; Deadline I/O scheduler
<*>; CFQ I/O scheduler
ATA/ATAPI/MFM/RLL support --->; ATA设备 自定 (偶没选)
SCSI device support --->; SCSI设备 自定我有scsi的设备所以有以下选项
<*>; SCSI device support
[*] legacy /proc/scsi/ support
--- SCSI support type (disk, tape, CD-ROM)
<*>; SCSI disk support
因为偶式MPT的SCSI,所以以下都没选,省略之
Multi-device support (RAID and LVM) --->; 支持RAID和LVM(逻辑卷) 自定
[*] Multiple devices driver support (RAID and LVM)
<*>; RAID support
< >; Linear (append) mode
<*>; RAID-0 (striping) mode
< >; RAID-1 (mirroring) mode
< >; RAID-10 (mirrored striping) mode (EXPERIMENTAL)
<*>; RAID-4/RAID-5 mode
< >; RAID-6 mode (EXPERIMENTAL)
<*>; Multipath I/O support
< >; Faulty test module for MD
<*>; Device mapper support
< >; Crypt target support
< >; Snapshot target (EXPERIMENTAL)
< >; Mirror target (EXPERIMENTAL)
< >; Zero target (EXPERIMENTAL)
Fusion MPT device support --->; 偶的SCSI是这个,所以选了 还是自定
<*>; Fusion MPT (base + ScsiHost) drivers
(40) Maximum number of scatter gather entries
<*>; Fusion MPT misc device (ioctl) driver
IEEE 1394 (FireWire) support --->; 自定 (偶没选)
I2O device support --->; 自定 (偶没选)
Networking support --->; 网络选项
[*] Networking support
Networking options --->;
<*>; Packet socket
[ ] Packet socket: mmapped IO
< >; Netlink device emulation
<*>; Unix domain sockets 如果你有网络就选
< >; PF_KEY sockets
[*] TCP/IP networking
[ ] IP: multicasting
[ ] IP: advanced router
[ ] IP: kernel level autoconfiguration
< >; IP: tunneling
< >; IP: GRE tunnels over IP
[ ] IP: ARP daemon support (EXPERIMENTAL)
[*] IP: TCP syncookie support (disabled per default) 能防DOS攻击,但会降低一点性能,总的说性价比不错
< >; IP: AH transformation
< >; IP: ESP transformation
< >; IP: IPComp transformation
< >; IP: tunnel transformation
<*>; IP: TCP socket monitoring interface
IP: Virtual Server Configuration --->; lvs 支持
< >; The IPv6 protocol (EXPERIMENTAL)
[*] Network packet filtering (replaces ipchains) --->; 包过滤省略(知道的自己选,不熟悉的都选上)
以下都没选,省略
[ ] Amateur Radio support --->;
< >; IrDA (infrared) subsystem support --->;
< >; Bluetooth subsystem support --->;
[*] Network device support
< >; Dummy net driver support 这个是nis服务器的吧,不大清楚,没用过
<*>; Bonding driver support 双网卡绑定的
< >; EQL (serial line load balancing) support
< >; Universal TUN/TAP device driver support
ARCnet devices --->;
Ethernet (10 or 100Mbit) --->;
Ethernet (1000 Mbit) --->;
< >; Alteon AceNIC/3Com 3C985/NetGear GA620 Gigabit support
< >; D-Link DL2000-based Gigabit Ethernet support
< >; Intel(R) PRO/1000 Gigabit Ethernet support
< >; National Semiconduct DP83820 support
< >; Packet Engines Hamachi GNIC-II support
< >; Packet Engines Yellowfin Gigabit-NIC support (EXPERIMENTAL)
< >; Realtek 8169 gigabit ethernet support
< >; Marvell Yukon Chipset / SysKonnect SK-98xx Support
<*>; Broadcom Tigon3 support
以下都没选,省略
ISDN subsystem --->;
Telephony Support --->;
Input device support --->;
Character devices --->;
I2C support --->;
Dallas's 1-wire bus --->;
Misc devices --->;
Multimedia devices --->;
Graphics support --->;
Sound --->;
USB support --->;
MMC/SD Card support --->; 以上都没选,需要的自己选
09.File systems --->; 文件系统
< >; Second extended fs support
<*>; Ext3 journalling file system support
[ ] Ext3 extended attributes
[*] JBD (ext3) debugging support
< >; Reiserfs support
< >; JFS filesystem support
< >; XFS filesystem support
< >; Minix fs support
< >; ROM file system support
[ ] Quota support
< >; Kernel automounter support
<*>; Kernel automounter version 4 support (also supports v3)
CD-ROM/DVD Filesystems --->;
<*>; ISO 9660 CDROM file system support
[ ] Microsoft Joliet CDROM extensions
[ ] Transparent decompression extension
< >; UDF file system support
DOS/FAT/NT Filesystems --->; floppy要用到的文件格式
<*>; MSDOS fs support
<*>; VFAT (Windows-95) fs support
(437) Default codepage for FAT (NEW)
(iso8859-1) Default iocharset for FAT (NEW)
< >; NTFS file system support
Pseudo filesystems --->;
[*] /proc file system support proc文件系统支持
[ ] /proc/kcore support
[ ] /dev file system support (OBSOLETE)
[ ] /dev/pts Extended Attributes
[*] Virtual memory file system support (former shm fs) 虚拟内存支持
[ ] tmpfs Extended Attributes
[ ] HugeTLB file system support
Miscellaneous filesystems --->;
Network File Systems --->;
<*>; NFS file system support nfs客户端支持
[*] Provide NFSv3 client support
[ ] Provide NFSv4 client support (EXPERIMENTAL)
[ ] Allow direct I/O on NFS files (EXPERIMENTAL)
< >; NFS server support nfs服务端支持
< >; Secure RPC: Kerberos V mechanism (EXPERIMENTAL)
< >; Secure RPC: SPKM3 mechanism (EXPERIMENTAL)
< >; SMB file system support (to mount Windows shares etc.) samba支持
< >; CIFS support (advanced network filesystem for Samba, Window and other CIFS compliant servers)
< >; NCP file system support (to mount NetWare volumes)
< >; Coda file system support (advanced network fs)
< >; Andrew File System support (AFS) (Experimental)
Partition Types --->;
Native Language Support --->; 自己选
10.Profiling support --->; 没选
11.Kernel hacking --->; 没选
12.Security options --->; 没选
13.Cryptographic options --->; 没选
14.Library routines --->;
< >; CRC-CCITT functions
<*>; CRC32 functions
; CRC32c (Castagnoli, et al) Cyclic Redundancy-Check
五、编译安装
步骤:make -jn(n代表同时编译的进程,可以加快编译速度,n由你的配置决定,我的配置用15-25)
make modules_install
make install
六、grub的设置
设置之前先介绍一下2.6的I/O调度器
2.6包含的四个I/O调度器分别是No-op I/O scheduler、Anticipatory I/O scheduler、Deadline I/O scheduler与CFQ I/O scheduler。
在后文中分别简称为ns、as、ds与cfq。
ns是一个简化的调度程序它只作最基本的合并与排序。与桌面系统的关系不是很大,主要用在一些特殊的软件
与硬件环境下,这些软件与硬件一般都拥有自己的调度机制对内核支持的要求很小,这很适合一些嵌入式系统环境。作为桌面用户我们一般不会选择它。
as是当前内核中默认的I/O调度器。它拥有非常好的性能,在2.5中它就相当引人注意。在与2.4内核进行的对比测试中,在2.4中多项以分钟为单位
完成的任务,它则是以秒为单位来完成的。正因为如此它成为目前2.6测试版中默认的I/O调度器。但它也存在着弱点,它本身是比较庞大与复杂的,
在一些特殊的情况下,特别是在数据吞吐量非常大的数据库系统中它会变的比较缓慢。
ds就是针对as的缺点进行改善而来的,还处于测试阶段,但已经很稳定了。目前表现出的性能几乎与as一样好。加之比as更加小巧,
是相当有前途的调度器,值得一试:)
cfq为系统内的所有任务分配相同的带宽,提供一个公平的工作环境,它比较适合桌面环境。事实上在测试中它也有不错的表现,
mplayer xmms等多媒体播放器与它配合的相当好,回放平滑几乎没有因访问磁盘而出现的跳帧现象。对于喜欢在Linux下听音乐看电影的朋友不妨尝试一下。
好了,下面说说怎么设置:参数的格式为elevator=调度器名
修改/boot/grub/grub.conf,在kernel那行后门加入elevator=deadline
例如:kernel /boot/vmlinuz-2.6.10-bk4 ro root=/dev/你的根分区 elevator=deadline
七、reboot
阅读(1398) | 评论(0) | 转发(0) |