Chinaunix首页 | 论坛 | 博客
  • 博客访问: 572378
  • 博文数量: 185
  • 博客积分: 4031
  • 博客等级: 上校
  • 技术积分: 1591
  • 用 户 组: 普通用户
  • 注册时间: 2009-05-27 19:45
文章分类

全部博文(185)

文章存档

2011年(14)

2010年(63)

2009年(108)

我的朋友

分类:

2009-11-02 23:03:15

netlink 编程介绍

Linux 2.2开始支持PF_NETLINK 域的通讯方式,这个方式主要的用途是在Linux的内核空间和用户空间进行通讯。目前在网络上面关于netlink编程的中文资料很少,为了促进对 netlink编程的理解我编写了这篇文章,由于我对netlink的了解不是很透彻,特别是对于内核部分不是很熟悉,所以文章中肯定有很多错误的地方还 请大家指正。文章分下面几个部分进行讲述

  1. netlink 基础知识
  2. nlmsghdr 结构介绍
  3. 解析nlmsghdr数据
  4. sockaddr_nl 结构介绍
  5. NETLINK_ROUTE 协议介绍
  6. NETLINK_SKIP 协议介绍
  7. NETLINK_USERSOCK协议介绍
  8. NETLINK_FIREWALL 协议介绍
  9. NETLINK_TCPDIAG 协议介绍
  10. NETLINK_NFLOG 协议介绍
  11. NETLINK_ARPD 协议介绍
  12. NETLINK_ROUTE6 协议介绍
  13. NETLINK_IP6_FW 协议介绍
  14. NETLINK_DNRTMSG 协议介绍
  15. NETLINK_TAPBASE 协议介绍
  16. 参考资料
  17. 版权说明
  18. 修改记录

netlink基础知识

我们在使用socket(2)man手册时候可以找到man手册中有下面一行说明

PF_NETLINK Kernel user interface device netlink(7)

在我们通过PF_NETLINK创建一个SOCKET以后表示我们期望同内核进行消息通讯。使用netlink(7)的手册可以看到关于PF_NETLINK的详细说明。

#include
#include
#include

netlink_socket = socket(PF_NETLINK, socket_type, netlink_family);

按照netlink的手册,socket_type可以取SOCK_RAWSOCK_DGRAM,不过内核不区分这两个字段。netlink_family字段指定了我们期望的通讯协议,主要有:

    • NETLINK_ROUTE 用来获取,创建和修改设备的各种信息,详细参见 rtnetlink(7)
    • NETLINK_SKIP Enskip 的保留选项
    • NETLINK_USERSOCK 为今后用户程序空间协议用保留选项
    • NETLINK_FIREWALL 接收 IPv4 防火墙编码发送的数据包
    • NETLINK_TCPDIAG TCP套接字监控
    • NETLINK_NFLOG netfilter的用户空间日志
    • NETLINK_ARPD 用以维护用户地址空间里的 arp
    • NETLINK_ROUTE6 接收和发送 IPv6 路由表更新消息
    • NETLINK_IP6_FW 接收未通过 IPv6 防火墙检查的数据包(尚未实现)
    • NETLINK_TAPBASE ethertap 设备实例

后面我们会对每一个协议进行解释和说明.

nlmsghdr结构介绍

每一个发送给内核或者从内核介绍的报文都有一个相同的报文头,这个报文头的结构如下定义:

struct nlmsghdr
{
__u32 nlmsg_len; /*
包括报头在内的消息长度*/
__u16 nlmsg_type; /*
消息正文 */
__u16 nlmsg_flags; /*
附加标志*/
__u32 nlmsg_seq; /*
序列号*/
__u32 nlmsg_pid; /*
发送进程号 PID */
};

所有发送给内核或者内核的报文的第一部分都必须使用这个机构,后面跟随相应的内容。nlmsg_type为后面消息的内容个数,对于前面我们提到的不同通讯协议有着不同的消息类型。下面是三个通用的消息类型

    • NLMSG_NOOP 这个消息类型表示消息内容为空,应用可以忽略该报文
    • NLMSG_ERROR 这个消息类型表示后面的消息是一个错误信息,错误信息的机构为nlmsgerr struct nlmsgerr
      {
      int error; /*
      负数表示的出错号 errno 或为 0 要求确认 acks*/
      struct nlmsghdr msg; /*
      造成出错的消息报头*/
      };
    • NLMSG_DONE 在我们接收或者发送消息给内核的时候,我们有可能一次发送多个报文,这个消息类型表示是报文的最后一个,类似于在链表中我们将最后一个成员的next指针设置为NULL

附加的标志用于控制或者表示消息的其它信息,一些比较通用的标志是

    • NLM_F_REQUEST 表示这个消息是一个请求消息,这个消息可以同以下一个标志组合
      • NLM_F_ROOT 返回树的根
      • NLM_F_MATCH 返回所有匹配的
      • NLM_F_ATOMIC 返回对象表的单一快照
      • NLM_F_DUMP 被定义为NLM_F_ROOT|NLM_F_MATCH
      • NLM_F_REPLACE 表示替换现有的规则
      • NLM_F_EXCL 如果现有规则存在则不修改
      • NLM_F_CREAT 创建一个规则
      • NLM_F_APPEND 追加一个规则
    • NLM_F_MULTI 表示这个消息是多个报文中的一个,报文的结尾通过NLMSG_DONE来表示
    • NLM_F_ACK 表示这个消息是一个应答消息
    • NLM_F_ECHO 表示这个消息是一个要求返回请求信息的消息

解析nlmsghdr数据

为了获取netlink报文中数据的方便,netlink提供了下面几个宏进行数据的获取和解包操作

#include
#include
int NLMSG_ALIGN(size_t len);
int NLMSG_LENGTH(size_t len);
int NLMSG_SPACE(size_t len);
void *NLMSG_DATA(struct nlmsghdr *nlh);
struct nlmsghdr *NLMSG_NEXT(struct nlmsghdr *nlh, int len);
int NLMSG_OK(struct nlmsghdr *nlh, int len);
int NLMSG_PAYLOAD(struct nlmsghdr *nlh, int len);
NLMSG_ALIGN:
进行数据长度的对齐操作
NLMSG_DATA:
获取通讯报文中的数据
NLMSG_NEXT:
获取下一个报文
NLMSG_OK:
判断是否数据可以继续获取
NLMSG_PAYLOAD:
获取数据的长度
在我们后面的实例中会介绍如何使用这几个宏。

sockaddr_nl结构介绍

socket程序中,如果我们要求接收报文则要求调用bind,表示我们期望接收什么样的报文。对于netlink也一样,我们要求指定我们期望接收的地址信息,不过同传统的sockaddr不同,这个地方是一个sockaddr_nl的结构:

struct sockaddr_nl
{
sa_family_t nl_family; /* AF_NETLINK */
unsigned short nl_pad; /*
用来填充的字段,赋值为0 */
pid_t nl_pid; /*
进程标识号pid */
__u32 nl_groups; /*
多址广播组掩码*/
};

每一个 netlink 数据类都有一个32位广播分组,当对套接字调用 bind(2) 时, sockaddr_nl 中的 nl_groups 字段设置成所要侦听的广播组的位掩码。其默认值为 0,表示不接收任何广播,我们会在后面中看到如何使用这个广播组的例子。

·  NETLINK_ROUTE协议介绍

netlink目前使用最广泛的是通过这个选项来获取网络设备或者网址的一些信息。在使用这个协议时候支持的类型有:

  • RTM_NEWLINK, RTM_DELLINK, RTM_GETLINK 创建,删除或者获取网络设备的信息
  • RTM_NEWADDR, RTM_DELADDR, RTM_GETADDR 创建,删除或者获取网络设备的IP信息
  • RTM_NEWROUTE, RTM_DELROUTE, RTM_GETROUTE 创建,删除或者获取网络设备的路由信息
  • RTM_NEWNEIGH, RTM_DELNEIGH, RTM_GETNEIGH 创建,删除或者获取网络设备的相邻信息
  • RTM_NEWRULE, RTM_DELRULE, RTM_GETRULE 创建,删除或者获取路由规则信息
  • RTM_NEWQDISC, RTM_DELQDISC, RTM_GETQDISC 创建,删除或者获取队列的原则
  • RTM_NEWTCLASS, RTM_DELTCLASS, RTM_GETTCLASS 创建,删除或者获取流量的类别
  • RTM_NEWTFILTER, RTM_DELTFILTER, RTM_GETTFILTER 创建,删除或者获取流量的过虑

由于NETLINK_ROUTE支持的类型实在太多了,我们这个地方只重点介绍一下RTM_GETLINK这个类型,然后通过一个例子介绍如何同内核进行通讯。关于其它类型的用法大家可以参考rtnetlink(7)man手册。

按照rtnetlink的说法,在获取设备信息的时候我们要求首先发送一个报文给内核表示我们的请求,这个报文的格式是1nlmsghdr头部机构+1ifinfomsg接口结构+多个rtattr属性机构。其中后面两个结构的定义是:

struct ifinfomsg
{
unsigned char ifi_family; /* AF_UNSPEC */
unsigned short ifi_type; /* Device type */
int ifi_index; /* Interface index */
unsigned int ifi_flags; /* Device flags */
unsigned int ifi_change; /* change mask */
};
struct rtattr
{
unsigned short rta_len; /* Length of option */
unsigned short rta_type; /* Type of option */
/* Data follows */
};
ifi_type:
这个字段包含了硬件的类型,可以参考比较常见的是 ARPHRD_ETHER 10M以太网
ARPHRD_PPP PPP
拨号
ARPHRD_LOOPBACK
环路设备
ifi_flags:
这个字段包含了设备的一些标志,相应的值为: IFF_UP 接口正在运行.
IFF_BROADCAST
有效的广播地址集.
IFF_DEBUG
内部调试标志.
IFF_LOOPBACK
这是自环接口.
IFF_POINTOPOINT
这是点到点的链路接口.
IFF_RUNNING
资源已分配.
IFF_NOARP
arp协议, 没有设置第二层目的地址.
IFF_PROMISC
接口为杂凑(promiscuous)模式.
IFF_NOTRAILERS
避免使用trailer .
IFF_ALLMULTI
接收所有组播(multicast)报文.
IFF_MASTER
主负载平衡群(bundle).
IFF_SLAVE
从负载平衡群(bundle).
IFF_MULTICAST
支持组播(multicast).
IFF_PORTSEL
可以通过ifmap选择介质(media)类型.
IFF_AUTOMEDIA
自动选择介质.
IFF_DYNAMIC
接口关闭时丢弃地址.
rta_type:
这个字段指定属性的类型,相应的值为: IFLA_UNSPEC 后面的数据格式未指定
IFLA_ADDRESS
后面的数据是一个硬件地址
IFLA_BROADCAST
后面的数据是一个硬件广播地址
IFLA_IFNAME
后面的数据是一个char型的设备名称
IFLA_MTU unsigned int
型的设备MTU
IFLA_LINK int
型的链路类型
IFLA_QDISC
字符串型的队列规则
IFLA_STATS struct net_device_stats
型的设备信息
在我们接收和发送数据的时候为了我们获取属性的方便,rtnetlink提供了一个宏供我们取获取其中的结构,这些宏的定义为: #include
#include
#include
#include

int RTA_OK(struct rtattr *rta, int rtabuflen);
void *RTA_DATA(struct rtattr *rta);
unsigned int RTA_PAYLOAD(struct rtattr *rta);
struct rtattr *RTA_NEXT(struct rtattr *rta, unsigned int rtabuflen);
unsigned int RTA_LENGTH(unsigned int length);
unsigned int RTA_SPACE(unsigned int length);

·  ·  NETLINK_ARPD 协议介绍

TODO:还没有找到资料

·  NETLINK_ROUTE6 协议介绍

TODO:还没有找到资料

·  NETLINK_IP6_FW 协议介绍

TODO:还没有找到资料

·  NETLINK_DNRTMSG 协议介绍

TODO:还没有找到资料

·  NETLINK_TAPBASE 协议介绍

TODO:还没有找到资料

·  参考资料

  1. Linux 系统内核空间与用户空间通信的实现与分析 这篇文章是陈鑫在IBM中国开发网站上的一篇文章,讨论了在LINUX下如何进行内核空间和用户空间通讯。
  2. Netlink Sockets Tour 这是一篇英文的介绍Linux内核中是如何实现netlink通讯的文章。
  3. Netlink Sockets - Overview 这是一篇介绍netlink编程入门的英文资料,介绍了一些基础性的东西。
  4. Understanding And Programming With Netlink Sockets 一篇介绍netlink程序的英文文章,介绍的非常详细。
  5. Linux Netlink as an IP Services Protocol 这个可能是最详细介绍netlink之间通讯协议报文的一篇RFC文档,详细的描述了每一个协议的通讯报文格式。
  6. NETLINK中文MAN手册 CMPP已经将netlink(7)man手册翻译成中文了,不过现在找不到这个的html版,只找到了一个doc版。
  7. IPROUTE 路由工具 IPROUTE路由工具的源代码中有大量的关于netlinkROUTE代码可以参考,同时也提供了一个libnetlink库用来进行操作。
  8. IPTABLES IPTABLES是一个Linux下强有力的防火墙工具。在IPTABLES的源代码中有大量的关于netlink编程的FIREWALL代码可以参考,同时也提供了一个libipq库来进行操作。
  9. ULOG 用户层日志 ULOG通过使用netlinkNFLOG功能,在用户层进行了通讯报文的日志记录功能,您可以参考ULOG的源代码来了解NFLOG的使用

 

阅读(1866) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~