netlink协议是一种基于socket的IPC机制,可用于内核与用户空间进程、用户空间进程与用户空间进程通信,如图所示:
netlink协议基于BSD socket和AF_NETLINK地址簇(address family),使用32位的端口号寻址(以前称作PID),每个netlink协议(或称作总线,man手册中则称之为netlink family),通常与一个或一组内核服务/组件相关联,如NETLINK_ROUTE用于获取和设置路由与链路信息、NETLINK_KOBJECT_UEVENT用于内核向用户空间的udev进程发送通知等。netlink具有以下特点:
① 支持全双工、异步通信(当然同步也支持)
② 用户空间可使用标准的BSD socket接口(但netlink并没有屏蔽掉协议包的构造与解析过程,推荐使用libnl等第三方库)
③ 在内核空间使用专用的内核API接口
③ 支持多播(因此支持“总线”式通信,可实现消息订阅)
④ 在内核端可用于进程上下文与中断上下文
二、为AF_NETLINK地址簇添加新协议的方法
关于这个要添加的netlink”协议“的说法,网上有多种不一致的术语,有人称之为”netlink family“,有人称之为”bus“,还有人称之为“netlink protocol”,实际上指的是同一个东西,本文将称之为(netlink)协议。要在内核中使用netlink,需要为自己的内核服务添加新的netlink,现在有两种方法:
① 最开始的方法,使用中的接口,即直接基于nlmsghdr。这是在Linux加入netlink机制之初添加协议的方法。该方法有个限制就是协议的数量不能超过32个,Linux3.10内核已经使用了22个。
② 使用netlink generic。netlink generic是基于第一种方法实现的,协议号为NETLINK_GENERIC。它在NETLINK_GENERIC协议之上提供了多路复用,在其之上添加的新协议称之为Generic Netlink 协议,在没有歧义的情况下,也称作Generic协议或netlink协议。
出于学习的目的,本文将使用第一种方法。
三、NetLink协议基础
netlink机制提供的协议头如图所示:
netlink协议是面向消息的,要定义自己的协议,需要基于netlink提供的协议头,即struct nlmsghdr。自定义协议按照协议头格式填充协议头内容,并定义自己的playload,通常自定义的协议体包含自定义协议头与额外的属性,netlink提供了一系列的标准方法用于对消息进行打包与拆包。struct nlmsghdr的定义如下
-
struct nlmsghdr {
-
__u32 nlmsg_len;
-
__u16 nlmsg_type;
-
__u16 nlmsg_flags;
-
__u32 nlmsg_seq;
-
__u32 nlmsg_pid;
-
};
其中一些字段,如消息标志与消息类型字段,netlink对其作了一些预定义的值。除了这些预定义的值外,新协议可以定义自己的值。各字段含义如下:
① Total Length (32bit) 协议头与payload的总长度(包含中间对齐和payload尾部对齐的空间)
② Message Type (16bit)。除了预定义的几个类型外,新协议可以自由的加入自己的消息类型。类型对netlink核心透明
③ Message Flags (16bit)。用于描述协议的行为,对netlink核心不透明
④ Sequence Number (32bit)。可选,用于标志已发送的消息,如错误消息可以引用一个已发送消息。
⑤ Port Number (32bit)。目的端口。若未指定,则会发送给内核
四、添加协议NETLINK_TEST
1. 协议格式设计:
为简便起见,仅设计一个具有echo功能的协议。不在标准nlmsghdr之后的payload中定义自己的协议头,payload即为echo文本串,不使用netlink提供的消息标志。定义两种消息类型:NLMSG_GETECHO(用于echo请求包)和NLMSG_SETECHO(用于echo响应包)。
出于学习的目的,用户进程使用socket接口收发信息。在实际的开发过程中,推荐是同libnl等库,该库提供的接口类似于内核中的那套接口,用起来非常方便。
2. 用户空间程序:
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#define NETLINK_TEST 31 // 自定义的协议号
-
-
#define NLMSG_SETECHO 0x11
-
#define NLMSG_GETECHO 0x12
-
-
#define MAX_PAYLOAD 101
-
-
struct sockaddr_nl src_addr, dst_addr;
-
struct iovec iov;
-
int sockfd;
-
struct nlmsghdr *nlh = NULL;
-
struct msghdr msg;
-
-
int main( int argc, char **argv)
-
{
-
if (argc != 2) {
-
printf("usage: ./a.out \n");
-
exit(-1);
-
}
-
-
sockfd = socket(PF_NETLINK, SOCK_DGRAM, NETLINK_TEST);
-
-
bzero(&src_addr, sizeof(src_addr));
-
src_addr.nl_family = AF_NETLINK;
-
src_addr.nl_pid = getpid();
-
src_addr.nl_groups = 0;
-
bind(sockfd, (struct sockaddr*)&src_addr, sizeof(src_addr));
-
-
bzero(&dst_addr, sizeof(dst_addr));
-
dst_addr.nl_family = AF_NETLINK;
-
dst_addr.nl_pid = 0;
-
dst_addr.nl_groups = 0;
-
-
nlh = malloc(NLMSG_SPACE(MAX_PAYLOAD));
-
nlh->nlmsg_len = NLMSG_SPACE(MAX_PAYLOAD);
-
nlh->nlmsg_pid = getpid();
-
nlh->nlmsg_flags = 0;
-
nlh->nlmsg_type = NLMSG_GETECHO;
-
strcpy(NLMSG_DATA(nlh), argv[1]);
-
iov.iov_base = (void *)nlh;
-
iov.iov_len = nlh->nlmsg_len;
-
msg.msg_name = (void *)&dst_addr;
-
msg.msg_namelen = sizeof(dst_addr);
-
msg.msg_iov = &iov;
-
msg.msg_iovlen = 1;
-
-
sendmsg(sockfd, &msg, 0);
-
-
memset(nlh, 0, NLMSG_SPACE(MAX_PAYLOAD));
-
recvmsg(sockfd, &msg, 0);
-
printf(" Received message payload: %s\n",
-
NLMSG_DATA(nlh));
注意:客户进程可以不进行bind而直接recvmsg,这样,默认本地绑定的端口为当前进程ID,因此,在发送消息时应将源端口指定为getpid()
3. 内核模块:
-
#include
-
#include
-
#include
-
#include
-
#define NETLINK_TEST 31
-
-
#define NLMSG_SETECHO 0x11
-
#define NLMSG_GETECHO 0x12
-
-
static struct sock *sk;
-
static void nl_custom_data_ready(struct sk_buff *skb);
-
-
int __init nl_custom_init(void)
-
{
-
struct netlink_kernel_cfg nlcfg = {
-
.input = nl_custom_data_ready,
-
};
-
sk = netlink_kernel_create(&init_net, NETLINK_TEST, &nlcfg);
-
printk(KERN_INFO "initialed ok!\n");
-
if (!sk) {
-
printk(KERN_INFO "netlink create error!\n");
-
}
-
return 0;
-
}
-
void __exit nl_custom_exit(void)
-
{
-
printk(KERN_INFO "existing...\n");
-
netlink_kernel_release(sk);
-
}
-
-
static void nl_custom_data_ready(struct sk_buff *skb)
-
{
-
struct nlmsghdr *nlh;
-
void *payload;
-
struct sk_buff *out_skb;
-
void *out_payload;
-
struct nlmsghdr *out_nlh;
-
int payload_len;
-
nlh = nlmsg_hdr(skb);
-
switch(nlh->nlmsg_type)
-
{
-
case NLMSG_SETECHO:
-
break;
-
case NLMSG_GETECHO:
-
payload = nlmsg_data(nlh);
-
payload_len = nlmsg_len(nlh);
-
printk(KERN_INFO "payload_len = %d\n", payload_len);
-
printk(KERN_INFO "Recievid: %s, From: %d\n", (char *)payload, nlh->nlmsg_pid);
-
out_skb = nlmsg_new(NLMSG_DEFAULT_SIZE, GFP_KERNEL);
-
if (!out_skb) goto failure;
-
out_nlh = nlmsg_put(out_skb, 0, 0, NLMSG_SETECHO, payload_len, 0);
-
if (!out_nlh) goto failure;
-
out_payload = nlmsg_data(out_nlh);
-
strcpy(out_payload, "[from kernel]:");
-
strcat(out_payload, payload);
-
nlmsg_unicast(sk, out_skb, nlh->nlmsg_pid);
-
break;
-
default:
-
printk(KERN_INFO "Unknow msgtype recieved!\n");
-
}
-
return;
-
failure:
-
printk(KERN_INFO " failed in fun dataready!\n");
-
}
-
module_init(nl_custom_init);
-
module_exit(nl_custom_exit);
-
-
MODULE_LICENSE("GPL");
-
MODULE_DESCRIPTION("a simple example for custom netlink protocal family");
-
MODULE_AUTHOR("RSLjdkt");
注意:上面的回调函数是在进程上下文(系统调用中)进行的,若操作比较耗时,在实际使用中通常将工作交给内核线程处理,内核线程调用skb_recv_datagram函数。
3. 模块Makefile
-
obj-m += nltest.o
-
-
-
KID := /lib/modules/`uname -r`/build
-
PWD := $(shell pwd)
-
-
all:
-
make -C $(KID) M=$(PWD) modules
-
-
clean:
-
rm -rf *.o .cmd *.ko *.mod.c .tmp_versions
4. 操作:
insmod模块后,运行用户程序,用户进程输出:
-
Received message payload: [from kernel]:hello
内核模块的dmesg输出:
-
[181170.368671] initialed ok!
-
[181182.745293] payload_len = 104
-
[181182.749476] Recievid: hello, From: 3127
其中,From后是发送端的“地址”
参考:
Netlink Protocol Fundamentals
netlink socket理解 http://www.blogjava.net/jasmine214--love/archive/2012/06/01/379752.html
generic_netlink_howto