原文地址:http://blog.csdn.net/sudochen/article/details/8949227
今天我们来动手演练一下Netlink的用法,看看它到底是如何实现用户-内核空间的数据通信的。我们依旧是在2.6.21的内核环境下进行开发。 在文件里包含了Netlink协议簇已经定义好的一些预定义协议:
#define NETLINK_TEST 20 /* 用户添加的自定义协议 */
如果我们在Netlink协议簇里开发一个新的协议,只要在该文件中定义协议号即可,例如我们定义一种基于Netlink协议簇的、协议号是20的自定义协议,如上所示。同时记得,将内核头文件目录中的netlink.h也做对应的修改,在我的系统中它的路径是:/usr/src/linux-2.6.21/include/linux/netlink.h
接下来我们在用户空间以及内核空间模块的开发过程中就可以使用这种协议了,一共分为三个阶段。
1,第一阶段:
我们首先实现的功能是用户->内核的单向数据通信,即用户空间发送一个消息给内核,然后内核将其打印输出,就这么简单。用户空间的示例代码如下【mynlusr.c】
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
-
#define MAX_PAYLOAD 1024 /*the max payload of the msg*/
-
-
int main(int argc, char **argv)
-
{
-
struct sockaddr_nl dest_addr;
-
struct nlmsghdr *nlh = NULL;
-
struct iovec iov;
-
int sock_fd = -1;
-
struct msghdr msg;
-
int ret;
-
-
if((sock_fd=socket(PF_NETLNK,SOCK_RAW,NETLINK_TEST)) < 0)
-
{
-
perror("can not create netlink socket");
-
exit(1);
-
}
-
-
memset(&dest_addr,0,sizeof(dest_addr));
-
dest_addr.nl_family = AF_NETLINK;
-
dest_addr.nl_pid = 0;
-
dest_addr.nl_groups = 0;
-
-
-
if((ret =bind(sock_fd,(struct sockaddr*)&dest_addr,sizeof(dest_addr))) < 0)
-
{
-
perror("can not bind sockfd with sockaddr_nl\n");
-
exit(1);
-
}
-
-
if(NULL == (nlh=(struct nlmsghdr*)malloc(NLMSG_SPACE(MAX_PAYLOAD))))
-
{
-
perror("alloc mem failed\n");
-
exit(1);
-
}
-
-
memset(nlh,0,MAX_PAYLOAD);
-
-
nlh->nlmsg_len = NLMSG_SPACE(MAX_PAYLOAD);
-
nlh->nlmsg_pid = 0;
-
nlh->nlmsg_type = NLMSG_NOOP;
-
nlh->nlmsg_flags = 0;
-
-
-
strcpy(NLMSG_DATA(nlh),argv[1]);
-
-
memset(&iov,0,sizeof(iov));
-
iov.iov_base = (void*)nlh;
-
iov.iov_len = nlh->nlmsg_len;
-
memset(&msg,0,sizeof(msg));
-
msg.msg_iov = &iov;
-
msg.msg_iovlen = 1;
-
-
sendmsg(sock_fd,&msg,0);
-
-
-
close(sock_fd);
-
free(nlh);
-
return 0;
-
}
上面的代码逻辑已经非常清晰了,都是socket编程的API,唯一不同的是我们这次编程是针对Netlink协议簇的。这里我们提前引入了BSD层的消息结构体struct msghdr{},定义在文件里,以及其数据块struct iovec{}定义在头文件里。这里就不展开了,大家先记住这个用法就行。以后有时间再深入到socket的骨子里去转悠一番。
另外,需要格外注意的就是Netlink的地址结构体和其消息头结构中pid字段为0的情况,很容易让人产生混淆,再总结一下:
|
0
|
netlink地址结构体.nl_pid
|
1、内核发出的多播报文
2、消息的接收方是内核,即从用户空间发往内核的消息
|
netlink消息头体. nlmsg_pid
|
来自内核主动发出的消息
|
这个例子仅是从用户空间到内核空间的单向数据通信,所以Netlink地址结构体中我们设置了dest_addr.nl_pid = 0,说明我们的报文的目的地是内核空间;在填充Netlink消息头部时,我们做了nlh->nlmsg_pid = 0这样的设置。
需要注意几个宏的使用:
NLMSG_SPACE(MAX_PAYLOAD),该宏用于返回不小于MAX_PAYLOAD且4字节对齐的最小长度值,一般用于向内存系统申请空间是指定所申请的内存字节数,和NLMSG_LENGTH(len)所不同的是,前者所申请的空间里不包含Netlink消息头部所占的字节数,后者是消息负载和消息头加起来的总长度。
NLMSG_DATA(nlh),该宏用于返回Netlink消息中数据部分的首地址,在写入和读取消息数据部分时会用到它。
它们之间的关系如下:
内核空间代码如下,mynlkernel.c
-
#inlcude
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
-
MODULE_LICENSE("GPL");
-
-
struct sock *nl_sk = NULL;
-
-
static void nl_data_ready(struct sock *sk, int len)
-
{
-
struct sk_buff *skb;
-
struct nlmsghdr *nlh = NULL;
-
-
while((skb=skb_dequeue(&sk->sk_receive_queue)) != NULL)
-
{
-
nlh=(struct nlmsghdr*)skb->data;
-
printk("%s: receive netlink msg payload: %s\n",__func__,(char*)NLMSG_DATA(nlh));
-
kfree_skb(skb);
-
}
-
printk("received finished!\n");
-
}
-
-
-
static __exit void testnl_exit(void)
-
{
-
printk("test netlink exit\n");
-
sock_release(nl_sk->sk_socket);
-
}
-
-
-
static __init int testnl_init(void)
-
{
-
printk("test netlink init\n");
-
nl_sk = netlink_kernel_create(NETLINK_TEST,0,nl_data_ready,THIS_MODULE);
-
-
return 0;
-
}
-
-
module_init(testnl_init);
-
module_exit(testnl_exit);
在内核模块的初始化函数里我们用
nl_sk = netlink_kernel_create(NETLINK_TEST,0,nl_data_ready,THIS_MODULE);
创建了一个内核态的socket,第一个参数我们扩展的协议号;第二个参数为多播组号,目前我们用不上,将其置为0;第三个参数是个回调函数,即当内核的Netlink socket套接字收到数据时的处理函数;第四个参数就不多说了。
在回调函数nl_data_ready()中,我们不断的从socket的接收队列去取数据,一旦拿到数据就将其打印输出。在协议栈的INET层,用于存储数据的是大名鼎鼎的sk_buff结构,所以我们通过nlh = (struct nlmsghdr *)skb->data;可以拿到netlink的消息体,然后通过NLMSG_DATA(nlh)定位到netlink的消息负载。
将上述代码编译后测试结果如下:
2,第二阶段:
我们将上面的代码稍加改造就可以实现用户<->内核的双向数据通信。
首先是改造用户空间的代码:
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
-
#define MAX_PAYLOAD 1024 /*the max payload of the msg*/
-
-
int main(int argc, char **argv)
-
{
-
struct sockaddr_nl dest_addr;
-
struct nlmsghdr *nlh = NULL;
-
struct iovec iov;
-
int sock_fd = -1;
-
struct msghdr msg;
-
int ret;
-
-
if((sock_fd=socket(PF_NETLNK,SOCK_RAW,NETLINK_TEST)) < 0)
-
{
-
perror("can not create netlink socket");
-
exit(1);
-
}
-
-
memset(&dest_addr,0,sizeof(dest_addr));
-
dest_addr.nl_family = AF_NETLINK;
-
dest_addr.nl_pid = 0;
-
dest_addr.nl_groups = 0;
-
-
-
if((ret =bind(sock_fd,(struct sockaddr*)&dest_addr,sizeof(dest_addr))) < 0)
-
{
-
perror("can not bind sockfd with sockaddr_nl\n");
-
exit(1);
-
}
-
-
if(NULL == (nlh=(struct nlmsghdr*)malloc(NLMSG_SPACE(MAX_PAYLOAD))))
-
{
-
perror("alloc mem failed\n");
-
exit(1);
-
}
-
-
memset(nlh,0,MAX_PAYLOAD);
-
-
nlh->nlmsg_len = NLMSG_SPACE(MAX_PAYLOAD);
-
-
-
nlh->nlmsg_pid = getpid();
-
-
nlh->nlmsg_type = NLMSG_NOOP;
-
nlh->nlmsg_flags = 0;
-
-
-
strcpy(NLMSG_DATA(nlh),argv[1]);
-
-
memset(&iov,0,sizeof(iov));
-
iov.iov_base = (void*)nlh;
-
iov.iov_len = nlh->nlmsg_len;
-
memset(&msg,0,sizeof(msg));
-
msg.msg_iov = &iov;
-
msg.msg_iovlen = 1;
-
-
sendmsg(sock_fd,&msg,0);
-
-
-
-
printf("waiting msg from kernel\n");
-
memset((char*)MLMSG_DATA(nlh),0,1024);
-
recvmsg(sock_fd,&msg,0);
-
printf("got response : %s\n",NLMSG_DATA(nlh));
-
-
-
-
close(sock_fd);
-
free(nlh);
-
return 0;
-
}
内核修改代码:
-
#inlcude
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
-
MODULE_LICENSE("GPL");
-
-
struct sock *nl_sk = NULL;
-
-
-
-
void sendnlmsg(char* msg,int dst_pid)
-
{
-
struct sk_buff *skb;
-
struct nlmsghdr *nlh;
-
int len = NLMSG_SPACE(MAX_MSGSIZE);
-
int slen = 0;
-
-
if(!msg || !nl_sk)
-
{
-
return;
-
}
-
-
skb = alloc_skb(len,GFP_KERNEL);
-
if(!skb)
-
{
-
printk("alloc_skb error/n");
-
return;
-
}
-
-
slen = strlen(msg) + 1;
-
-
nlh = nlmsg_put(skb,0,0,0,MAX_MSGSIZE,0);
-
-
-
NETLINK_CB(skb).pid = 0;
-
NETLINK_CB(skb).dst_group = 0;
-
-
msg[slen] = '\0';
-
memcpy(MLMSG_DATA(nlh),msg,slen+1);
-
-
netlink_unicase(nl_sk,skb,dst_pid,0);
-
printk("send OK\n");
-
return ;
-
}
-
-
static void nl_data_ready(struct sock *sk, int len)
-
{
-
struct sk_buff *skb;
-
struct nlmsghdr *nlh = NULL;
-
-
while((skb=skb_dequeue(&sk->sk_receive_queue)) != NULL)
-
{
-
nlh=(struct nlmsghdr*)skb->data;
-
printk("%s: receive netlink msg payload: %s\n",__func__,(char*)NLMSG_DATA(nlh));
-
kfree_skb(skb);
-
-
sendnlmsg("I see you\n",nlh->nlmsg_pid);
-
-
-
}
-
printk("received finished!\n");
-
}
-
-
-
static __exit void testnl_exit(void)
-
{
-
printk("test netlink exit\n");
-
sock_release(nl_sk->sk_socket);
-
}
-
-
-
static __init int testnl_init(void)
-
{
-
printk("test netlink init\n");
-
nl_sk = netlink_kernel_create(NETLINK_TEST,0,nl_data_ready,THIS_MODULE);
-
-
return 0;
-
}
-
-
module_init(testnl_init);
-
module_exit(testnl_exit);
3,第三阶段:
前面我们提到过,如果用户进程希望加入某个多播组时才需要调用bind()函数。前面的示例中我们没有这个需求,可还是调了bind(),心头有些不爽。在前几篇博文里有关于socket编程时几个常见API的详细解释和说明,不明白的童鞋可以回头去复习一下。
因为Netlink是面向无连接的数据报的套接字,所以我们还可以用sendto()和recvfrom()来实现数据的收发,这次我们不再调用bind()。将Stage 2的例子稍加改造一下,
用户空间的修改如下:
-
"font-size:12px;">#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
-
#define MAX_PAYLOAD 1024 /*the max payload of the msg*/
-
-
int main(int argc, char **argv)
-
{
-
struct sockaddr_nl dest_addr;
-
struct nlmsghdr *nlh = NULL;
-
struct iovec iov;
-
int sock_fd = -1;
-
struct msghdr msg;
-
int ret;
-
-
if((sock_fd=socket(PF_NETLNK,SOCK_RAW,NETLINK_TEST)) < 0)
-
{
-
perror("can not create netlink socket");
-
exit(1);
-
}
-
-
memset(&dest_addr,0,sizeof(dest_addr));
-
dest_addr.nl_family = AF_NETLINK;
-
dest_addr.nl_pid = 0;
-
dest_addr.nl_groups = 0;
-
-
-
-
-
if((ret =bind(sock_fd,(struct sockaddr*)&dest_addr,sizeof(dest_addr))) < 0)
-
{
-
perror("can not bind sockfd with sockaddr_nl\n");
-
exit(1);
-
}*/
-
-
-
-
if(NULL == (nlh=(struct nlmsghdr*)malloc(NLMSG_SPACE(MAX_PAYLOAD))))
-
{
-
perror("alloc mem failed\n");
-
exit(1);
-
}
-
-
memset(nlh,0,MAX_PAYLOAD);
-
-
nlh->nlmsg_len = NLMSG_SPACE(MAX_PAYLOAD);
-
nlh->nlmsg_pid = get_pid();
-
nlh->nlmsg_type = NLMSG_NOOP;
-
nlh->nlmsg_flags = 0;
-
-
-
strcpy(NLMSG_DATA(nlh),argv[1]);
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
sendto(sock_fd,nlh,NLMSG_LENGTH(MAX_PAYLOAD),0,(struct sockaddr*)(&dest_addr),sizeof(dest_addr));
-
-
printf("waiting message form kernel\n");
-
memset((char*)NLMSG_DATA(nlh),0,1024);
-
-
recvfrom(sock_fd,nlh,NLMSG_LENGTH(MAX_PAYLOAD),0,(struct sockaddr*)(&dest_addr),NULL);
-
printf("got response : %s\n",NLMSG_DATA(nlh));
-
-
-
close(sock_fd);
-
free(nlh);
-
return 0;
-
}
内核代码完全不用修改;内核空间的代码完全不用修改,我们仍然用netlink_unicast()从内核空间发送消息到用户空间。
重新编译后,测试结果如下:
和第二部分中代码运行效果完全一样。也就是说,在开发Netlink程序过程中,如果没牵扯到多播机制,那么用户空间的socket代码其实是不用执行bind()系统调用的,但此时就需要用sendto()和recvfrom()完成数据的发送和接收的任务;如果执行了bind()系统调用,当然也可以继续用sendto()和recvfrom(),但给它们传递的参数就有所区别。这时候一般使用sendmsg()和recvmsg()来完成数据的发送和接收。大家根据自己的实际情况灵活选择。
本文为转载文章,对原文有所删改,请以原文为参考
原文:http://blog.chinaunix.net/uid-23069658-id-3405954.html
阅读(1137) | 评论(0) | 转发(0) |