NF_QUEUE原理分析6——以nfnetlink_subsys_register为线索-yandongxiao-ChinaUnix博客

昂首前行

首页　| 　博文目录　| 　关于我

yandongxiao

博客访问： 554238
博文数量： 140
博客积分： 10
博客等级：民兵
技术积分： 650
用户组：普通用户
注册时间： 2012-12-11 19:00

文章分类

全部博文（140）

libevent（1）
cmake（2）
Linux内核之TCP/I（2）
杂项（6）
网络编程（0）
Linux内核学习笔（6）
Python学习笔记（31）
Linux内核之基础（1）
Linux内核源代码（28）

iptables（4）

sk_buff结构（2）

IP层数据包处理过（5）

nf_queue运行原理（7）
C/C++函数之网络（27）
Linux基础之文件（7）
Linux内核之网络（13）
Linux基础之命令（16）
未分配的博文（0）

文章存档

2015年（5）

2014年（135）

我的朋友

nfqnl_recv_config

函数原型：static int nfqnl_recv_config(struct sock *ctnl, struct sk_buff *skb,

const struct nlmsghdr *nlh, const struct nlattr * const nfqa[])

struct sock *ctnl 根本没有用它，就先不考虑
struct sk_buff *skb 这个肯定是用户态发来的数据包的完整形式的表达
const struct nlmsghdr *nlh 这应该是skb的数据缓冲区的起始值，更具有实用价值
const struct nlattr * const nfqa[] 这个是内核对缓冲区内容的包装，与用户态一样。

首先，该函数被调用的时机是当消息类型NFQNL_MSG_CONFIG时；函数都做了些什么？

static int nfqnl_recv_config(struct sock *ctnl, struct sk_buff *skb,

const struct nlmsghdr *nlh,

const struct nlattr * const nfqa[])

{

struct nfgenmsg *nfmsg = NLMSG_DATA(nlh);

u_int16_t queue_num = ntohs(nfmsg->res_id);

struct nfqnl_instance *queue;

struct nfqnl_msg_config_cmd *cmd = NULL;

int ret = 0;

if (nfqa[NFQA_CFG_CMD]) {

cmd = nla_data(nfqa[NFQA_CFG_CMD]);

************************************************************************

来让我们了解一下协议绑定的真正含义吧。内核需要为每一类协议都提供一个队列（用于存放交付给用户的数据包，但是用户还没有返回处理意见的）。那么内核就提供了一个如下的数据类型：

static const struct nf_queue_handler *queue_handler[NFPROTO_NUMPROTO] ;

而 struct nf_queue_handler类型如下：

struct nf_queue_handler {

int (*outfn)(struct nf_queue_entry *entry,

unsigned int queuenum); //每个数据包被封装为了一个entry. 该函数的作用就是将属于queue_num的数据包挂接到它对应的instance_table[i]下。

char *name;

};

而NF_QUEUEbind,就是queue_handle[pf] = {&nfqnl_enqueue_packet, “nf_queue”}. nfqnl_enqueue_packet 负责将数据包入队列.

所以不bind不行啊！

***************************************************************************************

/* Commands without queue context - might sleep */

switch (cmd->command) {

case NFQNL_CFG_CMD_PF_BIND:

return nf_register_queue_handler(ntohs(cmd->pf),

&nfqh); //协议解绑定

case NFQNL_CFG_CMD_PF_UNBIND:

return nf_unregister_queue_handler(ntohs(cmd->pf),

&nfqh); //协议绑定

}

rcu_read_lock();

queue = instance_lookup(queue_num); //在instance_table中查找.

if (queue && queue->peer_pid != NETLINK_CB(skb).pid) {

ret = -EPERM;

goto err_out_unlock; //没找到，就错误返回.

}

**********************************************************************************

从该if语句判断可知，instance_tables就是当用户调用nfq_create_queue，真真正正要创建一个回调函数时，增加一个元素。

if (cmd != NULL) {

switch (cmd->command) {

case NFQNL_CFG_CMD_BIND:

if (queue) { //根据queue_num的值已经被人注册了。

ret = -EBUSY;

goto err_out_unlock;

}

//这个函数创建了一个nfqnl_instance的结构，可以看到它默认的copy_mode是NFQNL__COPY_NONE. 所有数据包的queue_num为它的包，都会被挂接到它的下面.

queue = instance_create(queue_num, NETLINK_CB(skb).pid);

if (IS_ERR(queue)) {

ret = PTR_ERR(queue);

goto err_out_unlock;

}

break;

case NFQNL_CFG_CMD_UNBIND:

if (!queue) { //同理

ret = -ENODEV;

goto err_out_unlock;

}

instance_destroy(queue);

break;

case NFQNL_CFG_CMD_PF_BIND:

case NFQNL_CFG_CMD_PF_UNBIND:

break;

default:

ret = -ENOTSUPP;

break;

}

*********************************************************************

执行到这里一般表示，用户态调用了nfq_set_mode函数。内核态就调用相应的nfqnl_set_mode,注意这个函数填充的是queue结构。

if (nfqa[NFQA_CFG_PARAMS]) {

struct nfqnl_msg_config_params *params;

if (!queue) { //首先queue必须存在

ret = -ENODEV;

goto err_out_unlock;

}

params = nla_data(nfqa[NFQA_CFG_PARAMS]);

nfqnl_set_mode(queue, params->copy_mode,

ntohl(params->copy_range));

}

***********************************************************************

在我们的用户态的实验当中，没有设置nf_queue中队列长度的代码。实际上也是发送NFQA_CFG_QUEUE_MAXLEN即可。

if (nfqa[NFQA_CFG_QUEUE_MAXLEN]) {

__be32 *queue_maxlen;

if (!queue) {

ret = -ENODEV;

goto err_out_unlock;

}

queue_maxlen = nla_data(nfqa[NFQA_CFG_QUEUE_MAXLEN]);

spin_lock_bh(&queue->lock);

queue->queue_maxlen = ntohl(*queue_maxlen);

spin_unlock_bh(&queue->lock);

}

err_out_unlock:

rcu_read_unlock();

return ret;

}

综上所述：用户发送的消息类型为NFQNL_MSG_CONFIG时，可以进行的操作就是

enum nfqnl_attr_config {

NFQA_CFG_UNSPEC,

NFQA_CFG_CMD, /* nfqnl_msg_config_cmd，又分为了四小项 */

NFQA_CFG_PARAMS, /* nfqnl_msg_config_params，又分为了三小项目 */

NFQA_CFG_QUEUE_MAXLEN, /* __u32 */

__NFQA_CFG_MAX

};

Nfqnl_recv_verdict

参数分析：

static int nfqnl_recv_verdict(struct sock *ctnl, struct sk_buff *skb,

const struct nlmsghdr *nlh,

const struct nlattr * const nfqa[])

与上一节相同，省略。

static int nfqnl_recv_verdict(struct sock *ctnl, struct sk_buff *skb,

const struct nlmsghdr *nlh, const struct nlattr * const nfqa[])

{

struct nfgenmsg *nfmsg = NLMSG_DATA(nlh);

u_int16_t queue_num = ntohs(nfmsg->res_id);

struct nfqnl_msg_verdict_hdr *vhdr;

struct nfqnl_instance *queue;

unsigned int verdict;

struct nf_queue_entry *entry;

queue = instance_lookup(queue_num); 寻找，注意它lookup使用的方法。

if (!queue)

queue = verdict_instance_lookup(queue_num, NETLINK_CB(skb).pid);

if (IS_ERR(queue))

return PTR_ERR(queue);

vhdr = verdicthdr_get(nfqa); //获得数据包中nfqnl_msg_verdict_hdr类型结构体

if (!vhdr)

return -EINVAL;

verdict = ntohl(vhdr->verdict);

entry = find_dequeue_entry(queue, ntohl(vhdr->id)); //摘下entry

if (entry == NULL)

return -ENOENT;

if (nfqa[NFQA_PAYLOAD]) {

if (nfqnl_mangle(nla_data(nfqa[NFQA_PAYLOAD]),

nla_len(nfqa[NFQA_PAYLOAD]), entry) < 0) //如果数据包有修改，则修改之.

verdict = NF_DROP;

}

if (nfqa[NFQA_MARK])

entry->skb->mark = ntohl(nla_get_be32(nfqa[NFQA_MARK]));

nf_reinject(entry, verdict); //这里关乎对数据包的处理结果.

return 0;

}

接下来，看一下nf_reinject是如何让数据包继续在协议栈中传输起来的。

void nf_reinject(struct nf_queue_entry *entry, unsigned int verdict)

{

struct sk_buff *skb = entry->skb;

struct list_head *elem = &entry->elem->list;

const struct nf_afinfo *afinfo;

int err;

rcu_read_lock();

nf_queue_entry_release_refs(entry); //从queue中释放.

/* Continue traversal iff userspace said ok... */

if (verdict == NF_REPEAT) {

elem = elem->prev;

verdict = NF_ACCEPT;

}

if (verdict == NF_ACCEPT) {

afinfo = nf_get_afinfo(entry->pf);

if (!afinfo || afinfo->reroute(skb, entry) < 0)

verdict = NF_DROP;

}

if (verdict == NF_ACCEPT) { //继续执行后面的hook回调函数.

next_hook:

verdict = nf_iterate(&nf_hooks[entry->pf][entry->hook],

skb, entry->hook,

entry->indev, entry->outdev, &elem,

entry->okfn, INT_MIN);

}

switch (verdict & NF_VERDICT_MASK) {

case NF_ACCEPT:

case NF_STOP:

local_bh_disable();

entry->okfn(skb);

local_bh_enable();

break;

case NF_QUEUE:

err = __nf_queue(skb, elem, entry->pf, entry->hook,

entry->indev, entry->outdev, entry->okfn,

verdict >> NF_VERDICT_QBITS);

if (err < 0) {

if (err == -ECANCELED)

goto next_hook;

if (err == -ESRCH &&

(verdict & NF_VERDICT_FLAG_QUEUE_BYPASS))

goto next_hook;

kfree_skb(skb);

}

break;

case NF_STOLEN:

break;

default:

kfree_skb(skb);

}

rcu_read_unlock();

kfree(entry);

}

阅读(5925) | 评论(0) | 转发(0) |

上一篇：NF_QUEUE原理分析5——从netlink_kernel_create开始

下一篇：ip 命令和ifconfig 命令删除IP

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6