从源码分析seqfile的使用-qxhgd-ChinaUnix博客

嵌入式Linux点滴

首页　| 　博文目录　| 　关于我

qxhgd

博客访问： 999613
博文数量： 403
博客积分： 27
博客等级：民兵
技术积分： 165
用户组：普通用户
注册时间： 2011-12-25 22:20

文章分类

全部博文（403）

私人（0）
内核（21）
Android（0）
Java（2）
用户态编程（48）
Linux驱动（33）
Linux网络（42）
脚本语言（48）
乱（91）
面试笔试题（8）
Linux嵌入式（28）
Linux操作（9）
未分配的博文（73）

文章存档

2016年（3）

2015年（16）

2014年（163）

2013年（222）

我的朋友

相关博文

从源码分析seqfile的使用

分类： LINUX

2014-01-29 16:31:34

原文地址：从源码分析seqfile的使用作者：xiezhendong1992

若干星期前分析proc的时候提到了seqfile，今天就来从源码角度分析一下seqfile的使用。网上关于seqfile的源码分析很少，直接讲 start next show stop如何写，这让人觉得莫名其妙。在分析之前可能需要了解一些关于vfs的知识，推荐http://www.ibm.com/developerworks/cn/linux/l-vfs/，写得实在是非常非常好。

以下分析基于2.6.35内核

先看主要我们自己要实现的4个函数：

struct seq_operations {
    void * (*start) (struct seq_file *m, loff_t *pos);
    void (*stop) (struct seq_file *m, void *v);
    void * (*next) (struct seq_file *m, void *v, loff_t *pos);
    int (*show) (struct seq_file *m, void *v);
};

都在一个结构体里，而这个结构体最后要存在哪里（文中所说的存放都是指地址的存放）？看seq_open的实现：

int seq_open(struct file *file, const struct seq_operations *op)
{
    struct seq_file *p = file->private_data;

    if (!p) {
        p = kmalloc(sizeof(*p), GFP_KERNEL);
        if (!p)
            return -ENOMEM;
        file->private_data = p;
    }
    memset(p, 0, sizeof(*p));
    mutex_init(&p->lock);
    p->op = op;
    file->f_version = 0;
    file->f_mode &= ~FMODE_PWRITE;
    return 0;
}
从seq_open看出seq_operations最后要存放在一个struct seq_file中，而这个seq_file结构体存放在file->private_data中。那最后是哪个函数调用start   next    show stop 这4个函数呢？以read为例，其过程为：

（syscall）read->vfs_read->seq_read, 最后在seq_read中调用start   next    show stop，这里注意seq_read是内核已经实现的，所以我们只需把struct file_operations中的read赋值为seq_read即可。当然，如果你觉的内核中的seq_read写的不符合你的要求，你也可自己实现seq_read，把struct file_operations中的read赋为你自己的seq_read。一般情况下，我们用内核提供的seq_read, seq_lseek, seq_release。。注意内核中的seq_open不能直接赋给struct file_operations中的open，我们需要写一个类似这样的：

static int my_seq_open(struct inode *ind, struct file *fp)
{
    return seq_open(fp, &seq_ops);
}
(seq_ops中的start，next，show，stop的实现最后讲，现在讲整体框架)

同样seq_write也不能直接用，这个seq_write是向buf写数据用的，也就是输出用的，这里不详解，我们只分析主要的seq_read。最后我们的struct file_operations应该是这样子：

static struct file_operations seq_fops = {
    .owner = THIS_MODULE,
    .open = my_seq_open,
    .read = seq_read,
    .llseek = seq_lseek,
    .release = seq_release,
};

有了操作集之后我们需要建个文件把操作集关联进去，于是我们的模块初始化就可以这么写：
static int __init seqfile_init(void)
{
    struct proc_dir_entry *ent;

    ent = create_proc_entry("xzd_seq", 0644, NULL);
    /*if error*/
    ent->proc_fops = &seq_fops;
    return 0;
}
创建一个proc文件，然后把这个文件和上面的操作集关联。有了以上的整体构建之后，我们现在根据seq_read源码去实现start，next， show，stiop。

132 ssize_t seq_read(struct file *file, char __user *buf, size_t size, loff_t *ppos)
133 {
134     struct seq_file *m = (struct seq_file *)file->private_data;
135     size_t copied = 0;
136     loff_t pos;
137     size_t n;
138     void *p;
139     int err = 0;
140
141     mutex_lock(&m->lock);
142
143     /* Don't assume *ppos is where we left it */
144     if (unlikely(*ppos != m->read_pos)) {
145         m->read_pos = *ppos;
146         while ((err = traverse(m, *ppos)) == -EAGAIN)
147             ;
148         if (err) {
149             /* With prejudice... */
150             m->read_pos = 0;
151             m->version = 0;
152             m->index = 0;
153             m->count = 0;
154             goto Done;
155         }
156     }
169     m->version = file->f_version;
170     /* grab buffer if we didn't have one */
171     if (!m->buf) {
172         m->buf = kmalloc(m->size = PAGE_SIZE, GFP_KERNEL);
173         if (!m->buf)
174             goto Enomem;
175     }
176     /* if not empty - flush it first */
177     if (m->count) {
178         n = min(m->count, size);
179         err = copy_to_user(buf, m->buf + m->from, n);
180         if (err)
181             goto Efault;
182         m->count -= n;
183         m->from += n;
184         size -= n;
185         buf += n;
186         copied += n;
187         if (!m->count)
188             m->index++;
189         if (!size)
190             goto Done;
191     }
192     /* we need at least one record in buffer */
193     pos = m->index;
194     p = m->op->start(m, &pos);
195     while (1) {
196         err = PTR_ERR(p);
197         if (!p || IS_ERR(p))
198             break;
199         err = m->op->show(m, p);
200         if (err < 0)
201             break;
202         if (unlikely(err))
203             m->count = 0;
204         if (unlikely(!m->count)) {
205             p = m->op->next(m, p, &pos);
206             m->index = pos;
207             continue;
208         }
209         if (m->count < m->size)
210             goto Fill;
211         m->op->stop(m, p);
212         kfree(m->buf);
213         m->buf = kmalloc(m->size <<= 1, GFP_KERNEL);
214         if (!m->buf)
215             goto Enomem;
216         m->count = 0;
217         m->version = 0;
218         pos = m->index;
219         p = m->op->start(m, &pos);
220     }
221     m->op->stop(m, p);
222     m->count = 0;
223     goto Done;

224 Fill:
225     /* they want more? let's try to get some more */
226     while (m->count < size) {
227         size_t offs = m->count;
228         loff_t next = pos;
229         p = m->op->next(m, p, &next);
230         if (!p || IS_ERR(p)) {
231             err = PTR_ERR(p);
232             break;
233         }
234         err = m->op->show(m, p);
235         if (m->count == m->size || err) {
236             m->count = offs;
237             if (likely(err <= 0))
238                 break;
239         }
240         pos = next;
241     }
242     m->op->stop(m, p);
243     n = min(m->count, size);
244     err = copy_to_user(buf, m->buf, n);
245     if (err)
246         goto Efault;
247     copied += n;
248     m->count -= n;
249     if (m->count)
250         m->from = n;
251     else
252         pos++;
253     m->index = pos;
254 Done:
255     if (!copied)
256         copied = err;
257     else {
258         *ppos += copied;
259         m->read_pos += copied;
260     }
261     file->f_version = m->version;
262     mutex_unlock(&m->lock);
263     return copied;
264 Enomem:
265     err = -ENOMEM;
266     goto Done;
267 Efault:
268     err = -EFAULT;
269     goto Done;
270 }

一开始mutex_lock，保证在多核处理器中也能正常工作。144~156的if判断防止由于某种情况（例如没有使用seq_printf.....等这组操作来输出数据）造成的*ppos != m->read_pos的情况。一般情况下144~156的if判断成立，则177~191的if判断也会成立，其效果就是会输出indx=0时*ppos字节以后的数据。具体看traverse函数，m->from代表m->buf的读指针，也就是从buf的什么位置开始读，m->count表示读多少字节，具体不再赘述，有兴趣可以自己看。

正常情况下，在171~175先kmalloc一个页大小buf。在194第一次执行p = m->op->start(m, &pos); 接下来在while(1)中err = m->op->show(m, p); 由此看出p应当是数据的首地址，所以start可以这样写：

假设有数据：static char *buf[] = {"123\n", "456\n", "789\n", NULL};

static void * seq_start (struct seq_file *m, loff_t *pos)
{
    return buf[*pos];
}
其中*pos是作为index，也就是指第几笔数据，在show中我们要输出数据：

static int seq_show (struct seq_file *m, void *v)
{
    seq_printf(m, "%s", (char *)v);
    return 0;
}
注意写数据要用seq_printf seq_write seq_puts等这组操作，在这些函数内部会更新，m->count m->size等值。
值得一题的是在show中，正常情况应该返回0，至于为什么，继续看源码。在show之后有3个if：

200         if (err < 0)
201             break;
202         if (unlikely(err))
203             m->count = 0;
204         if (unlikely(!m->count)) {
205             p = m->op->next(m, p, &pos);
206             m->index = pos;
207             continue;
208         }
第一个if 很明显出错情况，第二、三个if条件判断中都有一个unlikely宏，这个宏告诉编译器这个条件为0可能性比较大，这个宏对乱序执行的处理器有效，例如cortex-a8、a9、a15、a7，能提升流水线效率。从这能看出show期望返回0作为正常返回。如果show返回大于0的值，则m->count置0，第三个if成立，这就意味着这次向m->buf写数据无效，因为用seq_printf seq_write这类操作写数据，是往m->buf + m->count的地方开始写，也就是count为0则第二笔数据会覆盖前一笔数据。
继续执行，程序会跳转到Fill，顾名思义，填充数据，但是不用理会它什么填补填充的，改结束就结束。从226开始while (m->count < size)， p = m->op->next(m, p, &next); 这之前
next = pos，pos和m->index同步的，也就是索引值，在next函数中只要把它++就好，同时返回下一笔数据首地址，如果返回NULL则结束。

static void * seq_next (struct seq_file *m, void *v, loff_t *pos)
{
    ++*pos;
    return buf[*pos];
}
跳出循环之后执行m->op->stop(m, p); 由于简单写的不需要什么反操作，所以stop里什么也不做。

static void seq_stop (struct seq_file *m, void *v)
{

}
最后用err = copy_to_user(buf, m->buf, n);拷贝数据到用户空间中，同时更新m->count, m->index值，解锁。

最后一点值得注意的是，在210 goto Fill 那里， m->count < m->size不成立条件是，第一笔数据大于4K这时在seq_printf一系列操作中，m->count=m->size，这种情况下，会先kfree，再kmalloc 2倍m->size大小。如果是在Fill中数据超了，则只拷贝这笔数据前的数据到用户空间，所以用户态想要确保读到一定数量的数据，需要做循环读取。

总结：
seq_read代码写得很繁琐复杂，阅读可能稍显费力，但这恰恰也是它的优点，严谨。内核代码考虑到了很多错误情况，甚至有些不太可能发生的情况也包含在里面了。虽然，自己实现
seq_read会显得比较清晰，但很可能发生预料之外的事情，而用内核代码就没这种担忧，所以首选还是用内核提供的seq_read。

转载注明：
出自xiezhendong1992    chinaunix

阅读(1171) | 评论(0) | 转发(0) |

上一篇：c语言socket编程指南

下一篇： linux与windows文件共享设置

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6