linux 2.6.32 Async_tx代码分析四-libing881-ChinaUnix博客

libing881的ChinaUnix博客

首页　| 　博文目录　| 　关于我

libing881

博客访问： 22932
博文数量： 7
博客积分： 190
博客等级：入伍新兵
技术积分： 100
用户组：普通用户
注册时间： 2011-08-11 11:02

文章分类

全部博文（7）

未分配的博文（7）

文章存档

2012年（7）

我的朋友

相关博文

linux 2.6.32 Async_tx代码分析四

分类： C/C++

2012-06-11 22:35:24

/**

* async_memcpy - attempt to copy memory with a dma engine.

* @dest: destination page

* @src: src page

* @dest_offset: offset into 'dest' to start transaction

* @src_offset: offset into 'src' to start transaction

* @len: length in bytes

* @submit: submission / completion modifiers

* honored flags: ASYNC_TX_ACK

首先关注一下入参，类似memcpy的用法，目的page，源page

注意，如果你要copy的数据，不满一个4k页面，就需要指定长度，目的偏移和源地址偏移

需要copy的长度，

唯一和一般memcpy操作不同的是最后一个异步提交管理结构体

struct dma_async_tx_descriptor *

async_memcpy(struct page *dest, struct page *src, unsigned int dest_offset,

unsigned int src_offset, size_t len,

struct async_submit_ctl *submit)

{

struct dma_chan *chan = async_tx_find_channel(submit, DMA_MEMCPY,

&dest, 1, &src, 1, len);

struct dma_device *device = chan ? chan->device : NULL;

struct dma_async_tx_descriptor *tx = NULL;

if (device && is_dma_copy_aligned(device, src_offset, dest_offset, len)) {

dma_addr_t dma_dest, dma_src;

unsigned long dma_prep_flags = 0;

if (submit->cb_fn)

dma_prep_flags |= DMA_PREP_INTERRUPT;

if (submit->flags & ASYNC_TX_FENCE)

dma_prep_flags |= DMA_PREP_FENCE;

/* 如果设置了回调，或者FENCE标志，则需要设置不同的标志位 */

dma_dest = dma_map_page(device->dev, dest, dest_offset, len,

DMA_FROM_DEVICE);

dma_src = dma_map_page(device->dev, src, src_offset, len,

DMA_TO_DEVICE);

tx = device->device_prep_dma_memcpy(chan, dma_dest, dma_src,

len, dma_prep_flags);

}

if (tx) {

pr_debug("%s: (async) len: %zu\n", __func__, len);

async_tx_submit(chan, tx, submit);

} else {

void *dest_buf, *src_buf;

pr_debug("%s: (sync) len: %zu\n", __func__, len);

/* wait for any prerequisite operations */

async_tx_quiesce(&submit->depend_tx);

dest_buf = kmap_atomic(dest, KM_USER0) + dest_offset;

src_buf = kmap_atomic(src, KM_USER1) + src_offset;

memcpy(dest_buf, src_buf, len);

kunmap_atomic(dest_buf, KM_USER0);

kunmap_atomic(src_buf, KM_USER1);

async_tx_sync_epilog(submit);

}

return tx;

}

首先注意一下，整个大的流程分成2部分，在接口中首先尝试获取dma驱动注册的设备，如果设备不存在，则使用同步方式也就是用cpu来进行搬运

换句话说，这个时候的async_memcpy和memcpy没有区别。分水岭就在判断tx是否为空上

最开始的时候，先通过async_tx_find_channel查找dma通道，注意这里是抽象概念，原来我们提到过，cpu厂商会提供几个硬件加速的能力

抽象成了通道，而有的厂商通过设置不同的寄存器，可以让通道完成不一样的功能。也有的厂商会写死通道能力，比如0号通道提供xor能力，其他的

通道提供内存加速能力，这些都要去看cpu手册。

然后通过通道找设备，如果设备在的话，注意这里有个判断is_dma_copy_aligned 地址是否对齐。也就是说使用的时候，如果cpu要求对其，则需要小心对齐问题，不然就不会用DMA搬运，而还是cpu搬运。

这里可以看到async_xxx接口屏蔽了cpu的能力，让上层应用，这里主要指的是raid，不需要关注cpu是否有DMA能力。只需要调用async接口就可以

应用处理可以简单很多。

dma_map_page起到的作用是，将应用给的地址，映射到dma设备可以看见的地址。

device_prep_dma_memcpy是调用dma驱动的接口，目的是做一些驱动内部的DMA准备，分配一些资源等等。这个和cpu有关，不一样的cpu，就有不一样的DMA加速驱动，内部实现机制也不同，有的是用中断，有的是发送消息等等，这里让驱动自己去准备。

当一切都正常后，这个接口返回一个dma_async_tx_descriptor，描述符

通过intel在内核中的驱动，Dma_v2.c，我们可以看到这个描述符tx，通常在一个DMA驱动的管理结构体的内部，通过这个tx，驱动可以找到内部管理结构。

当我们判断出tx不是空的时候，最后调用async_tx_submit来提交

这就是啦！

阅读(1835) | 评论(0) | 转发(0) |

上一篇：linux 2.6.32 Async_tx代码分析三

下一篇：没有了

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6