dma_alloc_coherent 与 dma_alloc_writecombine区别-yyxl-ChinaUnix博客

yyxl的ChinaUnix博客yyyw.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

yyxl

博客访问： 3628686
博文数量： 1805
博客积分： 135
博客等级：入伍新兵
技术积分： 3345
用户组：普通用户
注册时间： 2010-03-19 20:01

文章分类

全部博文（1805）

andriod（20）

display（4）
andriod（10）

display（7）
多媒体（25）
树莓派（1）
davinci（184）
linux（913）

oops（7）
未分配的博文（652）

文章存档

2017年（19）

2016年（80）

2015年（341）

2014年（438）

2013年（349）

2012年（332）

2011年（248）

我的朋友

相关博文

dma_alloc_coherent 与 dma_alloc_writecombine区别

分类： LINUX

2015-03-10 12:58:35

原文地址：dma_alloc_coherent 与 dma_alloc_writecombine区别作者：BENNYSNAKE

内核的dma一般在平台初始化的时候已经分配好了。但是对于一些有内部dma的硬件ip，比如usb ip、video加速ip，他们可能由ip厂商封装好的，没办法绑定到cpu端，这时候在内核使用dma就要注意了，因为dma只认识物理地址哦。

当然，办法还是有的，look：

以下来自：http://blog.csdn.net/zjujoe/archive/2009/05/15/4189612.aspx

这两天在做 DMA 相关开发，遇到一对分配 dma buffer 的函数，dma_alloc_coherent 与 dma_alloc_writecombine。不知其区别。 google 一下也没有得到信息。只好自己看代码。

原来 dma_alloc_coherent 在 arm 平台上会禁止页表项中的 C （Cacheable）域以及 B (Bufferable)域。

而 dma_alloc_writecombine 只禁止 C （Cacheable）域.

#define pgprot_noncached(prot) __pgprot(pgprot_val(prot) & ~(L_PTE_CACHEABLE | L_PTE_BUFFERABLE))
#define pgprot_writecombine(prot) __pgprot(pgprot_val(prot) & ~L_PTE_CACHEABLE)

进一步查找 ARM 书籍，原来 C 代表是否使用高速缓冲存储器，而 W 代表是否使用写缓冲区。

这样， dma_alloc_coherent 分配出来的内存不使用缓存，但是会使用写缓冲区。

而 dma_alloc_writecombine 则二者都不适用。

由此，再去理解 LDD3 上讲解的一致性 DMA 映射与流式 DMA 映射就比较容易了，一致性 DMA 映射调用的是上面的函数，由于关闭了 cache/buffer, 性能自然比较低。而流式则通过复杂的同步机制，没有付出性能的代价。

所以我们要尽量使用流式 DMA 来编程。

再去看看 mmc 驱动里使用的分散 / 聚集映射，原来也是一种流式 DMA 映射。

【补充】

讲了那么多没用，总结下用法：

1、页对齐内存大小：dma_map_size = PAGE_ALIGN(MY_DATA_SIZE + PAGE_SIZE);

MY_DATA_SIZE是你想分配的大小.

2、调用

A = dma_alloc_writecombine(B,C,D,GFP_KERNEL);

含义：

A: 内存的虚拟起始地址，在内核要用此地址来操作所分配的内存

B: struct device指针，可以平台初始化里指定，主要是dma_mask之类，可参考framebuffer

C: 实际分配大小，传入dma_map_size即可

D: 返回的内存物理地址，dma就可以用。

所以，A和D是一一对应的，只不过，A是虚拟地址，而D是物理地址。对任意一个操作都将改变缓冲区内容。当然要注意操作环境。

阅读(2899) | 评论(0) | 转发(0) |

上一篇：linux中关于dma_alloc_coherent的用法

下一篇：关于__setup 在内核中的作用

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6