对IOMMU的支持主要有两个原因,一个是对老设备的支持,另外一个是对scatter/gather的支持。
要在系统上支持32位设备,比如说,如果没有IOMMU,就需要在底端,也就是32位设备能够访问到的地方设置一个叫做"bounce buffers"的东西,如果设备要访问高端内存,就要在高端内存和"bounce buffers"之间做一个拷贝。带来的性能影响显而易见。如果有了IOMMU,这个问题就迎刃而解了。在做DMA绑定的时候,系统返回给驱动的不再是物理地址,而是的某个地址(有的书上叫做地址),传输的时候,这个内核空间地址会经由IOMMU单元,IOMMU将这个为物理地址。
scatter/gather并不会带来性能上的好处,但是会简化。例如在发送包的时候,DMA邦定后,系统可能会返回给多个不连续的物理地址,Solaris叫做cookie。这样的话,每一个cookie都需要占用一个发送描述符。如果系统支持IOMMU的话,系统只会返回给一个cookie。当然了有专家提醒,因为这个原因,如果是在没有IOMMU的情况下开发的,在支持IOMMU的系统上是没有问题的。但反之不然。
IOMMU除了上述功能外还加入了对虚拟化的支持。简单来说有两个功能,一个DMA Remapping, 另外一个是Interrupt Remapping。
IOMMU在源于SUN公司的SPARC平台,现在及AMD平台也支持这一技术。[1]