闻亭的6446开发板上有256MB的DDR2内存,这部分内存默认的分配如下:- 0x80000000 .. 0x87800000 (0-120MB; size 120MB): Linux, booted with MEM=120M
- 0x87800000 .. 0x88000000 (120-128MB; size 8MB): CMEM -- shared buffers between Arm, DSP
- 0x88000000 .. 0x8FA00000 (128-250MB; size 122MB): DDRALGHEAP (*)-- DSP segment used exclusively for algorithm heaps
- 0x8FA00000 .. 0x8FE00000 (250-254MB; size 4MB): DDR (*)-- DSP segment for code, stack, static data, and system dynamic data
- 0x8FE00000 .. 0x8FF00000 (254-255MB; size 1MB): DSPLINKMEM (*) memory for DSPLINK
- 0x8FF00000 .. 0x8FF00080 (255MB-255MB; size 128B): CTRLRESET (*) memory for reset vectors)
- 0x8FF00080 .. 0x8FFFFFFF (255MB-256MB; size 1MB): waste
第一部分
这256MB内存的地址从0x80000000到0x8FFFFFFF,本文把这256MB内存称为外部内存(external memory)。外部内存实际上对于ARM和DSP是共享的,理论上讲ARM和DSP可以访问这中间的任何一个地址空间。
ARM通过MMU(Memory Manager Unit)来管理内存,它无法通过0x80000000到0x8FFFFFFF的物理地址来访问外部内存,而只能用虚拟地址通过MMU来访问。虚拟地址是用来限制ARM访问它没有权限的地址(ARM只对Linux和CMEM段有权限),当ARM端的用户进程试图访问其没有权限的地址时,linux系统会报一个“segmentation fault”的错误,并且将该进程kill掉。
DSP端是没有MMU的,它用的是物理地址。对于DSP,对整个256MB空间的访问都是没有限制的,也就是说它可以去写属于ARM的Linux(120M)的空间。这里在今后的编程中一定要注意,这个错误很隐蔽,较难发现。但没有MMU也带来一个问题,那就是DSP无法像ARM那样利用虚拟地址,无法将物理上不连续的内存区域映射为虚拟内存的连续区域。ARM分配的连续空间未必是物理上连续的,当将这个空间传递给DSP作为参数时就出现问题了,这也是CMEM存在的原因。
第二部分
下面对外部内存中各部分进行说明。
1、Linux:这没啥说的,是ARM上运行的montavista系统的内存;
2、CMEM:用于在ARM和DSP中间共享buffer数据,例如连续的图像数据。注:ARM端的应用程序通过CE传给DSP的buffer数据必须要用Memory_contigAlloc来分配在物理上连续的空间内。
3、DDRALGHEAP: 这里包含了DSP端运行的算法(当前active的codec的实例)使用的堆区。对于堆区的说明见第三部分。
4、DDR: 这里就存放DSP端除了堆区之外的数据,包括栈区,全局区,文字常量区,程序代码区。
5、DSPLINKMEM: 这里存放DSPLINK模块,该模块用于codec engine在ARM和DSP之间的通信。
6、CTRLRESET:存放DSP的复位向量表,它必须存放在奇数个MB的起始地址,因此一般情况下会在它之前一定要存在一个1MB的unused momery。并且这复位向量区的大小必须是128B。
7、waste: 也就是6中提到的unused momery。
第三部分
以下为转载,
一个由c/C++编译的程序占用的内存分为以下几个部分
1、栈区(stack)— 由编译器自动分配释放 ,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。
2、堆区(heap) — 一般由程序员分配释放, 若程序员不释放,程序结束时可能由OS回收 。注意它与数据结构中的堆是两回事,分配方式倒是类似于链表,呵呵。
3、全局区(静态区)(static)—,全局变量和静态变量的存储是放在一块的,初始化的全局变量和静态变量在一块区域, 未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。 - 程序结束后有系统释放
4、文字常量区 —常量字符串就是放在这里的。 程序结束后由系统释放
5、程序代码区—存放函数体的二进制代码。 下面是一个例子程序
这是一个前辈写的,非常详细
//main.cpp
int a = 0; 全局初始化区
char *p1; 全局未初始化区
main()
{
int b; 栈
char s[] = "abc"; 栈
char *p2; 栈
char *p3 = "123456"; 123456\0在常量区,p3在栈上。
static int c =0; 全局(静态)初始化区
p1 = (char *)malloc(10);
p2 = (char *)malloc(20);
分配得来得10和20字节的区域就在堆区。
strcpy(p1, "123456"); 123456\0放在常量区,编译器可能会将它与p3所指向的"123456"优化成一个地方。
}
到这里应该应该对堆区有了个基本的概念,还想进一步了解的可以去看第三部分的原文,地址已经给出。
第一部分和第二部分参考:TI的《Mastering the Art of Memory Map Configuration for DaVinci-Based Systems》(sqraaq6.pdf)
就写到这里了,吃饭去了~
阅读(2601) | 评论(0) | 转发(0) |