//*******************************************************
//* 2007.7.9
//*******************************************************
IISCON = (IISCON_TX_DMA /* Transmit DMA service request */
|IISCON_RX_IDLE /* Receive Channel idle */
|IISCON_PRESCALE); /* IIS Prescaler Enable */ 设置IIS 控制寄存器,参考S3C2410 芯片#sheet 中关于IIS 总线接口的章节,具体设置参数如下:
IISCON_TX_DMA = 1<<5 发送DMA 服务请求使能选择,设为1 表示使能发送DMA 服务请求
IISCON_RX_IDLE = 1<<2 接收通道空闲命令,设为1 表示接收通道空闲
IISCON_PRESCALE = 1<<1 IIS 预分频器使能选择,设为1 表示使能IIS 预分频器
IISMOD = (IISMOD_SEL_MA /* Master mode */
| IISMOD_SEL_TX /* Transmit */
| IISMOD_CH_RIGHT /* Low for left channel */
| IISMOD_FMT_MSB /* MSB-justified format */
| IISMOD_BIT_16 /* Serial # bit/channel is 16 bit */
| IISMOD_FREQ_384 /* Master clock freq = 384 fs */
| IISMOD_SFREQ_32); /* 32 fs */
设置IIS 模式寄存器,参考S3C2410 芯片#sheet 中关于IIS 总线接口的章节,具体设置参数如下:
IISMOD_SEL_MA = 0<<8 主从模式选择,设为0 表示选择主设备模式,则IISLRCK 和IISCLK 引脚为输出模式
IISMOD_SEL_TX = 2<<6 发送接收模式选择,设为2 表示选择发送模式
IISMOD_CH_RIGHT = 0<<5 左右通道激活等级,设为0 表示左通道为低,右通道为高
IISMOD_FMT_MSB = 1<<4 串行接口格式,设为1 表示以最高位有效位MSB 为参考格式(即左对齐数据帧格式)
IISMOD_BIT_16 = 1<<3 每个通道串行数据位数,设为1 表示每个通道16位数据
IISMOD_FREQ_384 = 1<<2 主设备时钟频率选择,设为1 表示384fs(fs 为采样频率)
IISMOD_SFREQ_32 = 1<<0 串行位时钟频率选择,设为1 表示32fs
IISFIFOC = (IISFCON_TX_DMA /* Transmit FIFO access mode: DMA */
| IISFCON_TX_EN); /* Transmit FIFO enable */
设置IIS FIFO 控制寄存器,参考S3C2410 芯片#sheet 中关于IIS 总线接口的章节,具体设置参数如下:
IISFCON_TX_DMA = 1<<15 发送FIFO 存取模式选择,设为1 表示为DMA 模式
IISFCON_TX_EN = 1<<13 发送FIFO 使能选择,设为1 表示使能发送FIFO
IISCON |= IISCON_EN; /* IIS enable(start) */
再次设置IIS 控制寄存器,参考S3C2410 芯片#sheet 中关于IIS 总线接口的章节,具体设置参数如下:
IISCON_EN = 1<<0 IIS 接口使能选择,设为1 表示使能IIS 接口
------------------------------------------------------------------------
计算预分频值函数:
static int iispsr_value(int s_bit_clock, int sample_rate)
tmpval384 = s3c2410_get_bus_clk(GET_PCLK) / s_bit_clock;
S3C2410 主频202M,它的APH 总线频率是202/4=50M,在经过IIS 的PSR(分频比例因子)得到的一个频率用于IIS 时钟输出也可以说是同步。
首先通过调用s3c2410_get_bus_clk 函数来获得总线时钟,然后除以传入的频率参数,这里相当于:
APH/384 = N*fs
这里表示总线时钟进行384 分频后的值。
其中s3c2410_get_bus_clk 及相关函数在/kernel/arch/arm/mach-s3c2410/cpu.c 文件和/kernel/include/asm-arm/arch-s3c2410/cpu_s3c2410.h 文件中,这里不再展开说明。
for (i = 0; i < 32; i++) {
tmpval = tmpval384/(i+1);
if (PCM_ABS((sample_rate - tmpval)) < tmpval384min) {
tmpval384min = PCM_ABS((sample_rate - tmpval));
prescaler = i;
}
}
配置预分频控制器A 的值的范围是0~31,所以这里i 也从0~31。后面的算法就不太清楚了,最后算出系统输出时钟为384fs 和音频采样频率fs为44.1KHz 的情况下,所需要的预分频值,并返回。
------------------------------------------------------------------------
接下来init_s3c2410_iis_bus_rx 函数与前面的init_s3c2410_iis_bus_tx 函数形式上也差不多:
static void init_s3c2410_iis_bus_rx(void)
IISCON = 0;
IISMOD = 0;
IISFIFOC = 0;
首先初始化IIS 控制寄存器,IIS 模式寄存器和IIS FIFO 控制寄存器都为0。
/* 44 KHz , 384fs */
IISPSR = (IISPSR_A(iispsr_value(S_CLOCK_FREQ, 44100))
| IISPSR_B(iispsr_value(S_CLOCK_FREQ, 44100)));
设置IIS 预分频寄存器,参考S3C2410 芯片#sheet 中关于IIS 总线接口的章节,具体设置参数如下:
IISPSR_A(iispsr_value(S_CLOCK_FREQ, 44100)) = IISPSR_A(iispsr_value(384, 44100)) = (一个0~31 之间的值)<<5 预分频控制器A,用于内部时钟块
IISPSR_B(iispsr_value(S_CLOCK_FREQ, 44100))) = (一个0~31 之间的值)<<0 预分频控制器B,用于外部时钟块
IISCON = (IISCON_RX_DMA /* Transmit DMA service request */
|IISCON_TX_IDLE /* Receive Channel idle */
|IISCON_PRESCALE); /* IIS Prescaler Enable */
设置IIS 控制寄存器,参考S3C2410 芯片#sheet 中关于IIS 总线接口的章节,具体设置参数如下:
IISCON_RX_DMA = 1<<4 接收DMA 服务请求使能选择,设为1 表示使能接收DMA 服务请求
IISCON_TX_IDLE = 1<<3 发送通道空闲命令,设为1 表示发送通道空闲
IISCON_PRESCALE = 1<<1 IIS 预分频器使能选择,设为1 表示使能IIS 预分频器
IISMOD = (IISMOD_SEL_MA /* Master mode */
| IISMOD_SEL_RX /* Transmit */
| IISMOD_CH_RIGHT /* Low for left channel */
| IISMOD_FMT_MSB /* MSB-justified format */
| IISMOD_BIT_16 /* Serial # bit/channel is 16 bit */
| IISMOD_FREQ_384 /* Master clock freq = 384 fs */
| IISMOD_SFREQ_32); /* 32 fs */
设置IIS 模式寄存器,参考S3C2410 芯片#sheet 中关于IIS 总线接口的章节,具体设置参数如下:
IISMOD_SEL_MA = 0<<8 主从模式选择,设为0 表示选择主设备模式,则IISLRCK 和IISCLK 引脚为输出模式
IISMOD_SEL_RX = 1<<6 发送接收模式选择,设为1 表示选择接收模式
IISMOD_CH_RIGHT = 0<<5 左右通道激活等级,设为0 表示左通道为低,右通道为高
IISMOD_FMT_MSB = 1<<4 串行接口格式,设为1 表示以最高位有效位MSB 为参考格式(即左对齐数据帧格式)
IISMOD_BIT_16 = 1<<3 每个通道串行数据位数,设为1 表示每个通道16位数据
IISMOD_FREQ_384 = 1<<2 主设备时钟频率选择,设为1 表示384fs(fs 为采样频率)
IISMOD_SFREQ_32 = 1<<0 串行位时钟频率选择,设为1 表示32fs
IISFIFOC = (IISFCON_RX_DMA /* Transmit FIFO access mode: DMA */
| IISFCON_RX_EN); /* Transmit FIFO enable */
设置IIS FIFO 控制寄存器,参考S3C2410 芯片#sheet 中关于IIS 总线接口的章节,具体设置参数如下:
IISFCON_RX_DMA = 1<<14 接收FIFO 存取模式选择,设为1 表示为DMA 模式
IISFCON_RX_EN = 1<<12 接收FIFO 使能选择,设为1 表示使能接收FIFO
IISCON |= IISCON_EN; /* IIS enable(start) */
再次设置IIS 控制寄存器,参考S3C2410 芯片#sheet 中关于IIS 总线接口的章节,具体设置参数如下:
IISCON_EN = 1<<0 IIS 接口使能选择,设为1 表示使能IIS 接口
以上两个对S3C2410 芯片的IIS 相关寄存器进行配置的函数只是分别针对收发模式配置了相应的收发功能,其他配置方面都一样。
------------------------------------------------------------------------
再来看一下audio_clear_buf 这个函数,该函数的主要任务就是对DMA 缓冲区进行清空:
static void audio_clear_buf(audio_stream_t * s)
s3c2410_dma_flush_all(s->dma_ch);
调用该函数来刷新所指定的DMA 通道缓冲区。
在/kernel/arch/arm/mach-s3c2410/dma.c 文件中:
int s3c2410_dma_flush_all(dmach_t channel)
这个函数会释放所指定的DMA 通道对应的内存缓冲区。
if (s->buffers) {
int frag;
for (frag = 0; frag < s->nbfrags; frag++) {
if (!s->buffers[frag].master)
continue;
consistent_free(s->buffers[frag].start,
s->buffers[frag].master,
s->buffers[frag].dma_addr);
}
kfree(s->buffers);
s->buffers = NULL;
}
接下来判断,如果环形缓冲区不为空,通过调用consistent_free 函数来释放环形缓冲区中的s->nbfrags 个buffer 所分配的内存空间,其中s->buffers[frag].master 表示buffer 所分配的内存大小。最后调用kfree 函数,将整个s->buffers 指针所指的已分配的内存释放掉,并将它设为空指针。
在/kernel/arch/arm/mm/consistent.c 文件中:
/*
* free a page as defined by the above mapping. We expressly forbid
* calling this from interrupt context.
*/
void consistent_free(void *vaddr, size_t size, dma_addr_t handle)
该函数的参数vaddr 为指向内存虚拟地址起始地址的指针,size 为要释放的内存大小,handle 为所分配的内存物理地址的起始地址。
s->buf_idx = 0;
s->buf = NULL;
最后将环形缓冲区buffer 索引号和当前buf 指针都清空,返回。
------------------------------------------------------------------------
下面来看一下,DMA 写入和读取的两个回调函数audio_dmaout_done_callback,audio_dmain_done_callback,当DMA 写入或读取完成就会产生中断,并调用这两个中断处理函数。在分析这两个函数之前,需要重新了解一下这两个函数被调用的过程以及传入参数的意义。
从前面对申请DMA 通道函数的分析中,可以知道DMA 写入和读取的中断处理函数是在s3c2410_dma_done 函数中被调用的,而s3c2410_dma_done 函数又是在真正的DMA 中断处理函数dma_irq_handler 中被调用的。
在/kernel/arch/arm/mach-s3c2410/dma.c 文件中:
static void dma_irq_handler(int irq, void *dev_id, struct pt_regs *regs)
{
s3c2410_dma_t *dma = (s3c2410_dma_t *)dev_id;
DPRINTK(__FUNCTION__"\n");
s3c2410_dma_done(dma);
}
在该函数中,首先定义了一个s3c2410_dma_t 结构的指针变量指向中断处理程序的参数dev_id,然后将它再作为参数传入s3c2410_dma_done 函数中。
接着在s3c2410_dma_done 函数中做如下操作:
static inline void s3c2410_dma_done(s3c2410_dma_t *dma)
{
dma_buf_t *buf = dma->curr;
dma_callback_t callback;
if (buf->write) callback = dma->write.callback;
else callback = dma->read.callback;
#ifdef HOOK_LOST_INT
stop_dma_timer();
#endif
DPRINTK("IRQ: b=%#x st=%ld\n", (int)buf->id, (long)dma->regs->DSTAT);
if (callback)
callback(buf->id, buf->size);
kfree(buf);
dma->active = 0;
process_dma(dma);
}
在该函数中又定义了一个dma_buf_t 结构的指针变量,指向了参数中的dma->curr,即指向当前DMA 缓冲区的指针。
在/kernel/arch/arm/mach-s3c2410/dma.h 文件中:
/* DMA buffer struct */
typedef struct dma_buf_s {
int size; /* buffer size */
dma_addr_t dma_start; /* starting DMA address */
int ref; /* number of DMA references */
void *id; /* to identify buffer from outside */
int write; /* 1: buf to write , 0: but to read */
struct dma_buf_s *next; /* next buf to process */
} dma_buf_t;
/* DMA channel structure */
typedef struct {
dmach_t channel;
unsigned int in_use; /* Device is allocated */
const char *device_id; /* Device name */
dma_buf_t *head; /* where to insert buffers */
dma_buf_t *tail; /* where to remove buffers */
dma_buf_t *curr; /* buffer currently DMA'ed */
unsigned long queue_count; /* number of buffers in the queue */
int active; /* 1 if DMA is actually processing # */
dma_regs_t *regs; /* points to appropriate DMA registers */
int irq; /* IRQ used by the channel */
dma_device_t write; /* to write */
dma_device_t read; /* to read */
} s3c2410_dma_t;
然后根据buf->write 这个DMA 读写标志来对callback 函数指针进行设置,是指向写DMA 函数dma->write.callback,还是读DMA 函数dma->read.callback。最后在调用该函数指针所指的函数时将buf->id,buf->size 这两个值作为参数传入,即是原来定义在dma_irq_handler 函数中的dma 变量的dma->curr->id 和dma->curr->size,分别表示当前DMA 缓冲区的id 号和缓冲区大小。
现在可以先来看一下DMA 写入中断处理函数audio_dmaout_done_callback:
static void audio_dmaout_done_callback(void *buf_id, int size)
audio_buf_t *b = (audio_buf_t *) buf_id;
在该函数中首先就定义了一个audio_buf_t 结构的指针变量,并指向传入的参数。
up(&b->sem);
up 函数在这里表示释放信号量,关于该函数和另一个down 函数的具体细节会在后面说明。
wake_up(&b->sem.wait);
最后调用wake_up 函数来唤醒所有在等待该信号量的进程。对于该函数的说明可以参考一篇《关于linux内核中等待队列的问题》的文档。
在/kernel/include/linux/sched.h 文件中:
#define wake_up(x) __wake_up((x),TASK_UNINTERRUPTIBLE | TASK_INTERRUPTIBLE, 1)
该宏函数定义为__wake_up 函数,参数TASK_INTERRUPTIBLE 为1,TASK_UNINTERRUPTIBLE 为2,两者相或,表示将wait_queue list 中 process->state 是TASK_INTERRUPTIBLE 或TASK_UNINTERRUPTIBLE 的所有进程叫醒。
在/kernel/kernel/sched.c 文件中:
void __wake_up(wait_queue_head_t *q, unsigned int mode, int nr)
{
if (q) {
unsigned long flags;
wq_read_lock_irqsave(&q->lock, flags);
__wake_up_common(q, mode, nr, 0);
wq_read_unlock_irqrestore(&q->lock, flags);
}
}
宏函数wq_read_lock_irqsave 的作用主要就是保存IRQ 和FIQ 的中断使能状态,并禁止IRQ 中断;而宏函数wq_read_unlock_irqrestore 的作用就是恢复IRQ 和FIQ 的中断使能状态。现在可以得知__wake_up 这个函数的作用,它首先保存IRQ 和FIQ 的中断使能状态,并禁止IRQ 中断,接着调用__wake_up_common 函数来唤醒等待q 队列的进程,最后再恢复IRQ 和FIQ 的中断使能状态。
//*******************************************************
//* 2007.7.10
//*******************************************************
down()操作可以理解为申请资源,up()操作可以理解为释放资源,因此,信号量实际表示的是资源的数量以及是否有进程正在等待。
在/kernel/include/asm-arm/semaphore.h 文件中:
struct semaphore {
atomic_t count;
int sleepers;
wait_queue_head_t wait;
#if WAITQUEUE_DEBUG
long __magic;
#endif
};
在semaphore 结构中,count 相当于资源计数,为正数或0 时表示可用资源数,-1 则表示没有空闲资源且有等待进程。而等待进程的数量并不关心。这种设计主要是考虑与信号量的原语相一致,当某个进程执行up 函数释放资源,点亮信号灯时,如果count 恢复到0,则表示尚有进程在等待该资源,因此执行唤醒操作。
一个典型的down()-up()流程是这样的:
down()-->count做原子减1操作,如果结果不小于0则表示成功申请,从down()中返回;
-->如果结果为负(实际上只可能是-1),则表示需要等待,则调用__down_fail();
__down_fail()调用__down(),__down()用C代码实现,要求已不如down()和__down_fail()严格,在此作实际的等待。
在/kernel/include/asm-arm/semaphore.h 文件中:
/*
* Note! This is subtle. We jump to wake people up only if
* the semaphore was negative (== somebody was waiting on it).
* The default case (no contention) will result in NO
* jumps for both down() and up().
*/
static inline void up(struct semaphore * sem)
{
#if WAITQUEUE_DEBUG
CHECK_MAGIC(sem->__magic);
#endif
__up_op(sem, __up_wakeup);
}
在/kernel/include/asm-arm/proc-armo/locks.h 文件中:
#define __up_op(ptr,wake) \
({ \
__asm__ __volatile__ ( \
"@ up_op\n" \
" mov ip, pc\n" \
" orr lr, ip, #0x08000000\n" \
" teqp lr, #0\n" \
" ldr lr, [%0]\n" \
" and ip, ip, #0x0c000003\n" \
" adds lr, lr, #1\n" \
" str lr, [%0]\n" \
" orrle ip, ip, #0x80000000 @ set N - should this be mi ??? DAG ! \n" \
" teqp ip, #0\n" \
" movmi ip, %0\n" \
" blmi " SYMBOL_NAME_STR(wake) \
: \
: "r" (ptr) \
: "ip", "lr", "cc"); \
})
用ARM 汇编指令完成对信号量加一计数后,调用了wake 为标号的子程序,即传入的参数__up_wakeup 标号所在的子程序。
在/kernel/arch/arm/kernel/semaphore.c 文件中:
__up_wakeup: \n\
stmfd sp!, {r0 - r3, lr} \n\
mov r0, ip \n\
bl __up \n\
ldmfd sp!, {r0 - r3, pc}^ \n\
这里又调用了__up 函数。
void __up(struct semaphore *sem)
{
wake_up(&sem->wait);
}
最后在该函数中调用了wake_up 函数来唤醒所有等待信号量的进程,wake_up 函数在上面已经有过说明。
如果这样的话,就有一个问题,在上面的audio_dmaout_done_callback 函数中,先后调用了这两个函数:
up(&b->sem);
wake_up(&b->sem.wait);
其实在up 函数中也调用了wake_up 函数,这样不是重复调用了wake_up 函数嘛,不知道为什么。
------------------------------------------------------------------------
再来看一下DMA 读取中断处理函数audio_dmain_done_callback:
static void audio_dmain_done_callback(void *buf_id, int size)
audio_buf_t *b = (audio_buf_t *) buf_id;
在该函数中首先就定义了一个audio_buf_t 结构的指针变量,并指向传入的参数。
b->size = size;
将b->size 赋值为传入的参数,即当前缓冲区的大小。
up(&b->sem);
wake_up(&b->sem.wait);
这两步和DMA 写入中断处理函数一样,调用up 函数释放信号量,然后再调用wake_up 函数来唤醒所有在等待该信号量的进程。
------------------------------------------------------------------------
继续来看一下释放设备函数smdk2410_audio_release:
static int smdk2410_audio_release(struct inode *inode, struct file *file)
if (file->f_mode & FMODE_READ) {
if (audio_rd_refcount == 1)
audio_clear_buf(&input_stream);
audio_rd_refcount = 0;
}
该函数中,首先根据file->f_mode 判断文件是否可读,若为读取模式,则继续根据变量audio_rd_refcount 来判断,若已经用读取模式打开过该设备文件,则调用audio_clear_buf 函数来清空输入音频DMA 缓冲区,接着把audio_rd_refcount 这个读占位标志清零。
if(file->f_mode & FMODE_WRITE) {
if (audio_wr_refcount == 1) {
audio_sync(file);
audio_clear_buf(&output_stream);
audio_wr_refcount = 0;
}
}
接着再根据file->f_mode 判断文件是否可写,若为写入模式,则继续根据变量audio_wr_refcount 来判断,若已经用写入模式打开过该设备文件,则先调用audio_sync 函数来保存内存数据到flash,该函数会在后面说明。然后再调用audio_clear_buf 函数来清空输出音频DMA 缓冲区,接着把audio_wr_refcount 这个写占位标志清零。
MOD_DEC_USE_COUNT;
最后调用MOD_DEC_USE_COUNT; 来对设备文件计数器减一计数,并返回。
------------------------------------------------------------------------
下面来仔细分析一下写设备文件函数smdk2410_audio_write,在该函数中创建了DMA 缓冲区,并对DMA 缓冲区进行了写入的操作,函数原型如下:
static ssize_t smdk2410_audio_write(struct file *file, const char *buffer,
size_t count, loff_t * ppos)
audio_stream_t *s = &output_stream;
该函数首先又定义了一个audio_stream_t 结构的指针变量指向输出音频缓冲区。
switch (file->f_flags & O_ACCMODE) {
case O_WRONLY:
case O_RDWR:
break;
default:
return -EPERM;
}
然后根据file->f_flags 这个表示设备文件的打开方式是读取,写入,还是可读写的标志进行判断,若为写入或可读写则继续执行,否则就会返回退出。
if (!s->buffers && audio_setup_buf(s))
return -ENOMEM;
这里通过s->buffers 指针是否为空来判断有没有创建过DMA 缓冲区。若s->buffers 指针不为空,则表示已经创建过DMA 缓冲区,那么就不会执行audio_setup_buf 函数了;若s->buffers 指针为空,则就会执行audio_setup_buf 函数来创建DMA 缓冲区,创建成功的话就会返回0,这样就会继续执行下面的代码。该函数会在后面说明。
count &= ~0x03;
由于DMA 数据必须4字节对齐传输,即每次传输4个字节,因此驱动程序需要保证每次写入的数据都是4的倍数。这样屏蔽掉所要写入字节数的最后2位就是4的倍数了。
while (count > 0) {
若要写入的字节数大于0,则进入一个while 大循环。
audio_buf_t *b = s->buf;
在大循环一开始就定义了一个audio_buf_t 结构的指针变量指向前面定义的输出音频缓冲区里的当前缓冲区指针。
if (file->f_flags & O_NONBLOCK) {
ret = -EAGAIN;
if (down_trylock(&b->sem))
break;
} else {
ret = -ERESTARTSYS;
if (down_interruptible(&b->sem))
break;
}
然后根据file->f_flags 与上O_NONBLOCK 值来进行判断。O_NONBLOCK 值表示采用非阻塞的文件IO方法,如果O_NONBLOCK 标记被设置,文件描述符将不被阻塞而被直接返回替代。一个例子是打开tty。如果用户不在终端调用里输入任何东西,read 将被阻塞,直到用户有输入,当O_NONBLOCK 标记被设置,read 调用将直接返回设置到EAGAIN 的值。
这里若应用程序在调用write 函数时加入了O_NONBLOCK 参数,则会调用down_trylock 函数来试着获得信号量sem,如果能够立刻获得,它就获得该信号量并返回0,否则,表示不能获得信号量sem,返回值为非0值。该函数与相关函数在一篇《Linux内核的同步机制》中有详细说明。
在/kernel/include/asm-arm/semaphore.h 文件中:
static inline int down_trylock(struct semaphore *sem)
{
#if WAITQUEUE_DEBUG
CHECK_MAGIC(sem->__magic);
#endif
return __down_op_ret(sem, __down_trylock_failed);
}
在/kernel/include/asm-arm/proc-armo/locks.h 文件中:
#define __down_op_ret(ptr,fail) \
({ \
unsigned int result; \
__asm__ __volatile__ ( \
" @ down_op_ret\n" \
" mov ip, pc\n" \
" orr lr, ip, #0x08000000\n" \
" teqp lr, #0\n" \
" ldr lr, [%1]\n" \
" and ip, ip, #0x0c000003\n" \
" subs lr, lr, #1\n" \
" str lr, [%1]\n" \
" orrmi ip, ip, #0x80000000 @ set N\n" \
" teqp ip, #0\n" \
" movmi ip, %1\n" \
" movpl ip, #0\n" \
" blmi " SYMBOL_NAME_STR(fail) "\n" \
" mov %0, ip" \
: "=&r" (result) \
: "r" (ptr) \
: "ip", "lr", "cc"); \
result; \
})
用ARM 汇编指令完成对信号量减一计数后,调用了fail 为标号的子程序,即传入的参数__down_trylock_failed 标号所在的子程序。
在/kernel/arch/arm/kernel/semaphore.c 文件中:
__down_trylock_failed: \n\
stmfd sp!, {r0 - r3, lr} \n\
mov r0, ip \n\
bl __down_trylock \n\
mov ip, r0 \n\
ldmfd sp!, {r0 - r3, pc}^ \n\
这里又调用了__down_trylock 函数。
/*
* Trylock failed - make sure we correct for
* having decremented the count.
*
* We could have done the trylock with a
* single "cmpxchg" without failure cases,
* but then it wouldn't work on a 386.
*/
int __down_trylock(struct semaphore * sem)
{
int sleepers;
unsigned long flags;
spin_lock_irqsave(&semaphore_lock, flags);
sleepers = sem->sleepers + 1;
sem->sleepers = 0;
/*
* Add "everybody else" and us into it. They aren't
* playing, because we own the spinlock.
*/
if (!atomic_add_negative(sleepers, &sem->count))
wake_up(&sem->wait);
spin_unlock_irqrestore(&semaphore_lock, flags);
return 1;
}
这里不再进一步深入说明。
若应用程序在调用write 函数时没有加入了O_NONBLOCK 参数,即表示采用阻塞的文件IO方式,则会调用down_interruptible 函数来获得信号量sem。该函数将把sem 的值减1,如果信号量sem 的值非负,就直接返回,否则调用者将被挂起,直到别的任务释放该信号量才能继续运行。down_interruptible 函数能被信号打断,因此该函数有返回值来区分是正常返回还是被信号中断,如果返回0,表示获得信号量正常返回,如果被信号打断,返回-EINTR。该函数与相关函数在一篇《Linux内核的同步机制》中有详细说明。
在/kernel/include/asm-arm/semaphore.h 文件中:
/*
* This is ugly, but we want the default case to fall through.
* "__down_interruptible" is the actual routine that waits...
*/
static inline int down_interruptible (struct semaphore * sem)
{
#if WAITQUEUE_DEBUG
CHECK_MAGIC(sem->__magic);
#endif
return __down_op_ret(sem, __down_interruptible_failed);
}
函数__down_op_ret 在上面已经有过说明。
在/kernel/arch/arm/kernel/semaphore.c 文件中:
__down_interruptible_failed: \n\
stmfd sp!, {r0 - r3, lr} \n\
mov r0, ip \n\
bl __down_interruptible \n\
mov ip, r0 \n\
ldmfd sp!, {r0 - r3, pc}^ \n\
这里又调用了__down_interruptible 函数。
int __down_interruptible(struct semaphore * sem)
这里不再进一步深入说明。
if (audio_channels == 2) {
chunksize = s->fragsize - b->size;
if (chunksize > count)
chunksize = count;
DPRINTK("write %d to %d\n", chunksize, s->buf_idx);
if (copy_from_user(b->start + b->size, buffer, chunksize)) {
up(&b->sem);
return -EFAULT;
}
b->size += chunksize;
}
下面继续对音频通道数量进行判断,如果音频通道数为先前打开设备文件时设的2通道,则进入执行。
//*******************************************************
//* 2007.7.11
//*******************************************************
对于“chunksize = s->fragsize - b->size”这一句一开始一直不太理解,不知道为什么要将音频缓冲区片大小减去DMA 缓冲区大小作为写入的数据长度,这两个量的大小是一样的,这样一减不是变为0 了吗?现在觉得其实b->size 只是一个缓冲区地址的偏移量,一开始这个偏移量应该为0,这样就不难理解用s->fragsize 作为写入的数据长度。
接下去判断,如果所要写入的数据长度count 小于chunksize 值,那就以count 为准备写入数据的长度。在count 大于chunksize 的情况下,写入的数据长度以一个s->fragsize 大小为单位。
然后调用了copy_from_user 函数将用户空间buffer 里的数据复制到内核空间起始地址为b->start + b->size 的内存中,复制数据长度为chunksize。这里b->start 为指向环形缓冲区中第0个缓冲区地址的内存起始地址(虚拟地址),用这个起始地址加上缓冲区地址的偏移量(0)还是指向第0个缓冲区地址(共8个)的起始地址(虚拟地址)。
若copy_from_user 函数执行成功,则返回0,继续执行将缓冲区地址的偏移量b->size 加上已写入的数据长度chunksize。若copy_from_user 函数执行失败,就调用up 函数释放信号量,并退出写设备文件函数。
else {
chunksize = (s->fragsize - b->size) >> 1;
if (chunksize > count)
chunksize = count;
DPRINTK("write %d to %d\n", chunksize*2, s->buf_idx);
if (copy_from_user_mono_stereo(b->start + b->size,
buffer, chunksize)) {
up(&b->sem);
return -EFAULT;
}
b->size += chunksize*2;
}
如果音频通道数不等于先前打开设备文件时设的2通道,则进入执行。这里暂时先不进行分析,以后再来分析。
buffer += chunksize;
count -= chunksize;
当把一组音频缓冲区片大小的数据写入内存后,用户层的buffer 指针加上已写入数据的长度,即指向了下一组将要写入的数据。所要写入的数据长度count 减去已写入数据的长度,为还要写入数据的长度。
if (b->size < s->fragsize) {
up(&b->sem);
break;
}
若缓冲区地址的偏移量b->size 小于频缓冲区片大小,则调用up 函数释放信号量,并跳出while 大循环。但是一般情况不会进入该条件语句执行。
s3c2410_dma_queue_buffer(s->dma_ch, (void *) b,
b->dma_addr, b->size, DMA_BUF_WR);
该函数完成了管理DMA 缓冲区的相关数据结构s3c2410_dma_t 和dma_buf_t 进行了设置,并对S3C2410 芯片的DMA 控制器部分的相关寄存器进行了相应配置。传入的参数为DMA 通道号,一个空指针,DMA 缓冲区的物理起始地址,DMA 缓冲区大小,DMA 缓冲区工作模式,这里工作模式为写DMA 缓冲区。
该函数原型在/kernel/arch/arm/mach-s3c2410/dma.c 文件中,会在后面专门进行分析。
b->size = 0;
NEXT_BUF(s, buf);
}
在while 大循环最后将缓冲区地址的偏移量b->size 清零,然后调用宏函数NEXT_BUF 来将当前缓冲区的指针指向环形缓冲区中下一个缓冲区地址处。所以在对DMA 缓冲区进行填写的前后,缓冲区地址的偏移量b->size 都为0。
接着如果要写入的数据长度count 还大于0,则继续在该循环中执行。
#define NEXT_BUF(_s_,_b_) { \
(_s_)->_b_##_idx++; \
(_s_)->_b_##_idx %= (_s_)->nbfrags; \
(_s_)->_b_ = (_s_)->buffers + (_s_)->_b_##_idx; }
该宏函数相当与执行了一下语句:
s->buf_idx++;
s->buf_idx %= s->nbfrags;
s->buf = s->buffers + s->buf_idx;
先将环形缓冲区索引号加一,并取模音频缓冲区片个数(8),这样就得到了绕环递增的环形缓冲区序号。最后将当前缓冲区的指针指向环形缓冲区起始地址加上新的索引号,即指向了环形缓冲区中的下一组缓冲区地址。
if ((buffer - buffer0))
ret = buffer - buffer0;
return ret;
当count 长度的数据都写完后,就退出while 大循环。一开始定义了一个buffer0 的指针指向了buffer 的起始地址,在写数据的过程中,buffer 指针进行过向后移动,而buffer0 指针不变,buffer - buffer0 就得到了总共写入的数据长度,并将该长度值返回。
------------------------------------------------------------------------
马上来看一下创建DMA 缓冲区的函数audio_setup_buf:
static int audio_setup_buf(audio_stream_t * s)
if (s->buffers)
return -EBUSY;
若环形缓冲区指针s->buffers 不为空的话,则立即返回。表示已经创建过DMA 缓冲区了,则不再重复创建。
s->nbfrags = audio_nbfrags;
s->fragsize = audio_fragsize;
接着分别将音频缓冲区片数量和音频缓冲区片大小赋值给audio_stream_t 结构中相应的成员,s->nbfrags 音频缓冲区片数量为8,s->fragsize 音频缓冲区片大小为8192。
s->buffers = (audio_buf_t *)
kmalloc(sizeof(audio_buf_t) * s->nbfrags, GFP_KERNEL);
调用kmalloc 函数来申请环形缓冲区所需要的内存空间,返回值为所分配内存空间的起始地址,且为物理地址。再将audio_stream_t 结构的环形缓冲区指针s->buffers 指向转换为audio_buf_t 结构指针的内存起始地址(物理地址)。这里申请的只是结构体所需要的空间容量,而不是DMA 缓冲区。
if (!s->buffers)
goto err;
如果内存空间申请成功,则s->buffers 指针不为空,继续执行,否则直接跳到err 标号处执行。
memset(s->buffers, 0, sizeof(audio_buf_t) * s->nbfrags);
调用memset 函数对刚才分配的那块内存空间进行清零操作。
for (frag = 0; frag < s->nbfrags; frag++)
接着进入一个for 大循环,对连续的s->nbfrags 个音频缓冲区片进行操作。
{
audio_buf_t *b = &s->buffers[frag];
首先又定义了一个audio_buf_t 结构的指针变量指向audio_stream_t 结构变量的各个缓冲区地址s->buffers[frag],其中frag 从0~8,即8个缓冲区组成一个环形缓冲区。
if (!dmasize) {
dmasize = (s->nbfrags - frag) * s->fragsize;
接着进行判断,如果dmasize 为0,则继续执行。这里一开始就定义了dmasize 为0。一开始,先将dmasize 赋值为所需要的最大的缓冲区空间,即(8-0)*8192。
do {
dmabuf = consistent_alloc(GFP_KERNEL|GFP_DMA,
dmasize, &dmaphys);
if (!dmabuf)
dmasize -= s->fragsize;
} while (!dmabuf && dmasize);
下面又进入一个do while 循环,调用consistent_alloc 函数来进行内存分配,该函数在《LCD驱动程序分析》一文中有过详细分析。通过调用该函数来分配先前dmasize 大小的内存空间(所需要的最大的缓冲区空间)。返回两个值,一个是dmabuf,为所分配内存空间的起始地址,为虚拟地址;另一个是dmaphys,也为所分配内存空间的起始地址,为物理地址。
如果返回的dmabuf 值为0,则表示内存没有申请成功,那么要分配的内存空间dmasize 就需要进行减少,减去一个缓冲区片大小,再调用consistent_alloc 函数进行内存分配,知道分配成功或dmasize 为0 才退出循环。
if (!dmabuf)
goto err;
如果最后dmabuf 值还为0,则表示内存没有申请成功,直接跳到err 标号处执行。
b->master = dmasize;
}
接着把所分配的内存大小赋值给b->master 表示内存大小的结构参数。
b->start = dmabuf;
b->dma_addr = dmaphys;
将所分配的内存空间起始地址的虚拟地址赋值给b->start 这个虚拟地址指针,物理地址赋值给b->dma_addr 这个DMA 缓冲区地址。
sema_init(&b->sem, 1);
调用sema_init 函数来初始化一个信号量,将信号量的初值设置为1。
在/kernel/include/asm-arm/semaphore.h 文件中:
static inline void sema_init(struct semaphore *sem, int val)
关于该函数和相关函数的说明可以参考一篇《Linux内核的同步机制》的文档。
dmabuf += s->fragsize;
dmaphys += s->fragsize;
dmasize -= s->fragsize;
}
在for 大循环的最后,将所分配内存起始地址的虚拟地址和物理地址都加上音频缓冲区片的大小,而总的缓冲区空间大小是减去音频缓冲区片的大小。前面两个参数都将作为下一个缓冲区地址audio_buf_t 结构中的虚拟地址指针和DMA 缓冲区地址的参数。
如果dmasize 不为0 的话,在进入下一次循环时,就不会进入do while 循环进行内存空间的分配了。但是如果第一次没有分配到8 个音频缓冲区片大小的内存空间,比如只分配到4 个音频缓冲区片大小的内存空间,则进入第5 次循环时,dmasize 为0 了,那么就会再次进入do while 循环进行内存空间的分配,不过分配的为剩下的4 个音频缓冲区片大小的内存空间。这个函数巧妙的解决了万一一次分配不到连续的8 个音频缓冲区片大小的内存空间,就会按几次来分配较小的连续的内存空间了。
其中b->master 参数只有第0个缓冲区地址有值,为总的缓冲区空间大小,其余缓冲区地址的b->master 都为0。
s->buf_idx = 0;
s->buf = &s->buffers[0];
return 0;
将环形缓冲区索引号设为0,将当前缓冲区指针指向环形缓冲区的第0个缓冲区地址,然后返回0。
err:
audio_clear_buf(s);
return -ENOMEM;
如果程序跳转到err 标号处,则执行audio_clear_buf 函数来清空输出音频DMA 缓冲区,然后返回出错信息。
------------------------------------------------------------------------
分析完了放音的写设备函数,再来看一下录音的读设备函数smdk2410_audio_read:
static ssize_t smdk2410_audio_read(struct file *file, char *buffer,
size_t count, loff_t * ppos)
audio_stream_t *s = &input_stream;
该函数首先又定义了一个audio_stream_t 结构的指针变量指向输入音频缓冲区。
if (ppos != &file->f_pos)
return -ESPIPE;
然后判断如果表示文件当前位置的参数ppos 不等于该文件file 结构里的file->f_pos 文件位置,则返回退出。但实际上ppos 本来就是file->f_pos 的值,所以这一步一般不会出现。
if (!s->buffers) {
int i;
if (audio_setup_buf(s))
return -ENOMEM;
for (i = 0; i < s->nbfrags; i++) {
audio_buf_t *b = s->buf;
down(&b->sem);
s3c2410_dma_queue_buffer(s->dma_ch, (void *) b,
b->dma_addr, s->fragsize, DMA_BUF_RD);
NEXT_BUF(s, buf);
}
}
若指向环形缓冲区的指针s->buffers 为空的话,则会进入执行。首先会调用audio_setup_buf 函数来创建DMA 缓冲区,创建成功则继续执行,否则返回错误并退出。接着进入一个for 循环,对连续s->nbfrags(8)个音频缓冲区片进行操作。重新定义了一个audio_buf_t 结构的指针指向输入音频缓冲区当前缓冲区,并调用down 函数来获取信号量,又调用了s3c2410_dma_queue_buffer 函数完成了管理DMA 缓冲区的相关数据结构s3c2410_dma_t 和dma_buf_t 进行了设置,并对S3C2410 芯片的DMA 控制器部分的相关寄存器进行了相应配置,不过这里工作模式为读DMA 缓冲区。最后调用NEXT_BUF 宏函数来将当前缓冲区的指针指向环形缓冲区中下一个缓冲区地址处。
如果先调用过写设备函数,那么在写设备函数中就已经创建了DMA 缓冲区,再来调用现在的读设备函数时,就不会再进入这里来执行了。
while (count > 0) {
若要读取的字节数大于0,则进入一个while 大循环。
audio_buf_t *b = s->buf;
在大循环一开始就定义了一个audio_buf_t 结构的指针变量指向前面定义的输入音频缓冲区里的当前缓冲区指针。
/* Wait for a buffer to become full */
if (file->f_flags & O_NONBLOCK) {
ret = -EAGAIN;
if (down_trylock(&b->sem))
break;
} else {
ret = -ERESTARTSYS;
if (down_interruptible(&b->sem))
break;
}
这里跟写设备函数中一样,根据file->f_flags 与上O_NONBLOCK 值来进行判断,如果O_NONBLOCK 标记被设置,表示采用非阻塞的文件IO方法,则会调用down_trylock 函数来试着获得信号量sem,如果能够立刻获得,它就获得该信号量并返回0,否则,表示不能获得信号量sem,返回值为非0值。该函数与相关函数在一篇《Linux内核的同步机制》中有详细说明。
若没有加入了O_NONBLOCK 参数,即表示采用阻塞的文件IO方式,则会调用down_interruptible 函数来获得信号量sem。该函数将把sem 的值减1,如果信号量sem 的值非负,就直接返回,否则调用者将被挂起,直到别的任务释放该信号量才能继续运行。该函数与相关函数在一篇《Linux内核的同步机制》中有详细说明。
chunksize = b->size;
if (chunksize > count)
chunksize = count;
将缓冲区地址的偏移量b->size 赋值给chunksize,这里b->size 一开始应该为一个DMA 缓冲区片大小,即一个s->fragsize 单位大小,若所要读取数据的长度count 小于chunksize 值,那就以count 为准备读取数据的长度。在count 大于chunksize 的情况下,读取的数据长度以一个s->fragsize 大小为单位。
if (copy_to_user(buffer, b->start + s->fragsize - b->size,
chunksize)) {
up(&b->sem);
return -EFAULT;
}
调用copy_to_user 函数将内存中的数据复制到用户层的buffer 中。这里b->start 为指向环形缓冲区中第0个缓冲区地址的内存起始地址(虚拟地址),加上s->fragsize - b->size(得0),即还是指向第0个缓冲区地址的内存起始地址(虚拟地址)。
b->size -= chunksize;
buffer += chunksize;
count -= chunksize;
当把一组音频缓冲区片大小的数据从内存读取出来后,将缓冲区地址的偏移量b->size 减去已读取数据的长度,即得0。用户层的buffer 指针加上已读取数据的长度,即指向了下一组将要读取的数据。所要写入的数据长度count 减去已读取数据的长度,为还要读取数据的长度。
if (b->size > 0) {
up(&b->sem);
break;
}
这时缓冲区地址的偏移量b->size 应该为0,如果还是大于0的话就会调用up 函数释放信号量,并跳出while 循环。所以在对DMA 缓冲区进行读取前,缓冲区地址的偏移量b->size 为一个DMA 缓冲区片大小,而读取后,缓冲区地址的偏移量b->size 则为0。
/* Make current buffer available for DMA again */
s3c2410_dma_queue_buffer(s->dma_ch, (void *) b,
b->dma_addr, s->fragsize, DMA_BUF_RD);
调用了s3c2410_dma_queue_buffer 函数完成了管理DMA 缓冲区的相关数据结构s3c2410_dma_t 和dma_buf_t 进行了设置,并对S3C2410 芯片的DMA 控制器部分的相关寄存器进行了相应配置,不过这里工作模式为读DMA 缓冲区。
NEXT_BUF(s, buf);
}
在while 大循环最后调用了NEXT_BUF 宏函数来将当前缓冲区的指针指向环形缓冲区中下一个缓冲区地址处。
if ((buffer - buffer0))
ret = buffer - buffer0;
return ret;
当count 长度的数据都读完后,就退出while 大循环。一开始定义了一个buffer0 的指针指向了buffer 的起始地址,在写数据的过程中,buffer 指针进行过向后移动,而buffer0 指针不变,buffer - buffer0 就得到了总共读取的数据长度,并将该长度值返回。
//*******************************************************
//* 2007.7.16
//*******************************************************
经过一个双修日的音频驱动调试,对S3C2410 的IIS 控制器和UDA1341 的频率配置有了进一步的了解,对控制放音的写设备文件函数smdk2410_audio_write 也有了更深的认识。下面就来总结一下相关的注意要点。
在S3C2410 芯片与UDA1341 芯片的连线中,关于时钟信号的连线有:I2SLRCLK 到WS,I2SSCLK 到BCK,CDCLK 到SYSCLK。其中CDCLK 为UDA1341 芯片提供系统的同步时钟,也称为编解码时钟,即提供UDA1341 芯片进行音频的A/D,D/A 采样时的采样时钟。而其他2组时钟只是在进行IIS 总线传输数据时提供串行数据的位时钟和左右声道的切换。
CDCLK 是由S3C2410 内部的APH 总线时钟首先经过一个IIS 的模式选择(256fs 或384fs),然后再经过一个IIS 的预分频器分频后得到。S3C2410 主频202M,它的APH 总线频率是202/4=50M,在选择IIS 的主时钟模式为384fs后,经过IIS 的PSR(分频比例因子)得到的由IPSR_A 分出的一个频率用于IIS 时钟输出也可以说是同步,另一个由IPSR_B 分出的频率CDCLK 则直接作为UDA1341 的系统时钟,即编解码时钟。
这里在分频前要进行IIS 的主时钟频率选择(这里选择了384fs)是因为在分频时会根据384 这个系数和采样频率fs 进行分频,最后将系数384 乘以fs 得到CDCLK 时钟输出频率。
而在UDA1341 芯片的初始化中也需要进行系统时钟的设置(512fs,384fs 或256fs),在进行音频的编解码时会根据SYSCLK 输入的系统时钟除以相应的系数,来得到采样频率fs。所以对于S3C2410 芯片的IIS 控制器和UDA1341 芯片,两者相应的CDCLK 和SYSCLK 的时钟频率需要设置一致。我在这里都设为了384fs,在调试过程中,我试着将两者设的不一致,结果就放不出声音了。还有一点要注意,由于预分频值与384 这个系数和采样频率fs 有关,所以在计算预分频值的函数iispsr_value 中,384 这个系数也要和CDCLK 和SYSCLK 设置的系数一致。如果设置不一致的话,会导致声音播放的太快或太慢。