熟悉多种视频标准,如h.264, MPEG-2/MPEG-4, AVS.
全部博文(47)
分类: 嵌入式
2014-03-21 14:43:09
默认:’p8x8,b8x8,i8x8,i4x4′
说明:H.264在压缩前会被切分为16×16大小的宏块。这些块可被进一步切分成更小的块,利用此参数,可以控制不同的帧类型(I、P、B)开启更细的帧切分(8×8、4×4),具体参数如下:
I帧:i8x8、i4x4;
P帧:p8x8(会同时开启p16x8和p8x16)、p4x4(会同时开启p8x4和p4x8);
B帧:b8x8(会同时开启b18x8和b8x16);
另外,也可以设置为’none’和’all’。一般而言,开启p4x4不会带来多少的质量提升,而且它极其耗时,是个性价比比较低的选项。
参见:–no-8x8dct
默认:’spatial’
说明:为’direct’类型的运动矢量设定预测模式。有两种可选的模式:spatial(空间预测)和temporal(时间预测)。可以设置为’none’关闭预测,也可以设置为’auto’让x264去选择它认为更好的模式,x264会在编码结束时告诉你它的选择。’auto’最好在2趟编码中使用,但也可以在1趟编码时使用。如果用于2趟编码,x264会在第1趟编吗时同时尝试2种预测模式,然后在第2趟编码时使用它认为较好的那一个。注意,如果第1趟编码时选择了’auto’,那么第2趟编码时也必须设置为’auto’。不然,第2趟编码会使用’temporal’。本选项从不会浪费比特,强烈推荐使用。
建议:’auto’
默认:无
说明:H.264允许给可参考B帧加上影响预测图像的权重,此选项会关闭此特性。
建议:保持默认
默认:2
说明:开启明确的权重预测以增进P帧压缩。越高级的模式越耗时,有以下模式:
0 —— 关闭
1 —— 静态补偿(永远为-1)
2 —— 智能统计静态帧,特别为增进淡入淡出效果的压缩率而设计。
注意:为Adobe
Flash(版本低于10.1)编码时请把此值设为0,会导致解码时出现错误。Flash 10.1时此BUG得到修正。
默认:’hex’
说明:设置全局的运动预测方法,有以下5种选择:
dia(四边形搜索) —— 最简单的搜索,从最乐观的情况开始预测,在运动矢量的上下左右分别偏移一个像素对比,选择其中最好的,循环直至找不到更匹配的运动矢量。
hex(六边形搜索) —— 和菱形差不多的策略,不同的是,它在6边形的6个顶点上进行rang-2的搜索,它实现了比dia有效率地多的搜索而几乎不会使用更多的耗时,它是普通编码任务一个很好的选择。
umh(不均匀的多六边形搜索) —— 显著地比hex要慢,但它尝试进行复杂多六边形的搜索,以避免错过那些难以找到的运动矢量。与hex和dia不同的是,merange参数直接任意大小控制umh的搜索半径。
esa(全局搜索) —— 高度优化的全局智能搜索,在最佳预测器的merange范围内进行运动搜索。在全局面进行运动向量的算术对比,虽然计算过程并不慢,但耗时仍比umh有显著提升,而且并不会带来太多质量方面的提升。所以,对于日常的编码任务来说,它不是特别有用。
tesa(变换全局搜索) —— 使用一种算法,效果近于对全局的每个运动矢量进行Hadamard 变换比对。搜索方式上和esa很像,但是效果比esa好一点点,耗时也多一点点。
参见:–merange
默认:16
说明:merange控制运动搜索的最大像素范围。对于hex和dia,范围被控制在4-16像素,默认就是16。对于umh和esa,可以超过默认的 16像素进行大范围的运行搜索,这对高分辨率视频和快速运动视频而言很有用。注意,对于umh、esa、tesa,增大merange会显著地增加编码耗时。
参见:–me
默认:-1(自动)
说明:设置垂直的运动矢量最大像素值。默认值如下:
level 1/1b —— 64
level 1.1-2.0 —— 128
level 2.1-3.0 —— 256
level 3.1+ —— 512
注意:如果打算手动设置此值,要在上面给出的值的基础上减去0.25(如:–mvrange
127.75),
建议:保持默认
默认:-1(自动)
说明:设置线程间运动矢量的缓冲区大小的最小值。不要碰这个选项。
建议:保持默认
默认:7
说明:设置亚像素估计的复杂度。值越高越好。级别1-5简单控制亚像素的细化力度。级别6给模式决策开启RDO(码率失真优化模式),级别8给运动矢量和帧内预测模式开启RDO。开启RDO会显著增加耗时。
使用小于2的值会开启一个快速的、低质量的预测模式,效果如同设置了一个很小的 –scenecut值。不推荐这样设置。
可使用的值如下:
0 —— fullpel only
1 —— QPel SAD 1 iteration
2 —— QPel SATD 2 iterations
3 —— HPel on MB then QPel
4 —— Always QPel
5 —— Multi QPel + bi-directional motion estimation
6 —— RD on I/P frames
7 —— RD on all frames
8 —— RD refinement on I/P frames
9 —— RD refinement on all frames
10 —— QP-RD (requires –trellis=2, –aq-mode > 0)
建议:保持默认,或设置为更高,除非对速度十分敏感。
subq
–subme的别名
默认:1.0:0.0
说明:第1个数字是psy-RDO的强度(subme大于等于6时激活)。第2个数字是Psy-Trellis的强度(subme大于等于1时激活)。注意Trellis的特性仍是’实验性’的,至少对于动画视频来说,它总是会坏事的。
关于psy-rd的更详尽解释可以参见doom9的这篇文章:。
默认:无
说明:关闭全部为了心理视觉而降低psnr或ssim的优化。此选项同时也会关闭一些不能通过x264命令行设置的内部的心理视觉优化方法。
建议:保持默认
默认:无
说明:Mixed refs(混合参照)会以8×8的切块为参照取代以整个宏块为参照。会增进多帧参照的帧的质量,会有一些时间耗用。此选项将禁用这个特性。
建议:保持默认
参见:–ref
默认:无
说明:通常运动估计都会同时考虑亮度和色度因素。开启此选项将会忽略色度因素换取一些速度的提升。
建议:保持默认
默认:无
说明:自适应的8×8 DCT会在I帧中开启更智能的自适应8×8的时域变换。开启此选项可以禁用这个特性。(译者按:此选项是将H.264的Profile从High降为Main的重要参数)
建议:保持默认
默认:1
说明:使用网格编码量化以增进编码效率:
0 —— 关闭
1 —— 仅在宏块最终编码时启用
2 —— 所有模式下均启用
选项1提供了速度和效率间较好的均衡,选项2大幅降低速度。
关于网格编码量化的更详尽解释可以参见:。
建议:保持默认
默认:无
说明:关闭P帧的早期跳过决策。大量的时耗换回非常小的质量提升。
建议:保持默认
默认:无
说明:DCT抽样会丢弃看上去“多余”的DCT块。会增加编码效率,通常质量损失可以忽略。此选项关闭此特性。
建议:保持默认
note: 关闭P帧联合编码(可以增加细节,但也会增加体积)。
nr
默认:无
说明:执行快速去噪。以此值为阈值确定噪音,通过在量化前丢失小细节的方式尝试去除噪音。效果可能不如优秀的外部去噪滤镜,但它执行地非常快。
建议:保持默认或者设置为100-1000用以去噪。
deadzone-inter/intra
默认:无
说明:设置帧间/帧内的亮度量化器输出为0的区域大小。输出为0的区域可以设置为0-32,这个值设置的是x264毫不尝试保护直接丢弃的精密细节。十分精细的细节既难以发觉,编码代价又昂贵,直接丢弃它们可以避免在这些低回报的部分浪费比特。此选项和Trellis选项是互不相容的。
建议:保持默认
cqm
默认:Flat(没设置)
说明:设置自定义的量化矩阵取代内建的内建值。内建值有flat或JVT。
建议:保持默认
参见:–cqmfile
cqmfile
默认:无
说明:使用一个JM格式矩阵文件设置自定义的量化矩阵。会覆盖其他的 –cqm*选项们。
建议:保持默认
参见:–cqm
cqm4* / cqm 8*
默认:无
什么是MacroblockTree
MacroblockTree是一个基于macroblock的qp控制方法。
MBTree的工作原理类似于古典的qpcompression,只不过qcomp处理的对象是整张frame而MBTree针对的是每个MB进行处理。
工作过程简单来说,是对于每个MB,向前预测一定数量的帧(该数量由rc-lookahead和keyint的较小值决定)中该MB被参考的情况,根据引
用次数的多寡,决定对该MB使用何种大小的qp进行quantization。而qp的大小与被参考次数成反比,也就是说,对于被参考次数多的
MB,264的解码器认为此对应于缓慢变化的场景,因此给与比较高的质量(比较低的qp数值)。至于视频的变化率与人眼感知能力的关系,这是一个基于主观
测试的经验结果:视频变化率越大人眼的敏感度越低,也就是说,人眼可以容忍快速变化场景的某些缺陷,但相对而言某些平滑场景的缺陷,人眼则相当敏感。注意
此处说的平滑,指的是沿时间维度上场景的变化频率,而非普通意义上的像素域中的场景。
MBTreeFile
这是一个临时文件,记录了每个P帧中每个MB被参考的情况。
MBTree的处理对象
根据DSblog上的文章,目前mbtree只处理pframes的mb,同时也不支持bpyramid。
与Mbtree相关的参数
--qcompqcomp有削弱mbtree强度的倾向,具体来说,qcomp的值越趋近于1(ConstantQuantizer),mbtree的效力越差。
--rc-lookahead决定mbtree向前预测的帧数。
一点深入的分析:
对于使用encoder的我们来说,也许需要更进一步的关注下mbtree具体是如何将码率节省到这个地步的,在这之前,我们先回顾下264的码率控制方法。
所谓码率控制,指的是在给定码率和解码端缓冲区的限制下,如何选择最优编码参数的系统优化问题。x264一共支持5种码率控制模式,而VBV的启用可以使264以mb为单位而非以帧为单位指定qp。
简而言之,CRF模式下码率控制的过程由下面三步决定:
1、首先确定当前正在处理帧的码率:由于x264使用了与画面复杂度相关的经验公式,于是问题被归结于如何预测画面复杂度。
2、对于1pass的CRF而言,画面复杂度由残差的SATD决定,后续GOP中的I帧qp则由之前编码的I帧qp继承决定。
3、之后,我们需要根据所选crf的数值,对2中获得的数据进行scaling,以获得最终码率。
–cqm4: 设置所有4×4块的量化矩阵,以由16个逗号分隔值域为1-255的值组成的列表的形式给出。
–cqm8: 设置所有8×8块的量化矩阵,以由64个逗号分隔值域为1-255的值组成的列表的形式给出。
–cqm4i, –cqm4p, –cqm8i, –cqm8p: 同时设置色度和亮度(i为帧内、p为帧间)矩阵
–cqm4iy, –cqm4ic, –cqm4py, –cqm4pc: 设置色度或亮度矩阵(y为亮度、c为色度)。这样的参数cqm8也有同样的4个。
建议:保持默认