x264使用参数介绍 - 分析-andrew810810-ChinaUnix博客

andrew

首页　| 　博文目录　| 　关于我

andrew810810

博客访问： 166366
博文数量： 47
博客积分： 0
博客等级：民兵
技术积分： 256
用户组：普通用户
注册时间： 2013-10-10 09:15

个人简介

熟悉多种视频标准，如h.264, MPEG-2/MPEG-4, AVS.

文章分类

全部博文（47）

FLV（1）
HTTP/TCP/IP（2）
video codec（10）
FFMPEG（10）
VirtualBox（1）
nginx（1）
linux（3）
MP4文件格式（3）
squid（16）
未分配的博文（0）

文章存档

2015年（5）

2014年（22）

2013年（20）

我的朋友

相关博文

x264使用参数介绍 - 分析

分类：嵌入式

2014-03-21 14:43:09

analysis

partitions

默认：’p8x8,b8x8,i8x8,i4x4′
说明：H.264在压缩前会被切分为16×16大小的宏块。这些块可被进一步切分成更小的块，利用此参数，可以控制不同的帧类型（I、P、B）开启更细的帧切分（8×8、4×4），具体参数如下：
I帧：i8x8、i4x4；
P帧：p8x8（会同时开启p16x8和p8x16）、p4x4（会同时开启p8x4和p4x8）；
B帧：b8x8（会同时开启b18x8和b8x16）；
另外，也可以设置为’none’和’all’。一般而言，开启p4x4不会带来多少的质量提升，而且它极其耗时，是个性价比比较低的选项。
参见：–no-8x8dct

direct

默认：’spatial’
说明：为’direct’类型的运动矢量设定预测模式。有两种可选的模式：spatial（空间预测）和temporal（时间预测）。可以设置为’none’关闭预测，也可以设置为’auto’让x264去选择它认为更好的模式，x264会在编码结束时告诉你它的选择。’auto’最好在2趟编码中使用，但也可以在1趟编码时使用。如果用于2趟编码，x264会在第1趟编吗时同时尝试2种预测模式，然后在第2趟编码时使用它认为较好的那一个。注意，如果第1趟编码时选择了’auto’，那么第2趟编码时也必须设置为’auto’。不然，第2趟编码会使用’temporal’。本选项从不会浪费比特，强烈推荐使用。
建议：’auto’

no-weightb

默认：无
说明：H.264允许给可参考B帧加上影响预测图像的权重，此选项会关闭此特性。
建议：保持默认

weightp

默认：2
说明：开启明确的权重预测以增进P帧压缩。越高级的模式越耗时，有以下模式：
0 —— 关闭
1 —— 静态补偿（永远为-1）
2 —— 智能统计静态帧，特别为增进淡入淡出效果的压缩率而设计。
注意：为Adobe Flash（版本低于10.1）编码时请把此值设为0，会导致解码时出现错误。Flash 10.1时此BUG得到修正。

默认：’hex’
说明：设置全局的运动预测方法，有以下5种选择：
dia（四边形搜索） —— 最简单的搜索，从最乐观的情况开始预测，在运动矢量的上下左右分别偏移一个像素对比，选择其中最好的，循环直至找不到更匹配的运动矢量。
hex（六边形搜索） —— 和菱形差不多的策略，不同的是，它在6边形的6个顶点上进行rang-2的搜索，它实现了比dia有效率地多的搜索而几乎不会使用更多的耗时，它是普通编码任务一个很好的选择。
umh（不均匀的多六边形搜索） —— 显著地比hex要慢，但它尝试进行复杂多六边形的搜索，以避免错过那些难以找到的运动矢量。与hex和dia不同的是，merange参数直接任意大小控制umh的搜索半径。
esa（全局搜索） —— 高度优化的全局智能搜索，在最佳预测器的merange范围内进行运动搜索。在全局面进行运动向量的算术对比，虽然计算过程并不慢，但耗时仍比umh有显著提升，而且并不会带来太多质量方面的提升。所以，对于日常的编码任务来说，它不是特别有用。
tesa（变换全局搜索） —— 使用一种算法，效果近于对全局的每个运动矢量进行Hadamard 变换比对。搜索方式上和esa很像，但是效果比esa好一点点，耗时也多一点点。
参见：–merange

merange

默认：16
说明：merange控制运动搜索的最大像素范围。对于hex和dia，范围被控制在4-16像素，默认就是16。对于umh和esa，可以超过默认的 16像素进行大范围的运行搜索，这对高分辨率视频和快速运动视频而言很有用。注意，对于umh、esa、tesa，增大merange会显著地增加编码耗时。
参见：–me

mvrange

默认：-1（自动）
说明：设置垂直的运动矢量最大像素值。默认值如下：
level 1/1b —— 64
level 1.1-2.0 —— 128
level 2.1-3.0 —— 256
level 3.1+ —— 512
注意：如果打算手动设置此值，要在上面给出的值的基础上减去0.25（如：–mvrange 127.75），
建议：保持默认

mvrange-thread

默认：-1（自动）
说明：设置线程间运动矢量的缓冲区大小的最小值。不要碰这个选项。
建议：保持默认

subme

默认：7
说明：设置亚像素估计的复杂度。值越高越好。级别1-5简单控制亚像素的细化力度。级别6给模式决策开启RDO（码率失真优化模式），级别8给运动矢量和帧内预测模式开启RDO。开启RDO会显著增加耗时。
使用小于2的值会开启一个快速的、低质量的预测模式，效果如同设置了一个很小的 –scenecut值。不推荐这样设置。
可使用的值如下：
0 —— fullpel only
1 —— QPel SAD 1 iteration
2 —— QPel SATD 2 iterations
3 —— HPel on MB then QPel
4 —— Always QPel
5 —— Multi QPel + bi-directional motion estimation
6 —— RD on I/P frames
7 —— RD on all frames
8 —— RD refinement on I/P frames
9 —— RD refinement on all frames
10 —— QP-RD (requires –trellis=2, –aq-mode > 0)
建议：保持默认，或设置为更高，除非对速度十分敏感。

subq

–subme的别名

psy-rd

默认：1.0:0.0
说明：第1个数字是psy-RDO的强度（subme大于等于6时激活）。第2个数字是Psy-Trellis的强度（subme大于等于1时激活）。注意Trellis的特性仍是’实验性’的，至少对于动画视频来说，它总是会坏事的。
关于psy-rd的更详尽解释可以参见doom9的这篇文章：。

no-psy

默认：无
说明：关闭全部为了心理视觉而降低psnr或ssim的优化。此选项同时也会关闭一些不能通过x264命令行设置的内部的心理视觉优化方法。
建议：保持默认

no-mixed-refs

默认：无
说明：Mixed refs（混合参照）会以8×8的切块为参照取代以整个宏块为参照。会增进多帧参照的帧的质量，会有一些时间耗用。此选项将禁用这个特性。
建议：保持默认
参见：–ref

no-chroma-me

默认：无
说明：通常运动估计都会同时考虑亮度和色度因素。开启此选项将会忽略色度因素换取一些速度的提升。
建议：保持默认

no-8x8dct

默认：无
说明：自适应的8×8 DCT会在I帧中开启更智能的自适应8×8的时域变换。开启此选项可以禁用这个特性。（译者按：此选项是将H.264的Profile从High降为Main的重要参数）
建议：保持默认

trellis

默认：1
说明：使用网格编码量化以增进编码效率：
0 —— 关闭
1 —— 仅在宏块最终编码时启用
2 —— 所有模式下均启用
选项1提供了速度和效率间较好的均衡，选项2大幅降低速度。
关于网格编码量化的更详尽解释可以参见：。
建议：保持默认

注意：需要开启 –cabac选项生效

no-fast-pskip

默认：无
说明：关闭P帧的早期跳过决策。大量的时耗换回非常小的质量提升。
建议：保持默认

no-dct-decimate

默认：无
说明：DCT抽样会丢弃看上去“多余”的DCT块。会增加编码效率，通常质量损失可以忽略。此选项关闭此特性。
建议：保持默认
note: 关闭P帧联合编码（可以增加细节，但也会增加体积）。

默认：无
说明：执行快速去噪。以此值为阈值确定噪音，通过在量化前丢失小细节的方式尝试去除噪音。效果可能不如优秀的外部去噪滤镜，但它执行地非常快。
建议：保持默认或者设置为100-1000用以去噪。

deadzone-inter/intra

默认：无
说明：设置帧间/帧内的亮度量化器输出为0的区域大小。输出为0的区域可以设置为0-32，这个值设置的是x264毫不尝试保护直接丢弃的精密细节。十分精细的细节既难以发觉，编码代价又昂贵，直接丢弃它们可以避免在这些低回报的部分浪费比特。此选项和Trellis选项是互不相容的。
建议：保持默认

cqm

默认：Flat（没设置）
说明：设置自定义的量化矩阵取代内建的内建值。内建值有flat或JVT。
建议：保持默认
参见：–cqmfile

cqmfile

默认：无
说明：使用一个JM格式矩阵文件设置自定义的量化矩阵。会覆盖其他的 –cqm*选项们。
建议：保持默认
参见：–cqm

cqm4* / cqm 8*

默认：无
–cqm4: 设置所有4×4块的量化矩阵，以由16个逗号分隔值域为1-255的值组成的列表的形式给出。
–cqm8: 设置所有8×8块的量化矩阵，以由64个逗号分隔值域为1-255的值组成的列表的形式给出。
–cqm4i, –cqm4p, –cqm8i, –cqm8p: 同时设置色度和亮度（i为帧内、p为帧间）矩阵
–cqm4iy, –cqm4ic, –cqm4py, –cqm4pc: 设置色度或亮度矩阵（y为亮度、c为色度）。这样的参数cqm8也有同样的4个。
建议：保持默认

什么是MacroblockTree

MacroblockTree是一个基于macroblock的qp控制方法。 MBTree的工作原理类似于古典的qpcompression，只不过qcomp处理的对象是整张frame而MBTree针对的是每个MB进行处理。工作过程简单来说，是对于每个MB，向前预测一定数量的帧（该数量由rc-lookahead和keyint的较小值决定）中该MB被参考的情况，根据引用次数的多寡，决定对该MB使用何种大小的qp进行quantization。而qp的大小与被参考次数成反比，也就是说，对于被参考次数多的 MB，264的解码器认为此对应于缓慢变化的场景，因此给与比较高的质量（比较低的qp数值）。至于视频的变化率与人眼感知能力的关系，这是一个基于主观测试的经验结果：视频变化率越大人眼的敏感度越低，也就是说，人眼可以容忍快速变化场景的某些缺陷，但相对而言某些平滑场景的缺陷，人眼则相当敏感。注意此处说的平滑，指的是沿时间维度上场景的变化频率，而非普通意义上的像素域中的场景。

MBTreeFile

这是一个临时文件，记录了每个P帧中每个MB被参考的情况。

MBTree的处理对象

根据DSblog上的文章，目前mbtree只处理pframes的mb，同时也不支持bpyramid。

与Mbtree相关的参数

--qcompqcomp有削弱mbtree强度的倾向，具体来说，qcomp的值越趋近于1（ConstantQuantizer），mbtree的效力越差。

--rc-lookahead决定mbtree向前预测的帧数。

一点深入的分析：

对于使用encoder的我们来说，也许需要更进一步的关注下mbtree具体是如何将码率节省到这个地步的，在这之前，我们先回顾下264的码率控制方法。

所谓码率控制，指的是在给定码率和解码端缓冲区的限制下，如何选择最优编码参数的系统优化问题。x264一共支持5种码率控制模式，而VBV的启用可以使264以mb为单位而非以帧为单位指定qp。

简而言之，CRF模式下码率控制的过程由下面三步决定：

1、首先确定当前正在处理帧的码率：由于x264使用了与画面复杂度相关的经验公式，于是问题被归结于如何预测画面复杂度。

2、对于1pass的CRF而言，画面复杂度由残差的SATD决定，后续GOP中的I帧qp则由之前编码的I帧qp继承决定。

3、之后，我们需要根据所选crf的数值，对2中获得的数据进行scaling，以获得最终码率。

阅读(1715) | 评论(0) | 转发(0) |

上一篇：psnr和SSIM

下一篇：x264使用参数介绍 - 视频可用性分析

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6