Chinaunix首页 | 论坛 | 博客
  • 博客访问: 158052
  • 博文数量: 47
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 256
  • 用 户 组: 普通用户
  • 注册时间: 2013-10-10 09:15
个人简介

熟悉多种视频标准,如h.264, MPEG-2/MPEG-4, AVS.

文章分类

全部博文(47)

文章存档

2015年(5)

2014年(22)

2013年(20)

我的朋友

分类: 嵌入式

2014-03-21 14:43:09

analysis

  • partitions

默认:’p8x8,b8x8,i8x8,i4x4′
说明:H.264在压缩前会被切分为16×16大小的宏块。这些块可被进一步切分成更小的块,利用此参数,可以控制不同的帧类型(IPB)开启更细的帧切分(8×84×4),具体参数如下:
I
帧:i8x8i4x4
P
帧:p8x8(会同时开启p16x8p8x16)、p4x4(会同时开启p8x4p4x8);
B
帧:b8x8(会同时开启b18x8b8x16);
另外,也可以设置为’none’’all’。一般而言,开启p4x4不会带来多少的质量提升,而且它极其耗时,是个性价比比较低的选项。
参见:–no-8x8dct

  • direct

默认:’spatial’
说明:为’direct’类型的运动矢量设定预测模式。有两种可选的模式:spatial(空间预测)和temporal(时间预测)。可以设置为’none’关闭预测,也可以设置为’auto’x264去选择它认为更好的模式,x264会在编码结束时告诉你它的选择。’auto’最好在2趟编码中使用,但也可以在1趟编码时使用。如果用于2趟编码,x264会在第1趟编吗时同时尝试2种预测模式,然后在第2趟编码时使用它认为较好的那一个。注意,如果第1趟编码时选择了’auto’,那么第2趟编码时也必须设置为’auto’。不然,第2趟编码会使用’temporal’本选项从不会浪费比特,强烈推荐使用
建议:’auto’

  • no-weightb

默认:无
说明:H.264允许给可参考B帧加上影响预测图像的权重,此选项会关闭此特性。
建议:保持默认

  • weightp

默认:2
说明:开启明确的权重预测以增进P帧压缩。越高级的模式越耗时,有以下模式:
0 ——
关闭
1 ——
静态补偿(永远为-1
2 ——
智能统计静态帧,特别为增进淡入淡出效果的压缩率而设计
注意:为Adobe Flash(版本低于10.1)编码时请把此值设为0,会导致解码时出现错误。Flash 10.1时此BUG得到修正。

  • me

默认:’hex’
说明:设置全局的运动预测方法,有以下5种选择:
dia
(四边形搜索) —— 最简单的搜索,从最乐观的情况开始预测,在运动矢量的上下左右分别偏移一个像素对比,选择其中最好的,循环直至找不到更匹配的运动矢量。
hex
(六边形搜索) —— 和菱形差不多的策略,不同的是,它在6边形的6个顶点上进行rang-2的搜索,它实现了比dia有效率地多的搜索而几乎不会使用更多的耗时,它是普通编码任务一个很好的选择。
umh
(不均匀的多六边形搜索) —— 显著地比hex要慢,但它尝试进行复杂多六边形的搜索,以避免错过那些难以找到的运动矢量。hexdia不同的是,merange参数直接任意大小控制umh的搜索半径。
esa
(全局搜索) —— 高度优化的全局智能搜索,在最佳预测器的merange范围内进行运动搜索。在全局面进行运动向量的算术对比,虽然计算过程并不慢,但耗时仍比umh有显著提升,而且并不会带来太多质量方面的提升。所以,对于日常的编码任务来说,它不是特别有用。
tesa
(变换全局搜索) —— 使用一种算法,效果近于对全局的每个运动矢量进行Hadamard 变换比对。搜索方式上和esa很像,但是效果比esa好一点点,耗时也多一点点。
参见:–merange

  • merange

默认:16
说明:merange控制运动搜索的最大像素范围。对于hexdia,范围被控制在4-16像素,默认就是16。对于umhesa可以超过默认的 16像素进行大范围的运行搜索,这对高分辨率视频和快速运动视频而言很有用。注意,对于umhesatesa,增大merange会显著地增加编码耗时。
参见:–me

  • mvrange

默认:-1(自动)
说明:设置垂直的运动矢量最大像素值。默认值如下:
level 1/1b —— 64
level 1.1-2.0 —— 128
level 2.1-3.0 —— 256
level 3.1+ —— 512
注意:如果打算手动设置此值,要在上面给出的值的基础上减去0.25(如:–mvrange 127.75
建议:保持默认

  • mvrange-thread

默认:-1(自动)
说明:设置线程间运动矢量的缓冲区大小的最小值。不要碰这个选项。
建议:保持默认

  • subme

默认:7
说明:设置亚像素估计的复杂度。值越高越好。级别1-5简单控制亚像素的细化力度级别6给模式决策开启RDO(码率失真优化模式),级别8给运动矢量和帧内预测模式开启RDO。开启RDO会显著增加耗时。
使用小于2的值会开启一个快速的、低质量的预测模式,效果如同设置了一个很小的 –scenecut值。不推荐这样设置。
可使用的值如下:
0 —— fullpel only
1 —— QPel SAD 1 iteration
2 —— QPel SATD 2 iterations
3 —— HPel on MB then QPel
4 —— Always QPel
5 —— Multi QPel + bi-directional motion estimation
6 —— RD on I/P frames
7 —— RD on all frames
8 —— RD refinement on I/P frames
9 —— RD refinement on all frames
10 —— QP-RD (requires –trellis=2, –aq-mode > 0)
建议:保持默认,或设置为更高,除非对速度十分敏感。

subq

–subme的别名

  • psy-rd

默认:1.0:0.0
说明:1个数字是psy-RDO的强度(subme大于等于6时激活)。第2个数字是Psy-Trellis的强度(subme大于等于1时激活)。注意Trellis的特性仍是实验性的,至少对于动画视频来说,它总是会坏事的。
关于psy-rd的更详尽解释可以参见doom9的这篇文章:

  • no-psy

默认:无
说明:关闭全部为了心理视觉而降低psnrssim的优化。此选项同时也会关闭一些不能通过x264命令行设置的内部的心理视觉优化方法。
建议:保持默认

  • no-mixed-refs

默认:无
说明:Mixed refs(混合参照)会以8×8的切块为参照取代以整个宏块为参照。会增进多帧参照的帧的质量,会有一些时间耗用。此选项将禁用这个特性。
建议:保持默认
参见:–ref

  • no-chroma-me

默认:无
说明:通常运动估计都会同时考虑亮度和色度因素。开启此选项将会忽略色度因素换取一些速度的提升。
建议:保持默认

  • no-8x8dct

默认:无
说明:自适应的8×8 DCT会在I帧中开启更智能的自适应8×8的时域变换。开启此选项可以禁用这个特性。(译者按:此选项是将H.264ProfileHigh降为Main的重要参数
建议:保持默认

  • trellis

默认:1
说明:使用网格编码量化以增进编码效率:
0 ——
关闭
1 ——
仅在宏块最终编码时启用
2 ——
所有模式下均启用
选项1提供了速度和效率间较好的均衡,选项2大幅降低速度。
关于网格编码量化的更详尽解释可以参见:
建议:保持默认

注意:需要开启 –cabac选项生效
  • no-fast-pskip

默认:无
说明:关闭P帧的早期跳过决策。大量的时耗换回非常小的质量提升。
建议:保持默认

  • no-dct-decimate

默认:无
说明:DCT抽样会丢弃看上去多余DCT块。会增加编码效率,通常质量损失可以忽略。此选项关闭此特性。
建议:保持默认
note: 关闭P帧联合编码(可以增加细节,但也会增加体积)。

  • nr

默认:无
说明:执行快速去噪。以此值为阈值确定噪音,通过在量化前丢失小细节的方式尝试去除噪音。效果可能不如优秀的外部去噪滤镜,但它执行地非常快。
建议:保持默认或者设置为100-1000用以去噪。

  • deadzone-inter/intra

默认:无
说明:设置帧间/帧内的亮度量化器输出为0的区域大小。输出为0的区域可以设置为0-32,这个值设置的是x264毫不尝试保护直接丢弃的精密细节。十分精细的细节既难以发觉,编码代价又昂贵,直接丢弃它们可以避免在这些低回报的部分浪费比特。此选项和Trellis选项是互不相容的。
建议:保持默认

  • cqm

默认:Flat(没设置)
说明:设置自定义的量化矩阵取代内建的内建值。内建值有flatJVT
建议:保持默认
参见:–cqmfile

  • cqmfile

默认:无
说明:使用一个JM格式矩阵文件设置自定义的量化矩阵。会覆盖其他的 –cqm*选项们。
建议:保持默认
参见:–cqm

  • cqm4* / cqm 8*

默认:无
–cqm4:
设置所有4×4块的量化矩阵,以由16个逗号分隔值域为1-255的值组成的列表的形式给出。
–cqm8:
设置所有8×8块的量化矩阵,以由64个逗号分隔值域为1-255的值组成的列表的形式给出。
–cqm4i, –cqm4p, –cqm8i, –cqm8p:
同时设置色度和亮度(i为帧内、p为帧间)矩阵
–cqm4iy, –cqm4ic, –cqm4py, –cqm4pc:
设置色度或亮度矩阵(y为亮度、c为色度)。这样的参数cqm8也有同样的4个。
建议:保持默认

什么是MacroblockTree

MacroblockTree是一个基于macroblock的qp控制方法。 MBTree的工作原理类似于古典的qpcompression,只不过qcomp处理的对象是整张frame而MBTree针对的是每个MB进行处理。 工作过程简单来说,是对于每个MB,向前预测一定数量的帧(该数量由rc-lookahead和keyint的较小值决定)中该MB被参考的情况,根据引 用次数的多寡,决定对该MB使用何种大小的qp进行quantization。而qp的大小与被参考次数成反比,也就是说,对于被参考次数多的 MB,264的解码器认为此对应于缓慢变化的场景,因此给与比较高的质量(比较低的qp数值)。至于视频的变化率与人眼感知能力的关系,这是一个基于主观 测试的经验结果:视频变化率越大人眼的敏感度越低,也就是说,人眼可以容忍快速变化场景的某些缺陷,但相对而言某些平滑场景的缺陷,人眼则相当敏感。注意 此处说的平滑,指的是沿时间维度上场景的变化频率,而非普通意义上的像素域中的场景。

MBTreeFile

这是一个临时文件,记录了每个P帧中每个MB被参考的情况。

MBTree的处理对象

根据DSblog上的文章,目前mbtree只处理pframes的mb,同时也不支持bpyramid。

与Mbtree相关的参数

--qcompqcomp有削弱mbtree强度的倾向,具体来说,qcomp的值越趋近于1(ConstantQuantizer),mbtree的效力越差。

--rc-lookahead决定mbtree向前预测的帧数。

一点深入的分析:

对于使用encoder的我们来说,也许需要更进一步的关注下mbtree具体是如何将码率节省到这个地步的,在这之前,我们先回顾下264的码率控制方法。

所谓码率控制,指的是在给定码率和解码端缓冲区的限制下,如何选择最优编码参数的系统优化问题。x264一共支持5种码率控制模式,而VBV的启用可以使264以mb为单位而非以帧为单位指定qp。

简而言之,CRF模式下码率控制的过程由下面三步决定:

1、首先确定当前正在处理帧的码率:由于x264使用了与画面复杂度相关的经验公式,于是问题被归结于如何预测画面复杂度。

2、对于1pass的CRF而言,画面复杂度由残差的SATD决定,后续GOP中的I帧qp则由之前编码的I帧qp继承决定。

3、之后,我们需要根据所选crf的数值,对2中获得的数据进行scaling,以获得最终码率。

阅读(1443) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~