翻译ffmpeg-all文档（17），视频编码器-xdsnet-ChinaUnix博客

xdsnet的技术留痕xdsnet.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

xdsnet

博客访问： 718031
博文数量： 95
博客积分： 1773
博客等级：上尉
技术积分： 1653
用户组：普通用户
注册时间： 2007-08-17 23:28

文章分类

全部博文（95）

技术翻译（45）

ffmpeg翻译系列（43）
杂谈（5）
媒体开发（13）
技巧记录（10）
linux系统维护纪（22）
未分配的博文（0）

文章存档

2018年（2）

2017年（10）

2016年（7）

2015年（48）

2014年（2）

2013年（2）

2012年（2）

2011年（7）

2010年（7）

2009年（3）

2008年（1）

2007年（4）

我的朋友

17 视频编码器

介绍一些当前有效的视频编码器

libtheora

libtheora的封装

编译需要头和库文件，还需要利用--enable-libtheora在配置中允许

更多信息参考 http://www.videolan.org/developers/x264.html以了解更多x264项目内容。

libx264rgb和libx264类似，只是一个是编码RGB像素格式，一个是针对YUV像素格式的。

支持的像素格式

x264支持8 到 10 bit的颜色空间。确切的颜色深度在x264配置时设置，在一个特定编译版本的FFmpeg中只支持一种颜色深度，换句话就是不同位深需要多个版本的ffmpeg x264.

libx264 libx264rgb 选项

下面的选项被libx264（libx264rgb）封装支持，所有的等效 x264-XXX形式的选项和值都列在括号中。

这里只列出了需要特别说明或者私有的选项，其他选项参考[10 编码选项]部分。

为了更多的了解关于libx264的选项，可以使用x264 --full-help（需要x264命令行工具）或者参考libx264文档。

b (bitrate)

设置码率，单位bits/s，注意FFmpeg的码率单位是bits/s,而x264中码率单位是kilobits/s.
bf (bframes)
g (keyint)
qmin (qpmin)

最小量化尺度
qmax (qpmax)

最大量化尺度
qdiff (qpstep)

量化尺度最大差值
qblur (qblur)

模糊量化曲线
qcomp (qcomp)

量化曲线压缩因子
refs (ref)

每一帧可以使用参考帧数，范围0-16.
sc_threshold (scenecut)

设置场景变化检测阈值
trellis (trellis)

执行网格量化以提高效率。默认情况下启用。
nr (nr)
me_range (merange)

像素运动最大搜索范围

me_method (me)

设置运动估计方法。按速度递减顺序可能值：

‘dia (dia)’ ‘epzs (dia)’

半径为1菱形搜索 (fastest). ‘epzs’是‘dia’的别名

‘hex (hex)’

半径为2的正六边形搜索。

‘umh (umh)’

多层次六边形搜索。

‘esa (esa)’

穷举搜索。

‘tesa (tesa)’

Hadamard(阿达玛)穷举搜索（最慢）。

subq (subme)

亚像素运动估计方法。
b_strategy (b-adapt)

自适应B帧布局决策算法。仅第一次使用。
keyint_min (min-keyint)

最小 GOP 尺寸

coder

设置熵编码器，可能值:

‘ac’

允许CABAC.

‘vlc’

允许CAVLC而且禁止 CABAC. 它类似于x264中的`--no-cabac`

cmp

设置全像素运动估计比较算法，可能值:

‘chroma’
```
允许chroma 
```
‘sad’
```
忽略chroma，其等效于 x264中的`--no-chroma-me` 
```
threads (threads)

编码线程数

thread_type

设置多线程技术，可能值:

‘slice’

切片多线程，它等效于x264中的`--sliced-threads`

‘frame’

基于帧的多线程

flags

设置编码标志，它和-cgop配合可以用来关闭GOP或者打开GOP，类似于x264中的--open-gop
rc_init_occupancy (vbv-init)
preset (preset)

设置编码预置
tune (tune)

设置编码参数整定
profile (profile)

设置配置文件的限制。
fastfirstpass

参数为1则当第一次编码（pass1）允许快速设置，参数为0，表示禁止快速设置（等效于x264的--slow-firstpass）
crf (crf)

设为质量恒定模式（类VBR）
crf_max (crf-max)

CRF模式下，防止VBV降低质量超越的阀值
qp (qp)

设定量化率控制方法参数。
aq-mode (aq-mode)

设置AQ方法，可能值

‘none (0)’
```
禁止. 
```
‘variance (1)’
```
方差AQ (复杂蒙版). 
```
‘autovariance (2)’
```
自动方差AQ (实验). 
```
aq-strength (aq-strength)

设置AQ强度，减少阻塞平面和纹理区域模糊。
psy

为1表示使用视觉优化。为0则禁用（等效 x264的--no-psy）
psy-rd (psy-rd)

在psy-rd：psy-trellis中设置视觉优化强度
rc-lookahead (rc-lookahead)

设置向前预测参考帧数.
weightb

为1设置帧加权预测，否则为0表示禁止（等效于x264的--no-weightb）
weightp (weightp)

设置P帧加权预测法，可能值:

‘none (0)’
```
禁止 
```
‘simple (1)’
```
使用加权参考 
```
‘smart (2)’
```
使加权文献和重复 
```
ssim (ssim)

允许在编码结束后技术输出SSIM
intra-refresh (intra-refresh)

为1表示使用周期内刷新代替IDR帧设置
avcintra-class (class)

配置编码器生成AVC-Intra，有效值50，100，200
bluray-compat (bluray-compat)

配置兼容蓝光标准，是 "bluray-compat=1 force-cfr=1"的简写
b-bias (b-bias)

设置B帧如何被影响
b-pyramid (b-pyramid)

设置保持一些B帧作为参考集的方法，允许值:

‘none (none)’
```
禁用. 
```
‘strict (strict)’
```
严格的分层金字塔 
```
‘normal (normal)’
```
Non-strict (非蓝光兼容). 
```
mixed-refs

为1表示每个分区使用一个参考，而不是每个宏块一个参考，否则为0，其等效于x264的 --no-mixed-refs
8x8dct

为1指采用自适应空间变换矩阵大小 (8x8变换) ，否则为0，等效于x264的--no-8x8dct
fast-pskip

为1表示早期跳过检查。等效于x264的--no-fast-pskip
aud (aud)

为1启用访问单元分隔设置
mbtree

为1表示允许使用宏块树，否则（为0）等效于x264的--no-mbtree
deblock (deblock)

设置环路滤波参数，参数型为alpha:beta
cplxblur (cplxblur)

QP波动减少（压缩前曲线压缩）

partitions (partitions)

设置分区规格，参考后面逗号分隔的列表，可能值有:

‘p8x8’

8x8 P帧 分区

‘p4x4’

4x4 P帧 分区 .

‘b8x8’

4x4 B帧分区

‘i8x8’

8x8 I帧分区.

‘i4x4’

4x4 I帧分区 (‘p4x4’的前提是‘p8x8’也被设置，允许‘i8x8’ 则需要设置了8x8dct被允许)

‘none (none)’

不考虑分区

‘all (all)’

考虑所有可能分区

direct-pred (direct)

设置直接MV预测模式，可能值:

‘none (none)’
```
禁止MV预测 
```
‘spatial (spatial)’
```
使空间预测 
```
‘temporal (temporal)’
```
使时间的预测 
```
‘auto (auto)’
```
自动识别 
```
slice-max-size (slice-max-size)

设置每个分片的字节大小限制，单位字节，如果不设置但RTP载荷设置了就使用RTP载荷
stats (stats)

设置多次编码的文件名称
nal-hrd (nal-hrd)

设置HRD信息信号 (要求vbv-bufsize被设置). 可能值:

‘none (none)’
```
禁用HRD信息信号 
```
‘vbr (vbr)’
```
可变比特率 
```
‘cbr (cbr)’
```
固定比特率 (MP4容器不允许). 
```
x264opts (N.A.)

设置任意的x264选项，参看x264 --fullhelp 以获取列表

参数是一个由':'分隔的key=value序列。对于filter和psy-rd选项，也是有":"被','代替作为分隔符。

例如，要指定使用libx264编码：

ffmpeg -i foo.mpg -vcodec libx264 -x264opts keyint=123:min-keyint=20 -an out.mkv
x264-params (N.A.)

使用 : 分隔的 key=value 参数覆盖x264配置，

这个选项类似x264opts，但其兼容Libav

例如:

ffmpeg -i INPUT -c:v libx264 -x264-params level=30:bframes=0:weightp=0:\ cabac=0:ref=1:vbv-maxrate=768:vbv-bufsize=2000:analyse=all:me=umh:\ no-fast-pskip=1:subq=6:8x8dct=0:trellis=0 OUTPUT

此外编码ffpresets还支持一些通用的选项，可以参考前述[ 预置 ]相关文档。

libx265

x265 H.265/HEVC 编码器封装

编译需要头和库文件，还需要利用--enable-libx265在配置中允许

libx265选项

preset

设置x265预置
tune

设置x265可调参数
x265-params

使用':'分隔的key=value列表进行选项设置，参考 x265 --help 获取支持的选项

例如采用libx265,并利用-x265-params进行选项设置:

ffmpeg -i input -c:v libx265 -x265-params crf=26:psy-rd=1 output.mp4

libxvid

Xvid MPEG-4 Part 2 封装

编译需要livxvidcore头和library库文件，还需要利用--enable-libxvid --enable-gpl在配置中允许

当前原生的mpeg4编码器支持MPEG-4 Part 2格式，所以不一定需要这个库了。

libxvid选项

下面选项是libxvid封装支持的选项，其中部分只列出，而没有文档介绍是因为其同[10 编码选项]中通用选项一致，其它没有列出的通用选项则在库中无效。

b
g
qmin
qmax
mpeg_quant
threads
bf
b_qfactor
b_qoffset

flags

设置编码标志，可能值:

‘mv4’

对宏块使用4个运动检测

‘aic’

允许高品质AC预测

‘gray’

只编码灰度

‘gmc’

全局运动补偿(GMC).

‘qpel’

1/4像素运动补偿

‘cgop’

关闭GOP.

‘global_header’

在每个关键帧放置全局头extradata

trellis

me_method

设置运动估计方法.按速度降低，质量增加排列的可能值:

‘zero’

不使用运动估计方法 (默认).

‘phods’ ‘x1’ ‘log’

启用16x16块和16x16块半像素细化进行菱形区域搜索， ‘x1’和‘log’是‘phods’别名

‘epzs’

允许前述所有值，再加上8x8菱形区域搜索，8x8半像素细化，并在色度平面进行运动估计

‘full’

允许所有的 16x16和8x8 区域搜索

mbd

设置宏块选择算法，依质量提高的可能值:

‘simple’

使用宏块比较函数算法 (默认).

‘bits’

允许16x16块半像素和1/4像素细化失真估计

‘rd’

允许上述所有可能值，再加上8x8块半像素和1/4像素细化失真估计，并采用方形图案失真估计进行搜索。

lumi_aq

为1允许lumi遮蔽自适应量化，默认为0 (禁止).
variance_aq

为1允许方差的自适应量化,默认为0 (禁止).

如果结合lumi_aq,由此产生的质量不会比任何一个单独规定。换句话说，所得到的质量会差于单独使用任何一个选项的效果。

ssim

设置结构信息（SSIM）显示方法。可能的值：

‘off’

禁止SSIM信息

‘avg’

在编码后输出平均SSIM。格式为：

Average SSIM: %f

对那些不熟悉C的的用户，f表示浮点数或者小数 (例如 0.939232)

‘frame’

在编码过程中输出每帧SSIM，并且在编码结束后输出平均SSIM，每帧信息格式为：

       SSIM: avg: %1.3f min: %1.3f max: %1.3f

对那些不熟悉C的的用户，%1.3f表示3位小数的浮点数(例如0.932).

ssim_acc

设置SSIM精度。可用的选项参数是在0-4范围的整数，而0给出了最准确的结果和计算速度最快的4。

mpeg2

MPEG-2编码器

mpeg2选项

seq_disp_ext integer

指定是否写一个 sequence_display_extension到输出

-1 auto

自动检测是否写，是默认值，如果数据被写入不同于默认或指定的值则判断是否写

0 never

从不写

1 always

一直写

png

png图像编码器

png选项

dpi integer

设置像素的物理密度，每英寸点数，没有默认设置

dpm integer

设置像素的物理密度，每米点数，没有默认设置

ProRes

Apple ProRes编码器

FFmpeg包含2种ProRes编码器，prores-aw和prores-ks。它们可以由-vcodec选项指定

prores-ks私有选项

profile integer

选择ProRes属性（预置）配置来编码，可能值：

‘proxy’ ‘lt’ ‘standard’ ‘hq’ ‘4444’
quant_mat integer

选择的量化矩阵,可能值：

‘auto’ ‘default’ ‘proxy’ ‘lt’ ‘standard’ ‘hq’

如果选择auto, 匹配属性的量化矩阵会被选中，如果没有设置，则选择最高质量的量化矩阵
bits_per_mb integer

分配的宏块位，不同的属性在200-2400间，最大值为8000
mbs_per_slice integer

每个切片中宏块数（1-8），默认为8，几乎是所有情况下最好值
vendor string

重写4字节的供应商ID。例如apl0这个自定义供应商ID会被认为是由苹果编码器产生。
alpha_bits integer

指定alpha分量的比特数。可能的值是0，8和16。用0禁用alpha平面编码

速度考虑

在默认操作模式下，编码器以高质量为目的（即在不产生超过要求的帧数据限定下，使输出质量尽可能好）。这种情况下帧内很多小的细节是很难压缩的，编码器将花更多的时间为每个片寻找合适的量化。

所以设置更高的bits_per_mb限额将提高速度。

要获取最快的编码速度，则设置qscale参数（4为推荐值）和不设置帧数据大小限制。

阅读(1651) | 评论(0) | 转发(0) |

上一篇：翻译ffmpeg-all文档（16），音频编码器

下一篇：翻译ffmpeg-all文档（18），字幕编码器

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6