Chinaunix首页 | 论坛 | 博客
  • 博客访问: 686022
  • 博文数量: 95
  • 博客积分: 1773
  • 博客等级: 上尉
  • 技术积分: 1653
  • 用 户 组: 普通用户
  • 注册时间: 2007-08-17 23:28
文章分类
文章存档

2018年(2)

2017年(10)

2016年(7)

2015年(48)

2014年(2)

2013年(2)

2012年(2)

2011年(7)

2010年(7)

2009年(3)

2008年(1)

2007年(4)

分类: 其他平台

2015-07-15 09:38:09

17 视频编码器

介绍一些当前有效的视频编码器

libtheora

libtheora的封装

编译需要头和库文件,还需要利用--enable-libtheora在配置中允许

更多信息参考 http://www.videolan.org/developers/x264.html以了解更多x264项目内容。

libx264rgb和libx264类似,只是一个是编码RGB像素格式,一个是针对YUV像素格式的。

支持的像素格式

x264支持8 到 10 bit的颜色空间。确切的颜色深度在x264配置时设置,在一个特定编译版本的FFmpeg中只支持一种颜色深度,换句话就是不同位深需要多个版本的ffmpeg x264.

libx264 libx264rgb 选项

下面的选项被libx264(libx264rgb)封装支持,所有的等效 x264-XXX形式的选项和值都列在括号中。

这里只列出了需要特别说明或者私有的选项,其他选项参考[10 编码选项]部分。

为了更多的了解关于libx264的选项,可以使用x264 --full-help(需要x264命令行工具)或者参考libx264文档。

  • b (bitrate)

    设置码率,单位bits/s,注意FFmpeg的码率单位是bits/s,而x264中码率单位是kilobits/s.

  • bf (bframes)
  • g (keyint)
  • qmin (qpmin)

    最小量化尺度

  • qmax (qpmax)

    最大量化尺度

  • qdiff (qpstep)

    量化尺度最大差值

  • qblur (qblur)

    模糊量化曲线

  • qcomp (qcomp)

    量化曲线压缩因子

  • refs (ref)

    每一帧可以使用参考帧数,范围0-16.

  • sc_threshold (scenecut)

    设置场景变化检测阈值

  • trellis (trellis)

    执行网格量化以提高效率。默认情况下启用。

  • nr (nr)
  • me_range (merange)

    像素运动最大搜索范围

  • me_method (me)

    设置运动估计方法。按速度递减顺序可能值:

    ‘dia (dia)’ ‘epzs (dia)’

    半径为1菱形搜索 (fastest). ‘epzs’是‘dia’的别名 

    ‘hex (hex)’

    半径为2的正六边形搜索。 

    ‘umh (umh)’

    多层次六边形搜索。 

    ‘esa (esa)’

    穷举搜索。 

    ‘tesa (tesa)’

    Hadamard(阿达玛)穷举搜索(最慢)。 
  • subq (subme)

    亚像素运动估计方法。

  • b_strategy (b-adapt)

    自适应B帧布局决策算法。仅第一次使用。

  • keyint_min (min-keyint)

    最小 GOP 尺寸

  • coder

    设置熵编码器,可能值:

    ‘ac’

    允许CABAC. 

    ‘vlc’

    允许CAVLC而且禁止 CABAC. 它类似于x264中的`--no-cabac` 
  • cmp

    设置全像素运动估计比较算法,可能值:

    ‘chroma’

    允许chroma 

    ‘sad’

    忽略chroma,其等效于 x264中的`--no-chroma-me` 
  • threads (threads)

    编码线程数

  • thread_type

    设置多线程技术,可能值:

    ‘slice’

    切片多线程,它等效于x264中的`--sliced-threads` 

    ‘frame’

    基于帧的多线程 
  • flags

    设置编码标志,它和-cgop配合可以用来关闭GOP或者打开GOP,类似于x264中的--open-gop

  • rc_init_occupancy (vbv-init)
  • preset (preset)

    设置编码预置

  • tune (tune)

    设置编码参数整定

  • profile (profile)

    设置配置文件的限制。

  • fastfirstpass

    参数为1则当第一次编码(pass1)允许快速设置,参数为0,表示禁止快速设置(等效于x264的--slow-firstpass

  • crf (crf)

    设为质量恒定模式(类VBR)

  • crf_max (crf-max)

    CRF模式下,防止VBV降低质量超越的阀值

  • qp (qp)

    设定量化率控制方法参数。

  • aq-mode (aq-mode)

    设置AQ方法,可能值

    ‘none (0)’

    禁止. 

    ‘variance (1)’

    方差AQ (复杂蒙版). 

    ‘autovariance (2)’

    自动方差AQ (实验). 
  • aq-strength (aq-strength)

    设置AQ强度,减少阻塞平面和纹理区域模糊。

  • psy

    为1表示使用视觉优化。为0则禁用(等效 x264的--no-psy

  • psy-rd (psy-rd)

    在psy-rd:psy-trellis中设置视觉优化强度

  • rc-lookahead (rc-lookahead)

    设置向前预测参考帧数.

  • weightb

    为1设置帧加权预测,否则为0表示禁止(等效于x264的--no-weightb

  • weightp (weightp)

    设置P帧加权预测法,可能值:

    ‘none (0)’

    禁止 

    ‘simple (1)’

    使用加权参考 

    ‘smart (2)’

    使加权文献和重复 
  • ssim (ssim)

    允许在编码结束后技术输出SSIM

  • intra-refresh (intra-refresh)

    为1表示使用周期内刷新代替IDR帧设置

  • avcintra-class (class)

    配置编码器生成AVC-Intra,有效值50,100,200

  • bluray-compat (bluray-compat)

    配置兼容蓝光标准,是 "bluray-compat=1 force-cfr=1"的简写

  • b-bias (b-bias)

    设置B帧如何被影响

  • b-pyramid (b-pyramid)

    设置保持一些B帧作为参考集的方法,允许值:

    ‘none (none)’

    禁用. 

    ‘strict (strict)’

    严格的分层金字塔 

    ‘normal (normal)’

    Non-strict (非蓝光兼容). 
  • mixed-refs

    为1表示每个分区使用一个参考,而不是每个宏块一个参考,否则为0,其等效于x264的 --no-mixed-refs

  • 8x8dct

    为1指采用自适应空间变换矩阵大小 (8x8变换) ,否则为0,等效于x264的--no-8x8dct

  • fast-pskip

    为1表示早期跳过检查。等效于x264的--no-fast-pskip

  • aud (aud)

    为1启用访问单元分隔设置

  • mbtree

    为1表示允许使用宏块树,否则(为0)等效于x264的--no-mbtree

  • deblock (deblock)

    设置环路滤波参数,参数型为alpha:beta

  • cplxblur (cplxblur)

    QP波动减少(压缩前曲线压缩)

  • partitions (partitions)

    设置分区规格,参考后面逗号分隔的列表,可能值有:

    ‘p8x8’

    8x8 P帧 分区 

    ‘p4x4’

    4x4 P帧 分区 . 

    ‘b8x8’

    4x4 B帧分区 

    ‘i8x8’

    8x8 I帧分区. 

    ‘i4x4’

    4x4 I帧分区 (‘p4x4’的前提是‘p8x8’也被设置,允许‘i8x8’ 则需要设置了8x8dct被允许) 

    ‘none (none)’

    不考虑分区 

    ‘all (all)’

    考虑所有可能分区 
  • direct-pred (direct)

    设置直接MV预测模式,可能值:

    ‘none (none)’

    禁止MV预测 

    ‘spatial (spatial)’

    使空间预测 

    ‘temporal (temporal)’

    使时间的预测 

    ‘auto (auto)’

    自动识别 
  • slice-max-size (slice-max-size)

    设置每个分片的字节大小限制,单位字节,如果不设置但RTP载荷设置了就使用RTP载荷

  • stats (stats)

    设置多次编码的文件名称

  • nal-hrd (nal-hrd)

    设置HRD信息信号 (要求vbv-bufsize被设置). 可能值:

    ‘none (none)’

    禁用HRD信息信号 

    ‘vbr (vbr)’

    可变比特率 

    ‘cbr (cbr)’

    固定比特率 (MP4容器不允许). 
  • x264opts (N.A.)

    设置任意的x264选项,参看x264 --fullhelp 以获取列表

    参数是一个由':'分隔的key=value序列。对于filterpsy-rd选项,也是有":"被','代替作为分隔符。

    例如,要指定使用libx264编码:

    ffmpeg -i foo.mpg -vcodec libx264 -x264opts keyint=123:min-keyint=20 -an out.mkv

  • x264-params (N.A.)

    使用 : 分隔的 key=value 参数覆盖x264配置,

    这个选项类似x264opts,但其兼容Libav

    例如:

    ffmpeg -i INPUT -c:v libx264 -x264-params level=30:bframes=0:weightp=0:\ cabac=0:ref=1:vbv-maxrate=768:vbv-bufsize=2000:analyse=all:me=umh:\ no-fast-pskip=1:subq=6:8x8dct=0:trellis=0 OUTPUT

此外编码ffpresets还支持一些通用的选项,可以参考前述[ 预置 ]相关文档。

libx265

x265 H.265/HEVC 编码器封装

编译需要头和库文件,还需要利用--enable-libx265在配置中允许

libx265选项

  • preset

    设置x265预置

  • tune

    设置x265可调参数

  • x265-params

    使用':'分隔的key=value列表进行选项设置,参考 x265 --help 获取支持的选项

    例如采用libx265,并利用-x265-params进行选项设置:

    ffmpeg -i input -c:v libx265 -x265-params crf=26:psy-rd=1 output.mp4

libxvid

Xvid MPEG-4 Part 2 封装

编译需要livxvidcore头和library库文件,还需要利用--enable-libxvid --enable-gpl在配置中允许

当前原生的mpeg4编码器支持MPEG-4 Part 2格式,所以不一定需要这个库了。

libxvid选项

下面选项是libxvid封装支持的选项,其中部分只列出,而没有文档介绍是因为其同[10 编码选项]中通用选项一致,其它没有列出的通用选项则在库中无效。

  • b
  • g
  • qmin
  • qmax
  • mpeg_quant
  • threads
  • bf
  • b_qfactor
  • b_qoffset
  • flags

    设置编码标志,可能值:

    ‘mv4’

    对宏块使用4个运动检测 

    ‘aic’

    允许高品质AC预测 

    ‘gray’

    只编码灰度 

    ‘gmc’

    全局运动补偿(GMC). 

    ‘qpel’

    1/4像素运动补偿 

    ‘cgop’

    关闭GOP. 

    ‘global_header’

    在每个关键帧放置全局头extradata 
  • trellis

  • me_method

    设置运动估计方法.按速度降低,质量增加排列的可能值:

    ‘zero’

    不使用运动估计方法 (默认). 

    ‘phods’ ‘x1’ ‘log’

    启用16x16块和16x16块半像素细化进行菱形区域搜索, ‘x1’和‘log’是‘phods’别名 

    ‘epzs’

    允许前述所有值,再加上8x8菱形区域搜索,8x8半像素细化,并在色度平面进行运动估计 

    ‘full’

    允许所有的 16x16和8x8 区域搜索 
  • mbd

    设置宏块选择算法,依质量提高的可能值:

    ‘simple’

    使用宏块比较函数算法 (默认). 

    ‘bits’

    允许16x16块半像素和1/4像素细化失真估计 

    ‘rd’

    允许上述所有可能值,再加上8x8块半像素和1/4像素细化失真估计,并采用方形图案失真估计进行搜索。 
  • lumi_aq

    为1允许lumi遮蔽自适应量化,默认为0 (禁止).

  • variance_aq

    为1允许方差的自适应量化,默认为0 (禁止).

    如果结合lumi_aq,由此产生的质量不会比任何一个单独规定。换句话说,所得到的质量会差于单独使用任何一个选项的效果。

  • ssim

    设置结构信息(SSIM)显示方法。可能的值:

    ‘off’

    禁止SSIM信息 

    ‘avg’

    在编码后输出平均SSIM。格式为:
    
    Average SSIM: %f
    
    对那些不熟悉C的的用户,f表示浮点数或者小数 (例如 0.939232) 

    ‘frame’

    在编码过程中输出每帧SSIM,并且在编码结束后输出平均SSIM,每帧信息格式为:
    
           SSIM: avg: %1.3f min: %1.3f max: %1.3f
    
    对那些不熟悉C的的用户,%1.3f表示3位小数的浮点数(例如0.932). 
  • ssim_acc

    设置SSIM精度。可用的选项参数是在0-4范围的整数,而0给出了最准确的结果和计算速度最快的4。

mpeg2

MPEG-2编码器

mpeg2选项

  • seq_disp_ext integer

    指定是否写一个 sequence_display_extension到输出

    -1 auto

    自动检测是否写,是默认值,如果数据被写入不同于默认或指定的值则判断是否写 

    0 never

    从不写 

    1 always

    一直写 

png

png图像编码器

png选项

dpi integer

设置像素的物理密度,每英寸点数,没有默认设置 

dpm integer

设置像素的物理密度,每米点数,没有默认设置

ProRes

Apple ProRes编码器

FFmpeg包含2种ProRes编码器,prores-aw和prores-ks。它们可以由-vcodec选项指定

prores-ks私有选项

  • profile integer

    选择ProRes属性(预置)配置来编码,可能值:

    ‘proxy’ ‘lt’ ‘standard’ ‘hq’ ‘4444’

  • quant_mat integer

    选择的量化矩阵,可能值:

    ‘auto’ ‘default’ ‘proxy’ ‘lt’ ‘standard’ ‘hq’

    如果选择auto, 匹配属性的量化矩阵会被选中,如果没有设置,则选择最高质量的量化矩阵

  • bits_per_mb integer

    分配的宏块位,不同的属性在200-2400间,最大值为8000

  • mbs_per_slice integer

    每个切片中宏块数(1-8),默认为8,几乎是所有情况下最好值

  • vendor string

    重写4字节的供应商ID。例如apl0这个自定义供应商ID会被认为是由苹果编码器产生。

  • alpha_bits integer

    指定alpha分量的比特数。可能的值是0,8和16。用0禁用alpha平面编码

速度考虑

在默认操作模式下,编码器以高质量为目的(即在不产生超过要求的帧数据限定下,使输出质量尽可能好)。这种情况下帧内很多小的细节是很难压缩的,编码器将花更多的时间为每个片寻找合适的量化。

所以设置更高的bits_per_mb限额将提高速度。

要获取最快的编码速度,则设置qscale参数(4为推荐值)和不设置帧数据大小限制。

阅读(1480) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~