您当前的位置：首页 > GB/T 33475.2-2024 信息技术高效多媒体编码第2部分：视频 > 下载地址2

GB/T 33475.2-2024 信息技术高效多媒体编码第2部分：视频

名称：GB/T 33475.2-2024 信息技术高效多媒体编码第2部分：视频 - 下载地址2
下载地址：[下载地址2]
提取码：
浏览次数：3

下载帮助：

发表评论

加入收藏夹

错误报告

新闻评论（共有 0 条评论）

资料介绍

　　ICS 35. 040 CCS L 71

　　中华人民共和国国家标准

　　GB/T 33475.2—2024代替 GB/T33475.2—2016

　　信息技术高效多媒体编码

　　第 2 部分:视频

　　Information technology—High efficiency multimedia coding—

　　Part2:Video

　　2024-05-28发布 2024-12-01实施

　　国家市场监督管理总局国家标准化管理委员会

　　发

　　布

　　GB/T 33475.2—2024

　　前言 Ⅲ

　　引言 Ⅴ

　　1 范围 1

　　2 规范性引用文件 1

　　3 术语和定义 1

　　4 缩略语 8

　　5 约定 8

　　6 编码位流的结构 16

　　7 位流的语法和语义 21

　　8 解析过程 104

　　9 解码过程 141

　　附录 A (规范性) 伪起始码方法 228

　　附录 B (规范性) 档次和级别 229

　　附录 C (规范性) 位流参考缓冲区管理 243

　　附录 D (规范性) 加权量化矩阵 247

　　附录 E (资料性) 高动态范围恒定亮度系统视频信号重建的参考实现方法 248

　　附录 F (资料性) 高动态范围场景亮度保真光电转移函数 250

　　附录 G(资料性) 色彩转换方法 252

　　附录 H (资料性) 单视点纹理深度拼接方法 253

　　附录 I (规范性) 扫描表 258

　　附录 J (资料性) 高级熵编码器解码器参考描述方法 262

　　Ⅰ

　　GB/T 33475.2—2024

　　前言

　　本文件按照 GB/T 1. 1—2020《标准化工作导则第 1部分 :标准化文件的结构和起草规则》的规定起草。

　　本文件是 GB/T 33475《信息技术高效多媒体编码》的第 2 部分。GB/T 33475 已经发布了以下部分 :

　　— 第 1部分 :系统 ;

　　— 第 2部分 :视频 ;

　　— 第 3部分 :音频 ;

　　— 第 4部分 :符合性测试 ;

　　— 第 5部分 :参考软件 ;

　　— 第 6部分 :智能媒体传输 ;

　　— 第 7部分 : 图片文件格式。

　　本文件代替 GB/T 33475.2—2016《信息技术高效多媒体编码第 2部分 :视频》,与 GB/T 33475. 2— 2016相比 ,除结构调整和编辑性改动外 ,主要技术变化如下 :

　　— 增加了“视点”“视差矢量”“视间编码”“视间运动矢量 ”等术语(见 3. 49、3. 50、3. 51、3. 54) ,更改了“层 ”“图像 ”“样本宽高比 ”“游程 ”等术语(见 3. 13、3. 61、3. 69、3. 72, 2016年版 3. 13、3. 53、 3. 61、3. 63) ;

　　— 增加了基于视间预测的多视档次和基于深度图编码的 3D档次(见 6. 1. 3、7. 1、7. 2、9. 6. 3、9. 6. 6、 9. 6. 7、9. 6. 8、9. 6. 9、9. 6. 11、9. 6. 12、9. 6. 16、附录 H) ;

　　— 增加了 HDR动态元数据扩展(见 7. 1. 2. 5) ;

　　— 增加了跳过变换量化技术和无损 16位 4 ∶ 4 ∶ 4档次(见 7. 1. 7、8. 3. 4、9. 7. 1、附录 B) ;

　　— 增加了通用串预测技术和高级 8位 4 ∶ 4 ∶ 4视频档次(见 7. 1. 9、7. 2、9. 6. 9、9. 10、附录 B. 2) ;

　　— 增加了比特深度和采样格式扩展(见 7. 2. 2、附录 G) ;

　　— 更改了基准档次 (见附录 B, 2016 年版的附录 B) , 更改了样本精度和 BitDepth(见 7. 2. 2、 9. 6. 2,2016年版的 7. 2. 2、9. 6. 2) , 更改了最大编码单元的最大二进制位数等有关部分 (见7. 2. 4,2016年版的 7. 2. 4) ;

　　— 增加了基于背景帧技术的高级场景档次(见 7. 2. 3、9. 3、附录 B) 。

　　本文件由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。

　　本文件起草单位 :北京大学、浙江大学、北京三星通信技术研究有限公司、深圳市海思半导体有限公司、中关村视听产业技术创新联盟、清华大学、瑞昱半导体(深圳)有限公司、北京大学深圳研究生院、电子科技大学、晨星软件研发(深圳)有限公司、上海大学、中国科学院大学、联发博动科技(北京) 有限公司、上海国茂数字技术有限公司、中国科学技术大学、中山大学、捷讯移动科技(中国) 有限公司、美国博通通信技术(上海)有限公司、哈尔滨工业大学、中国科学院计算技术研究所、台湾成功大学、上海兆芯集成电路有限公司、武汉大学、上海交通大学、香港科技大学、同济大学、绍兴文理学院。

　　本文件起草人 : 高文、黄铁军、盛志凡、虞露、郑萧桢、马思伟、郑建铧、梁凡、何芸、何至初、郭晓强、董文辉、余琴、李蔚然、陈杰、李善一、朴银姬、邵振江、王荣刚、童怡新、林和源、赵海武、张贤国、姜晓龙、凌勇、朱兴国、董思维、余全合、何大可、刘凌志、周敏华、曾伟民、林镇安、孙俊、陈方栋、林涛、王淑慧、周开伦、赵利平、金欣、王苫社、范晓鹏、陈震中、马冀、张娜、王大东、李一鸣、李其胜、毛琪、杨家辉、崔静、史雪凤、芦怡然、贾川民、张玉槐、赵海英。

　　Ⅲ

　　GB/T 33475.2—2024

　　本文件及其所代替文件的历次版本发布情况为 :

　　— 2016年首次发布为 GB/T 33475. 2—2016;

　　— 本次为第一次修订。

　　Ⅳ

　　GB/T 33475.2—2024

　　引言

　　GB/T 33475 旨在确立数字音视频媒体高效压缩的方法 ,拟由七个部分构成。

　　— 第 1部分 :系统。目的在于确立数字音视频媒体系统层编码方法。

　　— 第 2部分 :视频。目的在于确立高效视频压缩方法。

　　— 第 3部分 :音频。目的在于确立高效音频压缩方法。

　　— 第 4部分 :符合性测试。目的在于确定如何测试验证编码位流和解码器。

　　— 第 5部分 :参考软件。目的在于定义满足 GB/T 33475. 2—2024和 GB/T 33475. 3—2018规定要求的参考软件。

　　— 第 6部分 :智能媒体传输。目的在于规定用于异构包交换网络下多媒体数据传输的智能媒体传输技术。

　　— 第 7部分 : 图片文件格式。目的在于规定高效多媒体编码图片文件格式语法描述、语义描述、封装定义。

　　本文件的发布机构提请注意 , 声明符合本文件时 , 可能涉及 3. 6、4、6、6. 1. 3、6. 4、7. 1、7. 1. 2. 1、 7. 1. 2. 2、7. 1. 3、7. 1. 3. 1、7. 1. 3. 2、7. 1. 4、7. 1. 5、7. 1. 6、7. 1. 7、7. 2、7. 2. 2. 2、7. 2. 3. 2、7. 2. 3. 1、7. 2. 3. 2、7. 2. 4、7. 2. 5、 7. 2. 6、7. 2. 7、8. 3、8. 3. 3、8. 3. 3. 2. 1、8. 3. 4、8. 3. 4. 1、9. 1、9. 2、9. 2. 1、9. 2. 2、9. 2. 3、9. 2. 4、9. 2. 5、9. 4、9. 5、9. 5. 3、 9. 5. 5、9. 5. 6、9. 5. 8、9. 5. 8. 2、9. 5. 8. 4、9. 6、9. 6. 2、9. 6. 3、9. 7、9. 8、9. 8. 2、9. 8. 3、9. 9、9. 10、9. 11、9. 12、9. 14、9. 15、 9. 16、附录 A、附录 G、附录 D 和附录 F 中如下 133项与数字视频编解码技术相关的专利的使用。专利名称如下 :

　　CN201010155175. 1, 频带加权量化编解码方法和装置;CN201110350455. 2,矩阵编码方法与装置及解码方法与装置;CN201110007657. 7,多图像块划分的编解码方法和装置;CN200810056977. X,一种码流标识方法、装置及编解码系统 ; CN200680014013. 8, 一种实现算术编解码的方法及装置 ; CN200680014019. 5, 一种二进制化方法及装置 ; CN201110021859. 7, 一种编解码方法和装置 ; CN201110020668. 9,基于图像块的帧内预测模式的编解码方法和编解码器;CN201110022734. 6,一种编解码方法和装置 ; CN201110184112. 3, 一种解码过程中块索引信息的获取方法及装置 ; CN201010135828. X,视频数据的打包、编解码方法及装置及系统;CN201010233134. X, 编码、解码方法和编码、解码装置;CN201410253649. 4,视频编码方法和解码方法和相关装置;CN201310294435. 7,视频编解码方法、装置及系统;CN201210349055. 4,视频编码和解码的处理方法和装置;CN201210019843. 7,一种获得变换块尺寸的方法和模块 ; CN201110255252. 5, 一种变换块位置信息的获取方法和模块 ; CN201210021060. 2, 图像解码方法、图像编解码设备及网络系统;CN200810096456. 7,视频编解码方法及装置;CN200710126108. 5,实现随机访问的方法及解码器;CN201110008186. 1, 图像编码解码方法、处理图像数据方法及其设备;CN201210018036. 3,一种编解码方法和设备;CN201210377579. 4,用于运动矢量预测的运动矢量列表建立的方法、装置;CN200780000403. 4, 在编解码中的实现量化的方法和装置 ;CN200710193851. 2,量化模式、图像编码、解码方法、编码器、解码器及系统;CN201310128415. 2,一种编解码环路滤波的实现方法、装置及系统 ; CN201310008682. 6, 一种运动矢量预测的方法 ; CN201310163626. X,一种帧内预测方法;CN201210546675. 7, 一种头信息编解码、解码方法及装置 ; CN201210546537. 9,一种多方向的帧内预测编解码方法及装置;CN201410720721. X, 采样点自适应偏移参数估计方法及装置 ; ZL201010232105. 1, 视频图像块的编码、解码、重构方法及系统 ; ZL200910241349. 3,基于块的自适应超分辨率视频处理方法及系统;ZL201010226277. 8, 帧内预测的方法及装置、基于帧内预测的编解码方法及系统 ; ZL201210470731. 3,一种基于场景模型自适应更新的视

　　Ⅴ

　　GB/T 33475.2—2024

　　频编解码方法;CN201210519807. 7,视频编码方法、解码方法、编码器及解码器 ; CN201310008086. 8,视频编码方法、解码方法、编码器及解码器 ; CN201310066518. 0, 一种视频位流解码方法和装置 ; CN201310695685,基于加权量化的视频压缩编解码方法及编解码器;CN201310034524,基于方向和距离判别的运动矢量预测方法;CN201410127457, 一种针对色度的插值方法及滤波器;PCT/CN2014/ 079435,加权跳过模式的视频图像块压缩算术编解码方法及装置;CN201310465557,一种滤波器插值方法及滤波器;CN201310465581,一种视频图像的插值优化方法及滤波器;CN201210321179,一种低复杂度的分像素插值滤波器;PCT/CN2013/080179, 一种基于 P 帧的多假设运动补偿编码方法 ; PCT/ CN2013/080172,一种基于 P 帧的多假设运动补偿方法;CN201410485700. 4,一种运动信息存储压缩方法 ;CN201410491226. 6,视频编解码方法、装置及生成的视频码流;CN201410253964. 7,视频的图像输出管理方法及装置、传输视频码流的方法;CN201410253743. X,一种假设解码器中输入码流缓冲区的输入和输出从缓冲区获取数据的方法及装置;CN201410141736. 0, 视频编解码方法、装置及生成的视频码流 ;CN201410253685,一种在 PS流以及流媒体中支持背景帧随机访问的方法;CN201410235473. X,一种视频码流、视频编解码方法及装置 ; CN201310240913. 6, 一种相邻边界长度导出方法及装置 ; CN201310690704. 1,一种视频编解码处理方法及装置;CN201210528814. 3,一种视频编解码中运动信息导出方法及装置 ; CN201410264885. 6, 一种前向双假设编码图像块的编解码方法和装置 ; CN201310238184,提高数字信号变换性能的方法及数字信号变换方法和装置 ; CN201210531974. 3, 一种上下文模型选择的方法和装置;CN201310237872. 5,视频编解码方法及装置、传输视频码流的方法及视频码流;CN201210535423. 4,一种数据的熵编码方法和装置;CN201210349055. 4,视频编码和解码的处理方法和装置;CN201210420721. 9,视频编解码方法及装置;ZL201110388181. 6, 一种纹理自适应视频编解码系统 ; CN201210004028, 图像或视频编码的六角变换快速处理方法;CN201310746046. 3,表示视频图像显示顺序的方法;CN200310107985. X,一种可随机访问数据流的组织方法及其对应的解码方法 ;CN201110240524. 4,运用于图像编码和视频编码的六角变换方法和装置;CN201110335481. 8,视频编码合并模式双向补偿方法;CN201310049872. 2,基于颜色空间变换进行编解码误差修正的方法和系统 ;CN201310173139. 1,利用 YUV与 RGB空间联合修正视频编解码误差的方法;CN201310048281. 3,一种图像和视频编解码方法和系统;CN03151460. X,可随机访问数据流的封装方法及其对应的数据恢复方法 ;CN201210312587. 0,一种快速防止出现伪起始码的方法及装置;CN201510127896. 4,一种视频编码的帧内预测方法及系统;CN201510532699. 0,一种视频客观评价方法及系统;CN201410782673. 7,视频编码的参考图像选择方法及系统 ; CN201310349695. X,应用于数字音视频编译码技术标准系统之译码方法及译码装置 ; CN201410352473. 8, 应用于视频系统的编码/解码方法及编码/解码装置 ; CN201410495725. 2,视讯编码装置及视讯解码装置以及其编码与解码方法 ; CN201280021140,用于减少环内滤波缓冲区的方法及其装置;ZL201110300629. 4, 选择参考场及获取时域运动矢量的方法 ; PCT/CN2012/080103,一种深度图像帧内编码方法、装置及编码器;ZL200980131662. X, 图像编码方法及其装置、图像解码方法及其装置 ; ZL201080036020. 4,通过使用大型变换单元编码和解码图像的方法和设备 ; ZL201310097476. 7, 通过使用大型变换单元编码和解码图像的方法和设备 ; ZL201080049482. X,对图像边界的编码单元进行编码和解码的方法和设备;ZL201310088343. 3,对图像边界的编码单元进行编码和解码的方法和设备;ZL201310092751. 6,对图像边界的编码单元进行编码和解码的方法和设备;ZL201080063102. 8, 通过使用任意分区进行运动预测来对视频进行编码的方法和设备、以及通过使用任意分区进行运动预测来对视频进行解码的方法和设备;ZL201310085558. X,用于对视频进行解码的方法;ZL201310091250. 6, 用于对视频进行解码的设备;ZL201180027828. 0, 用于通过根据像素组补偿像素值来对视频进行编码的方法和设备以及用于通过根据像素组补偿像素值来对视频进行解码的方法和设备 ; ZL201180027747, 用于通过使用变换索引对视频进行编码的方法和设备、用于通过使用变换索引对视频进行解码的方法和设备 ; ZL201180029083. 1,基于根据树结构确定的编码单元的视频编码方法和视频编码设备以及基于根据树结构确定的编码单元的视频解码方法和视频

　　Ⅵ

　　GB/T 33475.2—2024

　　解码设备 ; CN202010488925. 0, 使用点预测和常现位置数组的数据编码方法和解码方法 ; CN202111158855. 3,用历史点预测信息表复用点矢量的数据编解码方法及装置;CN202210491142. 7,融合全色度与混合色度的图像编码和解码方法及其应用;CN202210543875. 0,使用受限通用串预测编码模式的图像编码解码方法及装置;CN202210521675. 5, 串矢量与像素值共用一个缓冲区的串预测解码方法及装置;ZL201110033714. 9,三维视频帧内预测方法及编解码方法;ZL201710086852. 0, 一种局部视差矢量的导出方法;ZL201710117803. 9,一种参考图像管理方法;2022106445357,一种单串信息的串预测编解码方法、装置及系统 ; 202010949286. 3,视频编码方法及其相关装置;202010887772. 7, 帧间预测方法及预测装置 ; 201811376393. 0, 通过帧内预测来对图像进行编码和解码的方法和设备 ; ZL201080036192. 1,用于对视频进行编码的方法和设备以及用于对视频进行解码的方法和设备 ; 201810140731. 4,提高数字信号变换性能的方法及数字信号变换方法和装置;ZL201480075345. 1,用于用信号传送 SAO参数的视频编码方法和设备以及视频解码方法和设备;ZL202010090751. 2,用于用信号传送 SAO参数的视频编码方法和设备以及视频解码方法和设备;ZL202010090740. 4,用于用信号传送 SAO参数的视频编码方法和设备以及视频解码方法和设备;ZL201480075994. 1,涉及帧内预测的视频编码方法和装置以及视频解码方法和装置;201911181685. 3,涉及帧内预测的视频编码方法和装置以及视频解码方法和装置;201911181548. X, 涉及帧内预测的视频编码方法和装置以及视频解码方法和装置;ZL201410136293. 6,对像素标识进行处理的方法和装置;201910637135. 1,对像素标识进行处理的方法和装置;ZL201910637118. 8,对像素标识进行处理的方法和装置;ZL201310684138. 3, 视频编解码中像素处理的方法和装置;ZL201910498645. 5,视频编解码中像素处理的方法和装置;201910498060. 3,视频编解码中像素处理的方法和装置;ZL201910573977. 5, 一种前向双假设编码图像块的编解码方法和装置;ZL201910574609. 2,一种前向双假设编码图像块的编解码方法和装置;ZL201510921083. 2, 视频帧内编码模式的标识方法、处理方法和装置;ZL201510920963. 8,一种视频编码模式的编解码方法和装置 ;201610148076. 8,视频全局视差向量编码方法、解码方法和装置;201710416329. X,运动矢量获取的方法及设备;ZL201180013472. 5,通过使用去块滤波对视频进行编码的方法和设备以及通过使用去块滤波对视频进行解码的方法和设备;ZL201810724201. 4, 视频解码方法;ZL201810847683. 2, 视频解码方法;ZL201710756628. 8,对视频数据进行解码的方法和设备;ZL201180027840. 1, 用于基于变换和反变换执行内插的方法和设备。

　　本文件的发布机构对于该专利的真实性、有效性和范围无任何立场。

　　该专利持有人已向本文件的发布机构保证 , 他愿意同任何申请人在合理且无歧视的条款和条件下 ,就专利授权许可进行谈判。该专利持有人的声明已在本文件的发布机构备案 ,相关信息可以通过以下联系方式获得 :

　　联系人 : 赵海英(数字音视频编解码技术标准工作组)

　　通讯地址 : 北京市海淀区花园路 2 号牡丹创业楼 515室

　　邮政编码 : 100191

　　电子邮件 : hy-zhao@163. com

　　电话 : +8610-82282177

　　传真 : +8610-82282177

　　网址: http://www. avs.org. cn

　　请注意除上述专利外 ,本文件的某些内容仍可能涉及专利。本文件的发布机构不承担识别专利的责任。

　　Ⅶ

　　GB/T 33475.2—2024

　　信息技术高效多媒体编码

　　第 2 部分:视频

　　1 范围

　　本文件规定了适应多种比特率、分辨率和质量要求的高效视频压缩方法的解码过程。

　　本文件适用于电视广播、数字电影、网络电视、网络视频、视频监控、实时通信、数字存储媒体等应用中视频的编码和解码。

　　2 规范性引用文件

　　下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中 , 注日期的引用文件 ,仅该日期对应的版本适用于本文件 ;不注日期的引用文件 ,其最新版本(包括所有的修改单) 适用于本文件。

　　GY/T 155—2000 高清晰度电视节目制作及交换用视频参数值

　　ISO 11664-1/CIE S 014-1 色度第 1部分 :标准比色观测器(Colorimetry—Part1:standard col- orimetric observers)

　　ISO 11664-3/CIE S 014-3 色度第 3 部分 : CIE 三色值(Colorimetry—Part3: CIE tristimulus values)

　　CIE S 015 室外工作场景照明(Lighting of OutdoorWorkplaces)

　　3 术语和定义

　　下列术语和定义适用于本文件。

　　3. 1

　　B 图像 B picture

　　帧间预测中使用显示顺序上过去和将来的参考图像进行解码的图像。

　　3.2

　　保留 reserved

　　一些特定语法元素值。

　　注 : 用于将来对本文件的扩展。

　　3.3

　　变换系数 transform coefficient

　　变换域上的一个标量。

　　3.4

　　编码单元 coding unit

　　包括一个亮度编码块和对应的色度编码块 , 由最大编码单元划分得到。

　　3.5

　　编码块 codingblock

　　M×M 的样值块 , 由最大编码块划分得到。

　　GB/T 33475.2—2024

　　3.6

　　编码图像 coded picture

　　一幅图像的编码表示。

　　3.7

　　补偿后样本 compensated sample

　　经预测补偿得到的样本。

　　3. 8

　　残差 residual

　　样本或数据元素的重建值与其预测值之差。

　　3.9

　　参考索引 reference index

　　参考图像队列中参考图像或其中场的编号。

　　3. 10

　　参考图像 referencepicture

　　解码过程中用于后续图像帧间预测的图像。

　　3. 11

　　参考图像队列 referencepicturelist

　　当前图像的参考的图像所组成的队列。

　　3. 12

　　参考图像缓冲区 referencepicturebuffer

　　保存解码图像并用于非场景预测的缓冲区。

　　3. 13

　　层 layer

　　位流中的分级结构 ,高层包含低层。

　　注 : 编码层由高到低依次为 :序列、图像、条带、最大编码单元、编码单元和编码块。

　　3. 14

　　场 field

　　由构成帧的三个样本矩阵中相间的行构成。

　　3. 15

　　场景图像 scenepicture

　　包括 G 图像和 GB 图像。

　　3. 16

　　场景图像缓冲区 scenereferencepicturebuffer

　　保存 G 图像或 GB 图像并用于预测的缓冲区。

　　3. 17

　　重建样本 reconstructed sample

　　由解码器根据位流解码得到并构成解码图像的样本。

　　3. 18

　　二元符号 bin

　　组成二元符号串的符号 ,包括 0 和 1。

　　3. 19

　　二元符号串 bin string

　　有限位二元符号组成的有序序列。

　　注 : 二元符号串中最左边符号是最高有效位 ,最右边符号是最低有效位。

　　GB/T 33475.2—2024

　　3.20

　　F 图像 F picture

　　帧间预测中使用单前向和双前向预测解码的图像。

　　3.21

　　反变换 inverse transform

　　将变换系数矩阵转换成空域样值矩阵的过程。

　　3.22

　　反量化 dequantization

　　对量化系数缩放后得到变换系数的过程。

　　3.23

　　分量 component

　　图像的三个样值矩阵(亮度和两个色度)中的一个矩阵或矩阵中的单个样值。

　　3.24

　　G 图像 G picture

　　只使用帧内预测解码的场景图像。

　　注 : G 图像能被输出。

　　3.25

　　GB 图像 GB picture

　　只使用帧内预测解码的场景图像。

　　注 : GB图像不能被输出。

　　3.26

　　光栅扫描 rasterscan

　　将二维矩形光栅映射到一维光栅 ,一维光栅的入口从二维光栅的第一行开始 ,然后扫描第二行、第三行 ,依次类推。

　　注 : 光栅中的行从左到右扫描。

　　3.27

　　划分 partition

　　将一个集合分为子集。

　　注 : 集合中的每个元素属于且只属于某一个子集。

　　3.28

　　划分方式 partition type

　　划分获得的子集的组织方式。

　　3.29

　　I图像 I picture

　　只使用帧内预测解码的非场景图像。

　　3.30

　　基准视点 baseview

　　能独立解码的视点。

　　3.31

　　级别 level

　　在某一档次下对语法元素和语法元素参数值的限定集合。

　　3.32

　　解码顺序 decoding order

　　解码过程根据图像之间的预测关系 ,对每幅图像解码的顺序。

　　GB/T 33475.2—2024

　　3.33

　　解码图像 decoded picture

　　解码器根据位流重建的图像。

　　3.34

　　解码图像缓冲区 decoded picturebuffer

　　保存解码图像并用于输出重排序和输出定时的缓冲区。

　　注 : 包括参考图像缓冲区和场景图像缓冲区。

　　3.35

　　解析过程 parse

　　由位流获得语法元素的过程。

　　3.36

　　禁止 forbidden

　　一些被禁用的特定语法元素值。

　　注 : 目的是避免在位流中出现伪起始码。

　　3.37

　　块 block

　　M×N(M列 N行)的样值矩阵或者变换系数矩阵。

　　3.38

　　块扫描 block scan

　　量化系数的特定串行排序方式。

　　3.39

　　档次 profile

　　本文件中规定的语法、语义及算法的子集。

　　3.40

　　亮度 luma

　　表示图像明暗程度的信号。

　　3.41

　　量化参数 quantization parameter

　　在解码过程对量化系数进行反量化的参数。

　　3.42

　　量化系数 quantization coefficient

　　反量化前变换系数的值。

　　3.43

　　滤波后样本 filtered sample

　　经去块效应滤波得到的样本。

　　3.44

　　P 图像 P picture

　　帧间预测中只使用单前向预测进行解码的图像。

　　3.45

　　偏移后样本 offseted sample

　　经样值偏移补偿得到的样本。

　　3.46

　　起始码 startcode

　　长度为 32位的二进制码字。

　　注 : 起始码的形式在整个位流中是唯一的 ,其有多种用途 ,其中之一是用来标识位流语法结构的开始。

　　GB/T 33475.2—2024

　　3.47

　　S 图像 S picture

　　使用帧内预测和单前向预测解码的图像。

　　3.48

　　色度 chroma

　　Cr和 Cb两种色差信号中任一种的样值矩阵或单个样值。

　　3.49

　　视点 view

　　具有相同相机位置索引的一个或多个图像 ,可包括纹理图像和深度图像。

　　3.50

　　视差矢量 disparity_vector

　　用于视点间预测的二维矢量 , 由当前图像指向参考图像 , 其值为当前块和参考块之间的坐标偏移量。

　　3.51

　　视间编码 interview coding

　　使用视间预测对编码单元或图像进行编码。

　　3.52

　　视间图像缓冲区 interview picturebuffer

　　保存视间图像并用于视间预测的缓冲区。

　　3.53

　　视间预测 interview prediction

　　帧间预测的一种 ,用于视间编码。使用先前解码的基准视点的解码图像生成当前图像样本预测值的过程。

　　3.54

　　视间运动矢量 interview motion vector

　　用于视间预测的二维运动矢量。

　　注 : 由当前图像指向视间参考图像 ,其值为当前块和参考块之间的坐标偏移量。

　　3.55

　　视频序列 sequence

　　编码位流的最高层语法结构 ,包括一个或多个连续的编码图像。

　　3.56

　　输出顺序 outputorder

　　输出解码图像的顺序 ,与显示顺序相同。

　　3.57

　　随机访问 random access

　　从某一点而非位流起始点开始对位流解码并恢复出解码图像的能力。

　　3.58

　　填充位 stuffingbits

　　编码时插入位流中的位串 ,在解码时被丢弃。

　　3.59

　　条带 slice

　　按光栅扫描顺序排列的若干连续最大编码单元。

　　GB/T 33475.2—2024

　　3.60

　　同时刻图像组 simultaneouspictureunit

　　由在同一时刻获取的多个视点的图像组成的图像组。

　　3.61

　　图像 picture

　　一帧或一场组成的纹理或深度信息的集合。

　　3.62

　　图像重排序 picturereordering

　　若解码顺序和输出顺序不同 ,对解码图像进行重排序的过程。

　　3.63

　　位串 bitstring

　　有限个二进制位的有序序列 ,其最左边位是最高有效位(MSB) ,最右边位是最低有效位(LSB) 。

　　3.64

　　位流 bitstream

　　编码图像所形成的二进制数据流。

　　3.65

　　位流缓冲区 bitstream buffer

　　存储位流的缓冲区。

　　3.66

　　位流顺序 bitstream order

　　编码图像在位流中的排列顺序 ,与图像解码的顺序相同。

　　3.67

　　显示顺序 display order

　　显示解码图像的顺序。

　　3.68

　　样本 sample

　　构成图像的基本元素。

　　3.69

　　样本宽高比 width heightratio

　　一幅图像中亮度样本列间的水平距离与行间的垂直距离之比。

　　注 : 表示为 h÷v,其中 h为水平方向样本个数 ,v为垂直方向样本个数。

　　3.70

　　样值 samplevalue

　　样本的幅值。

　　3.71

　　依赖视点 dependentview

　　依赖于基准视点进行解码的视点。

　　3.72

　　游程 run

　　在解码过程中若干连续的相同数据元素个数。

　　注 : 指在块扫描中一个非 0 系数前(沿块扫描顺序)值为 0 的系数的个数。

　　GB/T 33475.2—2024

　　3.73

　　预测 prediction

　　消除空域、时域和视点间冗余过程的具体实现。

　　3.74

　　预测补偿 prediction compensation

　　求由语法元素解码得到的样本残差与其对应的预测值之和。

　　3.75

　　预测单元 prediction unit

　　包括一个亮度预测块和对应的色度预测块 , 由编码单元划分得到。

　　3.76

　　预测过程 prediction process

　　使用预测器对当前解码样值或者数据元素进行估计。

　　3.77

　　预测划分方式 prediction partition type

　　编码单元划分为帧内预测块或帧间预测单元的方式。

　　3.78

　　预测块 prediction block

　　一个使用相同预测过程的 M×N 的样值块 , 由编码单元划分得到。

　　3.79

　　预测值 prediction value

　　在样值或数据元素的解码过程中 ,用到的先前已解码的样值或数据元素的组合。

　　3. 80

　　语法元素 syntax element

　　位流中的数据单元解析后的结果。

　　3. 81

　　源 source

　　编码前视频素材或其某些属性。

　　3. 82

　　运动矢量 motion vector

　　用于帧间预测或视间预测的二维矢量 , 由当前图像指向参考图像 ,其值为当前块和参考块之间的坐标偏移量。

　　3. 83

　　帧 frame

　　由一个亮度样本矩阵(Y)和两个色度样本矩阵(Cb和 Cr)构成的视频信号空间信息的表示。

　　3. 84

　　帧间编码 intercoding

　　使用帧间预测对编码单元或图像进行编码。

　　3. 85

　　帧间预测 interprediction

　　使用先前解码图像生成当前图像样本预测值的过程。

　　3. 86

　　帧内编码 intra coding

　　使用帧内预测对编码单元或图像进行编码。

　　GB/T 33475.2—2024

　　3. 87

　　帧内预测 intra prediction

　　在相同解码图像中使用先前解码的样值生成当前样本预测值的过程。

　　3. 88

　　字节 byte

　　8位的位串。

　　3. 89

　　字节对齐 bytealignment

　　从位流的第一个二进制位开始 ,某二进制位的位置是 8 的整数倍。

　　3.90

　　最大编码单元 largestcoding unit

　　包括一个 L×L 的亮度样值块和对应的色度样值块 , 由图像划分得到。

　　3.91

　　最大编码块 largestcodingblock

　　K×K 的样值块 , 由图像的三个样值矩阵(亮度和两个色度)中的一个矩阵划分得到。

　　4 缩略语

　　下列缩略语适用于本文件。

　　AEC 高级熵编码(Advanced Entropy Code)

　　ALF 自适应修正滤波(Adaptive Leveling Filter)

　　BBS 位流缓冲区最小尺寸(Bitstream Buffer Size)

　　BBV 位流参考缓冲区管理(Bitstream Buffer Verifier)

　　CBR 恒定比特率(ConstantBitRate)

　　CB 编码块(Coding Block)

　　CU 编码单元(Coding Unit)

　　CUT 编码树(Coding UnitTree)

　　DPB 解码图像缓冲区(Decoded Picture Buffer)

　　LCB 最大编码块(LargestCoding Block)

　　LCU 最大编码单元(LargestCoding Unit)

　　LDV 局部视差矢量(LocalDisparity Vector)

　　LSB 最低有效位(LeastSignificantBit)

　　MSB 最高有效位(MostSignificantBit)

　　PB 预测块(Prediction Block)

　　PU 预测单元(Prediction Unit)

　　ROI 感兴趣区域(Region ofInteresting)

　　SAO 样值偏移补偿(Sample Adaptive Offset)

　　TB 变换块(Transform Block)

　　5 约定

　　5. 1 概述

　　本文件中使用的数学运算符和优先级参照 C语言。但对整型除法和算术移位操作进行了特定定

　　GB/T 33475.2—2024

　　义。除特别说明外 ,约定编号和计数从 0 开始。

　　5.2 算术运算符

　　算术运算符定义见表 1。

　　表 1 算术运算符定义

　　算术运算符

　　定义

　　加法运算

　　减法运算(二元运算符)或取反(一元前缀运算符)

　　乘法运算

　　幂运算 ,表示 a 的 b次幂。也可表示上标

　　整除运算 ,沿向 0 的取值方向截断。例如 ,7/4和 -7/-4截断至 1, -7/4和 7/-4截断至 -1

　　除法运算 ,不做截断或四舍五入

　　自变量 i取由 a 到b(含 b)的所有整数值时 , 函数 f(i)f(i)的累加和

　　a%b

　　模运算 ,a 除以 b 的余数 ,其中 a 与b都是正整数

　　[. ]

　　上取整

　　5.3 逻辑运算符

　　逻辑运算符定义见表 2。

　　表 2 逻辑运算符定义

　　逻辑运算符

　　定义

　　a&&b

　　a 和 b之间的与逻辑运算

　　a ||b

　　a 和 b之间的或逻辑运算

　　逻辑非运算

　　5.4 关系运算符

　　关系运算符定义见表 3。

　　表 3 关系运算符定义

　　关系运算符

　　定义

　　大于

　　> =

　　大于或等于

　　小于

　　< =

　　小于或等于

　　GB/T 33475.2—2024

　　! = 不等于

　　表 3 关系运算符定义 (续)

　　关系运算符

　　定义

　　= =

　　等于

　　5.5 位运算符

　　位运算符定义见表 4。

　　表 4 位运算符定义

　　位运算符

　　定义

　　与运算

　　或运算

　　取反运算

　　a>>b

　　将 a 以 2 的补码整数表示的形式向右移 b位。仅当 b取正数时定义此运算

　　将 a 以 2 的补码整数表示的形式向左移 b位。仅当 b取正数时定义此运算

　　5.6 赋值

　　赋值运算定义见表 5。

　　表 5 赋值运算定义

　　赋值运算

　　定义

　　赋值运算符

　　递增 ,x++相当于 x=x+1。当用于数组下标时 ,在自加运算前先求变量值

　　- -

　　递减 ,x--相当于 x=x-1。当用于数组下标时 ,在自减运算前先求变量值

　　+ =

　　自加指定值 ,例如 x+ = 3 相当于 x=x+3,x+ = ( -3)相当于 x=x+( -3)

　　- =

　　自减指定值 ,例如 x- = 3 相当于 x=x-3,x-=( -3)相当于 x=x-( -3)

　　5.7 数学函数

　　数学函数定义见公式(1) ~公式(10) 。

　　x<0

　　Abs(x) = {-xx ;; x0 Abs(x) = {-xx ;; x> =0 ………………( 1 )

　　式中 :

　　Ceil(x) = [x] Ceil(x) = [x] …………………………( 2 )

　　x— 自变量 x。

　　式中 :

　　x— 自变量 x。

　　Clip1(x) = Clip3(0,2BitDepth-1,x) Clip1(x) = Clip3(0,2BitDepth-1,x) ( 3 )

　　GB/T 33475.2—2024

　　式中 :

　　x — 自变量 x;

　　BitDepth — 编码样本精度。

　　Clip3 Clip3

　　式中 :

　　x — 自变量 x;

　　i — 下界 ;

　　j — 上界。

　　Median(x,y,z) =x+y+z-Min(x,Min(y,z)) -Max(x,Max(y,z))

　　式中 :

　　x — 自变量 x;

　　y — 自变量 y;

　　z — 自变量 z。

　　Median(x,y,z) =x+y+z-Min(x,Min(y,z)) -Max(x,Max(y,z)) …………( 5 )

　　Min(x,y)= {y(x) ;; xy Min(x,y)= {y(x) ;; xy ………………( 6 )

　　式中 :

　　x — 自变量 x;

　　y — 自变量 y。

　　Max(x,y)= {y(x) ;; xy Max(x,y)= {y(x) ;; xy ………………( 7 )

　　式中 :

　　x — 自变量 x;

　　y — 自变量 y。

　　Sign(x) = {-11 ;; x0 Sign(x) = {-11 ;; x0 ………………( 8 )

　　式中 :

　　x— 自变量 x。

　　式中 :

　　x— 自变量 x。

　　式中 :

　　x — 自变量 x;

　　e — 自然对数的底 ,其值为 2. 718281 828… … 。

　　log(x) = log2x log(x) = log2x …………………………( 9 )

　　ln(x) = logex ln(x) = logex …………………………( 10 )

　　5. 8 结构关系符

　　结构关系符定义见表 6。

　　GB/T 33475.2—2024

　　表 6 结构关系符

　　结构关系符

　　定义

　　例如 :a->b表示 a是一个结构 ,b是 a 的一个成员变量

　　5.9 位流语法、解析过程和解码过程的描述方法5.9. 1 位流语法的描述方法

　　位流语法描述方法类似 C语言。位流的语法元素使用粗体字表示 , 每个语法元素通过名字(用下划线分割的英文字母组 ,所有字母都是小写) 、语法和语义来描述。语法表和正文中语法元素的值用常规字体表示。

　　某些情况下 ,可在语法表中应用从语法元素导出的其他变量值 ,这样的变量在语法表或正文中用不带下划线的小写字母和大写字母混合命名。大写字母开头的变量用于解码当前以及相关的语法结构 ,也可用于解码后续的语法结构。小写字母开头的变量只在它们所在的小节内使用。

　　语法元素值的助记符和变量值的助记符与它们的值之间的关系在正文中说明。在某些情况下 ,二者等同使用。助记符由一个或多个使用下划线分隔的字母组表示 ,每个字母组以大写字母开始 ,也可包括多个大写字母。

　　位串的长度是 4 的整数倍时 ,可使用十六进制符号表示。十六进制的前缀是“0x”,例如“0x1a”表示位串“0001 1010”。

　　条件语句中 0 表示 FALSE,非 0 表示 TRUE。

　　语法表描述了所有符合本文件的位流语法的超集 , 附加的语法限制在相关条中说明。

　　表 7 给出了描述语法的伪代码例子。当语法元素出现时 ,表示从位流中读一个数据单元。

　　表 7 语法描述的伪代码

　　伪代码

　　描述符

　　/*语句是一个语法元素的描述符 ,或者说明语法元素的存在、类型和数值 ,下面给出两个例子。 * /

　　syntax_element

　　ue(v)

　　conditioning statement

　　/* 花括号括起来的语句组是复合语句 ,在功能上视作单个语句。 * /

　　{

　　statement

　　…

　　}

　　/*“while”语句测试 condition是否为 TRUE, 如果为 TRUE, 则重复执行循环体 , 直到 condition不为TRUE。 * /

　　while ( condition)

　　statement

　　GB/T 33475.2—2024

　　表 7 语法描述的伪代码 (续)

　　伪代码

　　描述符

　　/*“do … while”语句先执行循环体一次 ,然后测试 condition是否为 TRUE,如果为 TRUE,则重复执行循环体 ,直到 condition不为 TRUE。 * /

　　statement

　　while ( condition)

　　/* “if … else”语句首先测试 condition,如果为 TRUE,则执行 primary语句 ,否则执行 alternative语句。如果 alternative语句不需要执行 ,结构的“else”部分和相关的 alternative语句可忽略。 * /

　　if( condition)

　　primary statement

　　else

　　alternative statement

　　/*“for”语句首先执行 initial语句 ,然后测试 condition,如果 conditon为 TRUE,则重复执行 primary语句和subsequent语句直到 condition不为 TRUE。 * /

　　for ( initialstatement; condition; subsequentstatement)

　　primary statement

　　解析过程和解码过程用文字和类似 C语言的伪代码描述。

　　5.9.2 函数

　　5.9.2. 1 概述

　　以下函数用于语法描述。假定解码器中存在一个位流指针 ,这个指针指向位流中要读取的下一个二进制位的位置。函数由函数名及左右圆括号内的参数构成。函数也可没有参数。

　　5.9.2.2 byte_aligned( )

　　如果位流的当前位置是字节对齐的 ,返回 TRUE,否则返回 FALSE。

　　5.9.2.3 next_bits(n)

　　返回位流的随后 n 个二进制位 , MSB在前 , 不改变位流指针。如果剩余的二进制位少于 n,则返回 0。

　　5.9.2.4 byte_aligned_next_bits(n)

　　如果位流当前位置不是字节对齐的 , 返回位流当前位置的下一个字节开始的 n 个二进制位 , MSB在前 ,不改变位流指针 ;如果位流当前位置是字节对齐的 ,返回位流随后的 n个二进制位 ,MSB在前 ,不改变位流指针。如果剩余的二进制位少于 n,则返回 0。

　　GB/T 33475.2—2024

　　5.9.2.5 next_start_code( )

　　在位流中寻找下一个起始码 ,将位流指针指向起始码前缀的第一个二进制位。函数定义见表 8。

　　表 8 next_start_code函数的定义

　　函数定义描述符

　　next_start_code( ) {

　　stuffing_bit 1

　　while ( ! byte_aligned( ) )

　　stuffing_bit 0

　　while ( next_bits(24) ! = '0000 0000 0000 0000 0000 0001' )

　　stuffing_byte 00000000

　　}

　　stuffing_byte应出现图像头之后和第一个条带起始码之前。

　　5.9.2.6 is_end_of_slice( )

　　在位流中检测是否已达到条带的结尾 , 如果已到达条带的结尾 , 返回 TRUE, 否则返回 FALSE。此函数不修改位流指针。函数定义见表 9。

　　表 9 is_end_of_slice函数的定义

　　函数定义

　　描述符

　　is_end_of_slice( ) {

　　if( byte_aligned ( ) ) {

　　if( next_bits(32) = = 0x80000001 )

　　return TRUE; //条带结束

　　}

　　else {

　　if( (byte_aligned_next_bits(24) = = 0x000001) && is_stuffing_pattern( ) )

　　return TRUE; //条带结束

　　}

　　return FALSE;

　　}

　　5.9.2.7 is_stuffing_pattern( )

　　在位流中检测当前字节中剩下的位或在字节对齐时下一个字节是否是条带结尾填充的二进制位 ,如果是 ,则返回 TRUE,否则返回 FALSE。此函数不修改位流指针。函数定义见表 10。

　　GB/T 33475.2—2024

　　表 10 is_stuffing_pattern函数的定义

　　函数定义

　　描述符

　　is_stuffing_pattern ( ) {

　　if( next_bits(8-n) = = ( 1<< (7-n) ) ) //n:0~ 7,为位流指针在当前字节的位置偏移 ,n为 0 时位流

　　指针指向当前字节最高位

　　return TRUE;

　　else

　　returnFALSE;

　　}

　　5.9.2. 8 read_bits( n )

　　返回位流的随后 n个二进制位 ,MSB在前 , 同时位流指针前移 n个二进制位。如果 n 等于 0,则返回 0,位流指针不前移。

　　函数也用于解析过程和解码过程的描述。

　　5.9.3 描述符

　　描述符表示不同语法元素的解析过程 ,见表 11。

　　表 11 描述符

　　描述符

　　说明

　　ae(v)

　　高级熵编码的语法元素。解析过程在 8. 3 中定义

　　b(8)

　　一个任意取值的字节。解析过程由函数 read_bits(8)的返回值规定

　　f(n)

　　取特定值的连续 n个二进制位。解析过程由函数 read_bits(n)的返回值规定

　　i(n)

　　n位整数。在语法表中 ,如果 n是“v”,其位数由其他语法元素值确定。解析过程由函数 read_ bits (n)的返回值规定 ,该返回值用高位在前的 2 的补码表示

　　r(n)

　　连续 n个 0。解析过程由函数 read_bits(n)的返回值规定

　　se(v)

　　有符号整数语法元素 ,用指数哥伦布码编码。解析过程在 8. 2 中定义

　　u(n)

　　n位无符号整数。在语法表中 , 如果 n 是 “v”, 其位数由其他语法元素值确定。解析过程由函数read_bits(n)的返回值规定 ,该返回值用高位在前的二进制表示

　　ue(v)

　　无符号整数语法元素 ,用指数哥伦布码编码。解析过程在 8. 2 中定义

　　5.9.4 保留、禁止和标记位

　　本文件定义的位流语法中 ,某些语法元素的值被标注为 “保留 ”(reserved)或 “禁止 ”(forbidden) 。

　　“保留 ”定义了一些特定语法元素值用于将来对本文件的扩展。这些值不应出现在符合本文件的位流中。

　　“禁止 ”定义了一些特定语法元素值 ,这些值不应出现在符合本文件的位流中。

　　“标记位 ”(marker_bit)指该位的值应为 1。

　　GB/T 33475.2—2024

　　位流中的 “保留位 ”(reserved_bits) 表明保留了一些语法单元用于将来对本文件的扩展 ,解码处理应忽略这些位。“保留位 ”不应出现从任意字节对齐位置开始的 21个以上连续的 0。

　　6 编码位流的结构

　　6. 1 视频序列

　　6. 1. 1 概述

　　视频序列是位流的最高层语法结构。视频序列由第一个序列头开始 ,序列结束码或视频编辑码表明了一个视频序列的结束。视频序列的第一个序列头到第一个出现的序列结束码或视频编辑码之间的序列头为重复序列头。每个序列头后面跟着一个或多个编码图像 ,每幅图像之前应有图像头。编码图像在位流中按位流顺序排列 ,位流顺序应与解码顺序相同。解码顺序可与显示顺序不相同。

　　6. 1.2 逐行和隔行视频序列

　　本文件支持两种序列 :逐行序列和隔行序列。

　　帧由三个样本矩阵构成 ,包括一个亮度样本矩阵(Y)和两个色度样本矩阵(Cb和 Cr) 。样本矩阵元素的值为整数。Y、Cb和 Cr三个分量与原始的(模拟) 红、绿和蓝色信号之间的关系 ,包括原始信号的色度和转移特性等可在位流中定义 ,这些信息不影响解码过程。

　　场由构成帧的三个样本矩阵中相间的行构成 , 即帧样本矩阵的第一行、第三行、第五行等奇数行构成一个场 ,称为顶场 ;第二行、第四行、第六行等偶数行构成另一个场 ,称为底场。

　　解码器的输出是一系列图像。两帧之间存在着一个帧时间间隔。对隔行序列而言 ,每帧的两场之间存在着一个场时间间隔。对逐行序列而言 ,每帧的两场之间时间间隔为 0。

　　6. 1.3 多视点视频序列

　　多视点视频序列的每个视点可包含深度信息 ,也可不包含深度信息。编码多视点视频序列时 ,按视点、纹理或深度、可伸缩编码层次等将多视点视频序列分成若干层 , 每层包含一个视点的纹理图像序列 ,或包含一个视点的深度图像序列。当采用可伸缩编码方式编码时 ,每层可包含一个视点的纹理图像序列的一个子集 ,或包含一个视点的深度图像序列的一个子集。

　　编码过程中 ,选择一个包含纹理图像的层作为基准层 ,其他层作为扩展层。扩展层可参考基准层或其他扩展层编码和解码 ,也可独立编码和解码。

　　符合本文件的包含多个层的位流应保证被参考的图像的编码数据出现在所有参考它的图像的编码数据之前。

　　多视点视频序列的编码位流在解码时使用统一的时钟信号同步各层的解码。各层的具有相同显示时间索引的图像应在同一时刻输出和显示。

　　6. 1.4 序列头

　　视频序列头由视频序列起始码开始 ,后面跟着一串编码图像数据。

　　序列头可在位流中重复出现 ,称为重复序列头。使用重复序列头的主要目的是支持对视频序列的随机访问。

　　序列头后的第一个解码图像应是 I 图像、G 图像或 GB 图像。如果序列头后的第一个解码图像是GB 图像 ,则该序列头后的第二个解码图像应是 S 图像。

　　当前图像对应的序列头为解码顺序在当前图像之前的最近的序列头。

　　如果当前图像对应的序列头后的第一个解码图像为 I 图像 ,并且当前图像的显示顺序在该 I 图像

　　GB/T 33475.2—2024

　　之后 ,则当前图像的参考图像应在以下范围内 :该 I图像、显示顺序在这个 I图像之后的图像 , 和解码顺序在当前图像对应的序列头之后的 G 图像或 GB 图像。

　　如果当前图像对应的序列头后的第一个解码图像为 G 图像 ,并且当前图像的显示顺序在该 G 图像之后 ,则当前图像的参考图像应在以下范围内 :G 图像、参考图像的显示顺序在该 G 图像之后的图像和解码顺序在当前图像对应的序列头之后的 G 图像或 GB 图像。

　　如果当前图像对应的序列头后的第一个解码图像为 GB 图像、第二个解码图像为 S 图像 ,并且当前图像的显示顺序在该 S 图像之后 , 则当前图像的参考图像应在以下范围内 : S 图像、显示顺序在这个S 图像之后的图像、解码顺序在当前图像对应的序列头之后的 G 图像或 GB 图像。

　　在对位流进行编辑或随机访问的情况下 ,重复序列头之前的全部数据可被丢弃 ,这样得到的一个新的位流仍应符合本文件。

　　6.2 图像

　　6.2. 1 概述

　　当位流中不存在扩展层时 ,一幅图像可是一帧或一场 ,其编码数据由图像起始码开始 , 到序列起始码、序列结束码或下一个图像起始码结束。

　　当位流中存在扩展层时 ,一幅图像可是纹理信息的一帧或一场 ,或一幅深度图像 ,或一帧、一场、一幅深度图像的部分编码数据(采用可伸缩编码时) 。

　　在位流中 , 隔行扫描图像的两场的编码数据可依次出现 ,也可交融出现。两场数据的解码和显示顺序在图像头中规定。

　　图像的解码处理包括解析过程和解码过程。

　　6.2.2 图像格式

　　6.2.2. 1 4 ∶ 0 ∶ 0 格式

　　对于 4 ∶ 0 ∶ 0格式 ,只包括 Y矩阵。

　　亮度或深度样本位置见图 1。

　　图 1 4 ∶ 0 ∶ 0 格式下亮度样本位置

　　6.2.2.2 4 ∶ 2 ∶ 0 格式

　　对于 4 ∶ 2 ∶ 0格式 ,Cb和 Cr矩阵水平和垂直方向的尺寸都只有 Y矩阵的一半。Y矩阵的行数和每行样本数都应是偶数。另外 ,如果图像两场的编码数据依次出现 ,则 Y矩阵的行数还应能被 4整除。

　　亮度和色度样本位置见图 2。

　　GB/T 33475.2—2024

　　图 2 4 ∶ 2 ∶ 0 格式下亮度和色度样本位置

　　6.2.2.3 4 ∶ 2 ∶ 2 格式

　　对于 4 ∶ 2 ∶ 2 格式 ,Cb和 Cr矩阵在水平方向的尺寸只有 Y 矩阵的一半 ,在垂直方向的尺寸和 Y相同。Y矩阵的每行样本数应是偶数。如果图像两场的编码数据依次出现 , 则 Y 矩阵的行数也应是偶数。

　　亮度和色度样本位置见图 3。

　　图 3 4 ∶ 2 ∶ 2 格式下亮度和色度样本位置

　　6.2.2.4 4 ∶ 4 ∶ 4 格式

　　对于 4 ∶ 4 ∶ 4格式 ,Cb和 Cr矩阵在水平和垂直方向的尺寸都和 Y矩阵一样。如果图像两场的编码数据依次出现 ,则 Y矩阵的行数应是偶数。

　　亮度和色度样本位置见图 4。

　　GB/T 33475.2—2024

　　图 4 4 ∶ 4 ∶ 4 格式下亮度和色度样本位置

　　6.2.3 图像类型

　　本文件定义了七种解码图像。

　　a) I图像 ;

　　b) P 图像 ;

　　c) B 图像 ;

　　d) F 图像 ;

　　e) G 图像 ;

　　f) GB 图像 ;

　　g) S 图像。

　　6.2.4 图像间的顺序

　　如果视频序列中没有 B 图像 ,解码顺序与显示顺序相同。如果视频序列中包含 B 图像 ,解码顺序与显示顺序不同 ,解码图像输出显示前应进行图像重排序。

　　序列头后的第一个解码图像应是 I 图像、G 图像或 GB 图像。如果序列头后的第一个解码图像是GB 图像 ,则该序列头后的第二个解码图像应是 S 图像。码流中显示顺序在该 I图像、G 图像或 S 图像之后的图像的解码顺序应在该 I图像、G 图像或者 S 图像之后。

　　下面举例说明图像重排序。

　　示例 1: I图像和 P 图像之间有 3个 B 图像 ,两个连续的 P 图像之间也有 3个 B 图像。按照解码顺序用图像 0I预测图像 4P,用图像 4P和 0I预测图像 2B, 用图像 2B和 0I预测图像 1B,用图像 4P 和 2B预测图像 3B。解码顺序是 0I,4P,2B,1B,3B;显示顺序是 0I,1B,2B,3B,4P。

　　按照解码顺序排序 :

　　解码顺序 0 1 2 3 4 5 6 7 8 9 10 11 12

　　类型 I P B B B P B B B P B B B

　　显示顺序

　　0 4 2 1 3

　　8 6 5 7

　　12 10

　　9 11

　　按照显示顺序排序 :

　　显示顺序类型

　　解码顺序

　　0 1 2 3 4

　　I B B B P

　　0 3 2 4 1

　　5 6 7 8

　　B B B P

　　7 6 8 5

　　9 10

　　B B

　　11 10

　　11 12

　　B P

　　12 9

　　示例 2: I图像和 P 图像之间有 7个 B 图像 ,两个连续的 P 图像之间也有 7个 B 图像。按照解码顺序用图像 0I预测图像 8P,用图像 8P和 0I预测图像 4B, 用图像 4B和 0I预测图像 2B,用图像 2B和 0I预测图像 1B, 用图像4B和 2B预测图像 3B,用图像 8P和 4B预测图像 6B,用图像 6B和 4B预测图像 5B, 用图像 8P和 6B预测图像 7B。解码顺序是 0I,8P,4B,2B, 1B,3B,6B, 5B, 7B;显示顺序是 0I,1B,2B,3B,4B,5B,6B,7B,8P。

　　GB/T 33475.2—2024

　　按照解码顺序排序 :

　　解码顺序

　　类型

　　显示顺序

　　按照显示顺序排序 :

　　显示顺序

　　类型

　　解码顺序

　　示例 3: I图像和 P 图像之间有 2个 B 图像 ,两个连续的 P 图像之间也有 2个 B 图像。按照解码顺序用图像 0I预测

　　图像 3P,用图像 3P和 0I预测图像 1B和 2B。解码顺序是 0I,3P,1B,2B;显示顺序是 0I,1B,2B,3P。

　　按照解码顺序排序 :

　　解码顺序 0 1 2 3 4 5 6 7 8 9 10 11 12

　　类型 I P B B P B B I B B P B B

　　显示顺序 0 3 1 2 6 4 5 9 7 8 12 10 11

　　按照显示顺序排序 :

　　显示顺序 0 1 2 3 4 5 6 7 8 9 10 11 12

　　类型 I B B P B B I B B P B B P

　　解码顺序 0 2 3 1 5 6 4 8 9 7 11 12 10

　　6.2.5 参考图像

　　P 图像可有显示顺序上位于当前图像之前的多幅参考图像 ,这些参考图像称为前向参考图像 ;也可有 1 幅和当前图像属于同时刻图像组的参考图像 ,称为视间参考图像。F 图像可有显示顺序上位于当前图像之前的多幅参考图像 ,这些参考图像称为前向参考图像 ;也可有 1 幅和当前图像属于同时刻图像组的参考图像 ,称为视间参考图像。B 图像有 1 幅显示顺序位于当前图像之前的参考图像和 1 幅显示顺序位于当前图像之后的参考图像 ,这 2 幅参考图像分别称为前向参考图像和后向参考图像 ;也可有 1幅图像和当前图像术语同时刻图像组的参考图像 ,称为视间参考图像。 S 图像可有显示顺序位于当前图像之前的 1 幅参考图像 ,该参考图像为最近解码的 G 图像或 GB 图像。

　　运动矢量所指的参考像素可超出参考图像的边界 ,在这种情况下对超出参考图像边界的整数样本应使用距离该整数参考样本所指位置最近的图像内的整数样本进行边界扩展。对亮度样本矩阵 ,参考块的像素在水平和垂直方向均不应超出参考图像边界外 64个像素。对色度样本矩阵 :

　　如果图像格式是 4 ∶ 2 ∶ 0, 参考块的像素在水平和垂直方向均不应超出参考图像边界外 32个像素。

　　场边界扩展方法和参

GB/T 33475.4-2024 信息技术高效多媒体编码第4部分：符合性测试

下一篇: GB/T 33423-2024 沿海及海上风电机组腐蚀控制技术规范

GB/T 33475.2-2024 信息技术高效多媒体编码第2部分：视频

资料介绍

相关推荐

本栏热门下载

GB/T 33475.2-2024 信息技术 高效多媒体编码 第2部分：视频

资料介绍

相关推荐

本栏热门下载

GB/T 33475.2-2024 信息技术高效多媒体编码第2部分：视频