GB/T 46271-2025 信息技术 三维声技术 编码、分发与呈现
- 名 称:GB/T 46271-2025 信息技术 三维声技术 编码、分发与呈现 - 下载地址2
- 下载地址:[下载地址2]
- 提 取 码:
- 浏览次数:3
发表评论
加入收藏夹
错误报告
目录| 新闻评论(共有 0 条评论) |
资料介绍
ICS 35. 040 CCS L 71
中 华 人 民 共 和 国 国 家 标 准
GB/T 46271—2025
信息技术 三维声技术 编码、
分发与呈现
Information technology—3D audio technology—Coding, distribution and
presentation
2025-08-29发布 2026-03-01实施
国家市场监督管理总局国家标准化管理委员会
发
布
GB/T 46271—2025
目 次
前言 Ⅴ
引言 Ⅵ
1 范围 1
2 规范性引用文件 1
3 术语和定义 1
4 缩略语 2
5 约定 3
5. 1 算术运算符 3
5. 2 逻辑运算符 3
5. 3 关系运算符 4
5. 4 位运算符 4
5. 5 赋值运算符 4
5. 6 助记符 5
5. 7 数学函数 5
5. 8 位流语法规则 5
6 三维声编解码及渲染框架 7
7 通用全码率音频解码 9
7. 1 概述 9
7. 2 位流解复用语法语义及解码过程 15
7. 3 区间解码 、逆量化和神经网络逆变换语法语义及解码过程 20
7. 4 频谱逆分组处理语法语义及解码过程 24
7. 5 双声道立体声比特分配和上混语法语义及解码过程 25
7. 6 多声道比特分配和上混语法语义及解码过程 30
7. 7 HOA 比特分配和上混 32
7. 8 解码后处理语法语义及解码过程 36
7. 9 频带扩展解码语法语义及解码过程 37
7. 10 逆时域噪声整形语法语义及解码过程 45
7. 11 逆频域噪声整形语法语义及解码过程 47
7. 12 逆 MDCT解码过程 49
7. 13 HOA 空间解码 50
8 无损音频解码 55
9 元数据解码 55
9. 1 元数据位流语法语义 55
Ⅰ
GB/T 46271—2025
9. 2 静态元数据解码语法语义 56
9. 3 动态元数据解码语法语义 57
9. 4 基本静态元数据解码语法语义 58
9. 5 基本静态元数据节目层解码语法语义 59
9. 6 基本静态元数据内容层解码语法语义 60
9. 7 基本静态元数据对象层解码语法语义 62
9. 8 基本静态元数据对话字段解码语法语义 64
9. 9 基本静态元数据封装层解码语法语义 64
9. 10 基本静态元数据通道层解码语法语义 67
9. 11 基本静态元数据对象互动字段解码语法语义 68
9. 12 基本静态元数据扬声器位置解码语法语义 70
9. 13 基本静态元数据响度字段解码语法语义 70
9. 14 基本静态元数据节目参考屏幕字段解码语法语义 72
9. 15 动态元数据 Level1解码语法语义 73
9. 16 动态元数据 Level2解码语法语义 75
9. 17 扩展静态元数据 Level1解码语法语义 76
9. 18 扩展静态元数据声学环境元数据解码语法语义 77
9. 19 扩展静态元数据同种材质墙面元数据解码语法语义 78
9. 20 扩展静态元数据统一几何材质表面组成的三角形顶点解码语法语义 80
9. 21 扩展静态元数据渲染信息解码语法语义 80
9. 22 扩展静态元数据后期效果处理解码语法语义 81
9. 23 扩展静态元数据均衡效果解码语法语义 82
9. 24 解码过程 83
附录 A (规范性) 三维声编码位流语法语义 87
A. 1 语法 87
A. 2 语义 92
附录 B (规范性) 音频码表 98
附录 C (资料性) 三维声渲染 292
C. 1 概述 292
C. 2 元数据限定 292
C. 3 渲染器 1 292
C. 4 渲染器 2 292
C. 5 渲染器 3 292
附录 D (资料性) 通用全码率音频编码 304
D. 1 概述 304
D. 2 编码预处理 309
D. 3 下混 316
Ⅱ
GB/T 46271—2025
D. 4 神经网络变换 、量化和区间编码 321
D. 5 HOA 空间编码 328
D. 6 编码神经网络参数表 329
附录 E (资料性) 本文件元数据与 GY/T 404—2024中元数据的对应关系 366
参考文献 371
Ⅲ
GB/T 46271—2025
前 言
本文件按照 GB/T 1. 1—2020《标准化工作导则 第 1部分 :标准化文件的结构和起草规则》的规定起草 。
本文件由全国信息技术标准化技术委员会(SAC/TC28)提出 。
本文件由全国信息技术标准化技术委员会(SAC/TC 28) 和全国广播电视和网络视听标准化技术委员会(SAC/TC239)归 口 。
本文件起草单位 : 中国电子技术标准化研究院 、中央广播电视总台 、国家广播电视总局广播电视规划院 、国家广播电视总局广播电视科学研究院 、华为技术有限公司 、清华大学 、北京字跳网络技术有限公司 、赛因芯微(北京)电子科技有限公司 、北京理工大学 、北京大学 、咪咕文化科技有限公司 、中国移动通信集团有限公司 、中国联合网络通信集团有限公司 、中国电信集团有限公司 、腾讯科技(深圳)有限公司 、华为终端技术有限公司 、中移(杭州)信息技术有限公司 、天翼数字生活科技有限公司 、联通在线信息科技有限公司 、北京歌华有线网络有限公司 、东方有线电视网络有限公司 、爱上电视传媒(北京)有限公司 、中关村视听产业技术创新联盟 、世界超高清视频产业联盟 。
本文件主要起草人 :范科 峰 、孙 齐 锋 、姜 文 波 、陈 晨 、宁 金 辉 、张 建 东 、周 芸 、郭 晓 强 、王 喆 、窦 维 蓓 、柳德荣 、吴健 、王晶 、曲天书 、韩建 、刘先达 、王亚徽 、贾立鼎 、李大龙 、罗红 、魏嘉 、吕超 、甄林 、董原 、吴坚 、潘红梅 、张伟民 、张文刚 、李婧欣 、焦健波 、汪芮 、胡潇 、朱梦尧 。
Ⅴ
GB/T 46271—2025
引 言
本文件的发布机构提请注意 ,声明符合本文件时 ,可能涉及 7. 3、7. 4、7. 5、7. 6、7. 7、7. 9、7. 10、7. 13 中与音频编解码技术相关的专利的使用 。
本文件的发布机构对于该专利的真实性 、有效性和范围无任何立场 。
该专利持有人已向本 文 件 的 发 布 机 构 承 诺 , 他 愿 意 同 任 何 申 请 人 在 合 理 且 无 歧 视 的 条 款 和 条 件下 ,就专利授权许可进行谈判 。该专利持有人的声明已在本文件的发布机构备案 ,相关信息可通过以下联系方式获得 :
专利持有人 :华为技术有限公司 ;
地址:广东省深圳市龙岗区坂田华为基地 A。
请注意除上述专利外 ,本文件的某些内容仍可能涉及专利 。本文件的发布机构不承担识别专利的责任 。
Ⅵ
GB/T 46271—2025
信息技术 三维声技术 编码、
分发与呈现
1 范围
本文件描述了三维声音频的编码 、分发与呈现的方法 ,兼容单声道 、双声道立体声 、多声道环绕声等声音格式 。
本文件适用于广播电视 、广播流媒体 、网络视听 、实时通信 、虚拟现实和增强现实 、数字存储媒体等领域的三维声音频编码 、分发与呈现 。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款 。其中 , 注 日期的引用文件 ,仅该日期对应的版本适用于本文件 ;不注日期的引用文件 ,其最新版本(包括所有的修改单) 适用于本文件 。
GB/T 17191(所有部分) 信息技术 具有 1. 5 Mbit/s数据传输率的数字存储媒体运动图像及其伴音的编码
GB/T 33475. 3—2018 信息技术 高效多媒体编码 第 3部分 :音频
GB/T 44115. 3—2025 信息技术 虚拟现实内容表达 第 3部分 :音频
GY/T 262—2012 节目响度和真峰值音频电平测量算法
GY/T 316—2018 用于节目制作的先进声音系统
GY/T 404—2024 音频定义模型
ITU-R BS. 2094: 2025 音 频 定 义 模 型 通 用 定 义 (Common definitions for the audio definition model)
ETSITS126445V18. 1. 0 通用移动通信系统(UMTS) ;LTE;5G;增强语音服务(EVS)编解码器[UniversalMobileTelecommunicationsSystem (UMTS) ; LTE; 5G; CodecforEnhanced VoiceServ- ices(EVS)]
3 术语和定义
GB/T 33475. 3—2018界定的以及下列术语和定义适用于本文件 。
3. 1
编码位流 coded bitstream
音频信号的编码表示 。
3.2
对象 object
三维声信号中 ,被感知为一个整体的声音或由一个声源发出的独立于环境的声音 。
3.3
双声道立体声 stereo audio
一种音频格式 ,使用两个声道承载有一定相位关系或者幅度关系或者相位和幅度混合关系的音频
1
GB/T 46271—2025
信号 。
注 : 通常通过位于听音者前方的两个对称设置的扬声器重放 ,带给听音者更宽的声场感觉 。
3.4
环绕声 surround audio
一种音频格式 ,使用多个声道承载构成完整音频内容的多路音频信号 。
注 : 通过位于听音者耳部高度层的环绕听音者的多个扬声器重放 ,给听音者带来被环绕的声场感觉 。 3.5
三维声 3D audio
一种音频格式 ,使用多个声道承载构成完整音频内容的多路音频信号 。
注 : 通过环绕听音者的位于不同高度层的多个扬声器直接重放 ,或经过渲染后模拟三维声体验的重放 ,提供更高的声像空间解析度 ,并给听音者带来沉浸式的声场感觉 。
3.6
元数据 metadata
描述音频数据相关信息的数据 。
3.7
渲染 rendering
将给定的音频格式转换为适用于终端扬声器/耳机配置的 、可直接重放的音频格式的过程 。 3. 8
扬声器渲染 speakerrendering
将音频格式转换为特定配置的扬声器重放信号的过程 。
3.9
双耳渲染 binauralrendering
将音频信号转换为通过耳机进行双耳重放信号的过程 。
4 缩略语
下列缩略语适用于本文件 。
AASF:AVS音频存储格式(AVS Audio Storage Format)
AATF:AVS音频传输格式(AVS Audio TransportFormat)
ADM :音频定义模型(Audio Definition Model)
AVS:数字音视频编解码技术标准(Audio Video coding Standard)
BWE:带宽扩展(Bandwidth Extension)
CDF: 累积概率密度函数(Cumulative-probabilityDensity Function)
CNN:卷积神经网络(ConvolutionalNeuralNetwork)
CRC:循环冗余校验(Cylic Redundancy Check)
DRC:动态范围控制(Dynamic Range Control)
EQ:均衡器(Equalizer)
FFT:快速傅里叶变换(FastFourier Transform)
FOA:一阶立体声场信号(FirstOrder Ambisonics)
HOA:高阶立体声场信号(Higher Order Ambisonics)
ILD:声道间强度差(Inter-channel LevelDifference)
LFE:低频效果音(Low Frequence Effect)
LPC:线性预测系数(LinearPrediction Coefficients)
2
GB/T 46271—2025
LSF:线谱频率(Line SpectralFrequencies)
LSP:线谱对(Line SpectralPairs)
MCAC:多通道自适应组对(MultiChannelAdaptive Coupling)
MCR:极大相关旋转(Maximum Correlation Rotation)
MDCT:修正离散余弦变换(Modified Discrete Cosine Transform)
M/S:和差立体声(Middle/Side)
PAR:峰平比(Peak-to-Average Ratio)
SFB:尺度因子带(Scale FactorBand)
SFM :谱平坦度测量(SpectralFlatness Measure)
TNS: 时域噪声整形(TemporalNoise Shaping)
VBAP:基于矢量的幅度平移(Vector-based Amplitude Panning)
VQ:矢量量化(Vector Quantization)
相关推荐
- GB/T 38472-2023 正式版 再生铸造铝合金原料
- GB/T 15856.1-2002 十字槽盘头自钻自攻螺钉
- GB/T 12223-2023 部分回转阀门驱动装置的连接
- GB∕T 12719-2021 矿区水文地质工程地质勘查规范
- GB∕T 41114-2021 无损检测 超声检测 相控阵超声检测标准试块规范
- GB/T 24067-2024 温室气体 产品碳足迹 量化要求和指南
- GB∕T 18998.2-2022 工业用氯化聚氯乙烯(PVC-C)管道系统 第2部分:管材
- GB∕T 40389-2021 烧结金属材料(不包括硬质合金) 表面粗糙度的测定
- GB/T 5621-2008 凿岩机械与气动工具 性能试验方法
- GB/T 28807.3-2017 轨道交通 机车车辆和列车检测系统的兼容性 第3部分:与计轴器的兼容性

