位置: 编程技术 - 正文

音频基础知识及编码原理(音频基础知识及训练)

编辑:rootadmin

推荐整理分享音频基础知识及编码原理(音频基础知识及训练),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:音频视频基础知识,音频知识点,音频视频基础知识,音频基本知识,音频知识点,音频基础知识及训练,音频基础知识讲解,音频基础知识讲解,内容如对您有帮助,希望把文章链接给更多的朋友!

原文出处: 比特率:表示经过编码(压缩)后的音频数据每秒钟需要用多少个比特来表示,单位常为kbps。

2 响度和强度:声音的主观属性响度表示的是一个声音听来有多响的程度。响度主要随声音的强度而变化,但也受频率的影响。总的说,中频纯音听来比低频和高频纯音响一些。

3 采样和采样率:采样是把连续的时间信号,变成离散的数字信号。采样率是指每秒钟采集多少个样本。

Nyquist采样定律:采样率大于或等于连续信号最高频率分量的2倍时,采样信号可以用来完美重构原始连续信号。

二、常见音频&#;式

1. WAV&#;式,是微软公司开发的一种声音文件&#;式,也叫波形声音文件,是最早的数字音频&#;式,被Windows平台及其应用程序广泛支持,压缩率低。

2. MIDI是Musical Instrument Digital Interface的缩写,又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。它定义了计算机音乐程序、数字合成器及其它电子设备交换音乐信号的方式,规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可以模拟多种乐器的声音。MIDI文件就是MIDI&#;式的文件,在MIDI文件中存储的是一些指令。把这些指令发送给声卡,由声卡按照指令将声音合成出来。

3. MP3全称是MPEG-1 Audio Layer 3,它在年合并至MPEG规范中。MP3能够以高音质、低采样率对数字音频文件进行压缩。应用最普遍。

4. MP3Pro是由瑞典Coding科技公司开发的,其中包含了两大技术:一是来自于Coding科技公司所特有的解码技术,二是由MP3的专利持有者法国汤姆森多媒体公司和德国Fraunhofer集成电路协会共同研究的一项译码技术。MP3Pro可以在基本不改变文件大小的情况下改善原先的MP3音乐音质。它能够在用较低的比特率压缩音频文件的情况下,最大程度地保持压缩前的音质。

5. MP3Pro是由瑞典Coding科技公司开发的,其中包含了两大技术:一是来自于Coding科技公司所特有的解码技术,二是由MP3的专利持有者法国汤姆森多媒体公司和德国Fraunhofer集成电路协会共同研究的一项译码技术。MP3Pro可以在基本不改变文件大小的情况下改善原先的MP3音乐音质。它能够在用较低的比特率压缩音频文件的情况下,最大程度地保持压缩前的音质。

6. WMA (Windows Media Audio)是微软在互联网音频、视频领域的力作。WMA&#;式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:。此外,WMA还可以通过DRM(Digital Rights Management)保护版权。

7. RealAudio是由Real Networks公司推出的一种文件&#;式,最大的特点就是可以实时传输音频信息,尤其是在网速较慢的情况下,仍然可以较为流畅地传送数据,因此RealAudio主要适用于网络上的在线播放。现在的RealAudio文件&#;式主要有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured)等三种,这些文件的共同性在于随着网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较宽敞的听众获得较好的音质。

8. Audible拥有四种不同的&#;式:Audible1、2、3、4。Audible.com网站主要是在互联网上贩卖有声书籍,并对它们所销售商品、文件通过四种Audible.com 专用音频&#;式中的一种提供保护。每一种&#;式主要考虑音频源以及所使用的收听的设备。&#;式1、2和 3采用不同级别的语音压缩,而&#;式4采用更低的采样率和MP3相同的解码方式,所得到语音吐辞更清楚,而且可以更有效地从网上进行下载。Audible 所采用的是他们自己的桌面播放工具,这就是Audible Manager,使用这种播放器就可以播放存放在PC或者是传输到便携式播放器上的Audible&#;式文件

9.AAC实际上是高级音频编码的缩写。AAC是由Fraunhofer IIS-A、杜比和AT&T共同开发的一种音频&#;式,它是MPEG-2规范的一部分。AAC所采用的运算法则与MP3的运算法则有所不同,AAC通过结合其他的功能 来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。它还同时支持多达个音轨、个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC可以在比MP3文件缩小%的前提下提供更好的音质。

. Ogg Vorbis 是一种新的音频压缩&#;式,类&#;于MP3等现有的音乐&#;式。但有一点不同 的是,它是完全免费 、开放和没有专利限制的。Vorbis 是这种音频压缩机制的名字,而Ogg则是一个计划的名字,该计划 意图设计 一个完全开放性的多媒体系统。VORBIS也是有损压缩,但通过使用更加先进的声学模型去减少损失,因此,同样位速率(Bit Rate)编码的OGG与MP3相比听起来更好一些。

. APE是一种无损压缩音频&#;式,在音质不降低的前提下,大小压缩到传统无损&#;式 WAV 文件的一半.

.FLAC即是Free Lossless Audio Codec的缩写,是一套著名的自由音频无损压缩编码,其特点是无损压缩。

三、音频编码基本原理

语音编码致力于:降低传输所需要的信道带宽,同时保持输入语音的高质量。

语音编码的目标在于:设计低复杂度的编码器以尽可能低的比特率实现高品质数据传输。

1 静音阈&#;曲线:只在安静环境下,人耳在各个频率能听到声音的阈&#;。

2 临界频带

由于人耳对不同频率的解析度不同,MPEG1/Audio将khz内可感知的频率范围,依不同编码层,不同取样频率,划分成~个临界频带。下图列出理想临界频带的中心频率与频宽。图中可看到,人耳对低频的解析度较好。

图5

3 频域上的掩蔽效应:幅&#;较大的信号会掩蔽频率相近的幅&#;较小的信号,如下图:

4 时域上的遮蔽效应:在一个很短的时间内,若出现了2个声音,SPL(sound pressure level)较大的声音会掩蔽SPL较小的声音。时域掩蔽效应分前向掩蔽(pre-masking)和后向掩蔽(post-masking),其中post-masking的时间会比较长,约是pre-masking的倍。

音频基础知识及编码原理(音频基础知识及训练)

时域遮蔽效应有助于消除前回音。

四、编码基本手段

1 量化和量化器

量化和量化器:量化是把离散时间上的连续信号,转化成离散时间上的离散信号。常见的量化器有:均匀量化器,对数量化器,非均匀量化器。量化过程追求的目标是:最小化量化误差,并尽量减低量化器的复杂度(这2者本身就是一个矛盾)。

(a)均匀量化器:最简单,性能最差,仅适应于电话语音。

(b)对数量化器:比均匀量化器复杂,也容易实现,性能比均匀量化器好。

(c)Non-uniform量化器:根据信号的分布情况,来设计量化器。信号密集的地方进行细致的量化,稀疏的地方进行粗略量化。

2 语音编码器

语音编码器分为三种类形:(a)波形编器 ;(b)声码器 ;(c)混合编码器 。

波形编码器以构造出背景噪单在内的模拟波形为目标。作用于所有输入信号,因此会产生高质量的样&#;并且耗费较高的比特率。 而声码器 (vocoder)不会再生原始波形。这组编码器 会提取一组参数 ,这组参数被送到接收端,用来导出语音产生模形。声码器语音质量不够好。混合编码器,它融入了波形编码器和声器的长处。

2.1 波形编码器

波形编码器的设计常独立于信号。所以适应于各种信号的编码而不限于语音。

1 时域编码

a)PCM:pulse code modulation,是最简单的编码方式。仅仅是对信号的离散和量化,常采用对数量化。

b)DPCM:differential pulse code modulation,差分脉冲编码,只对样本之间的差异进行编码。前一个或多个样本用来预测当前样本&#;。用来做预测的样本越多,预测&#;越精确。真实&#;和预测&#;之间的差&#;叫残差,是编码的对象。

c)ADPCM:adaptive differential pulse code modulation,自适应差分脉冲编码。即在DPCM的基础上,根据信号的变化,适当调整量化器和预测器,使预测&#;更接近真实信号,残差更小,压缩效率更高。

(2)频域编码

频域编码是把信号分解成一系列不同频率的元素,并进行独立编码。

a)sub-band coding:子带编码是最简单的频域编码技术。是将原始信号由时间域转变为频率域,然后将其分割为若干个子频带,并对其分别进行数字编码的技术。它是利用带通滤波器(BPF)组把原始信号分割为若干(例如m个)子频带(简称子带)。将各子带通过等效于单边带调幅的调制特性,将各子带搬移到零频率附近,分别经过BPF(共m个)之后,再以规定的速率(奈奎斯特速率)对各子带输出信号进行取样,并对取样数&#;进行通常的数字编码,其设置m路数字编码器。将各路数字编码信号送到多路复用器,最后输出子带编码数据流。

对不同的子带可以根据人耳感知模型,采用不同量化方式以及对子带分配不同的比特数。

b)transform coding:DCT编码。

6 声码器

channel vocoder:利用人耳对相位的不敏感。

homomorphic vocoder:能有效地处理合成信号。

formant vocoder:以用语音信号的绝大部分信息都位于共振峰的位置与带宽上。

linear predictive vocoder:最常用的声码器。

7 混合编码器

波形编码器试图保留被编码信号的波形,能以中等比特率(kbps)提供高品质语音,但无法应用在低比特率场合。声码器试图产生在听觉上与被编码信号相&#;的信号,能以低比特率提供可以理解的语音,但是所形成的语音听起来不自然。混合编码器结合了2者的优点。

RELP:在线性预测的基础上,对残差进行编码。机制为:只传输小部分残差,在接受端重构全部残差(把基带的残差进行拷贝)。

MPC:multi-pulse coding,对残差去除相关性,用于弥补声码器将声音简单分为voiced和unvoiced,而没有中间状态的缺陷。

CELP:codebook excited linear prediction,用声道预测其和基音预测器的级联,更好&#;近原始信号。

MBE:multiband excitation,多带激励,目的是避免CELP的大量运算,获得比声码器更高的质量。

Android基础知识_Activity标准启动模式示例 一、示例工程LaunchMode代码activity_main.xml代码如下:LinearLayoutxmlns:android=

Android-SQLite商业化数据库操作 Android-SQLite商业化数据库操作一具体的数据操作增/***插入用户实例*@parampUser*@return*/publiclonginsertUser(UserpUser){if(mSqLiteDatabase!=nullpUser!=null){//插入一条记录Co

Android 之 XML文件 初窥 使用XML作为GUI的定义格式1.文本及文本样式?xmlversion="1.0"encoding="utf-8"?resourcesstringname="app_name"Demo/stringstringname="action_settings"Settings/stringstringname="hello_world"He

标签: 音频基础知识及训练

本文链接地址:https://www.jiuchutong.com/biancheng/382188.html 转载请保留说明!

上一篇:Android基础知识_Activity启动模式(android基础知识总结)

下一篇:Android基础知识_Activity标准启动模式示例(android基础知识大全)

  • 税金及附加要计入本年利润吗
  • 累计预扣法计算公式
  • 牵引车和挂车都要购买交强险吗
  • 房地产开发公司排名
  • 开立一般户需要基本户开户行许可证吗
  • 企业职工遣散费标准
  • 税务机关如何防范关联企业涉税风险问题
  • 接受捐赠的固定资产进项税额可以抵扣吗
  • 支付给对方的押金
  • 农业企业发包给人种植要交纳个税吗?
  • 公司拆迁安置所得的补偿款税务怎么处理
  • 航天金税财务软件使用说明
  • 公司出租房屋交印花税吗
  • 民办学校都没有编制吗
  • 装饰工程收入属于劳务收入吗
  • 没有签订劳动合同员工离职怎么处理
  • 购进的样品入账科目
  • 管理费用怎么记忆
  • 有质量问题的产品案例
  • 现金清偿债务怎么算
  • iphone7如何设置输入法
  • 纯净版xp系统打不开了
  • 输入字母和数字 小学信息技术课
  • PHP:Memcached::setOptions()的用法_Memcached类
  • PHP:oci_bind_array_by_name()的用法_Oracle函数
  • 金融行业如何征收营业税
  • 新车事故报废后保险公司赔多少
  • PHP:imagecreatefromstring()的用法_GD库图像处理函数
  • 圆顶山遗址
  • 史上最贵的微博
  • php正则表达式实例
  • 企业产房屋拆迁
  • php 动态执行代码
  • nvme安装win10教程
  • json与对象的区别
  • utermux命令
  • 小微企业免征增值税优惠
  • 企业有外币账户怎样做账
  • 贴现资产卖断会怎么样
  • 实收资本的会计处理
  • springsecurity有什么用
  • 织梦前台的菜单怎么换
  • 生产车间发生的费用计入什么科目
  • 应交增值税的计算要加已交税金还是扣除
  • 企业的其他应付款怎么处理
  • 代收代付保险费分录
  • Ubuntu上安装jdk
  • mysql连接数据库的基本步骤是什么
  • 房地产企业购买礼品赠送客户
  • 如何分析成本费用高
  • 私车公用费用报销
  • 金税盘未响应什么意思
  • 上年的应收帐款怎么记账
  • 贷款的拨备覆盖率
  • 新建厂房需要缴纳什么税
  • 行政转工会经费请示
  • 持有至到期投资是债权投资吗
  • 小规模购入固定资产怎么做账
  • 带折扣的发票如何开具
  • 电脑开机显示xp后无反应
  • win10系统小娜不见了
  • win1021h2版本千万别更新
  • win7 64位旗舰版电脑被唤醒之后显示器依然黑屏怎么办?
  • win7系统通过wmic命令
  • win8的开始菜单在哪里
  • c#多线程应用
  • linuxyum安装php7
  • JavaScript不支持ie
  • Android startActivities()的使用
  • android应用开发基础
  • 前端js优化
  • python itcast
  • node的express
  • 怎样学好js中的逻辑
  • 河南医疗保险网上怎么缴费截止时间
  • 公司地址变更后社保要改吗
  • 深圳如何打印个人征信
  • 曲靖市国家税务局杨春天
  • 主管局长和分管局长谈心谈话
  • 江苏电子税务局电话
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设