版权说明 操作指南
首页 > 成果 > 详情

基于高斯混合模型的感知域音频编码方法

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
吕亚平;高戈;陈怡;张康
作者机构:
[吕亚平; 高戈; 张康] 武汉大学计算机学院
[陈怡] 华中师范大学计算机学院
语种:
中文
关键词:
人耳听觉系统;感知域音频编码;高斯混合模型;Gammatone滤波器组;高斯-牛顿算法
关键词(英文):
perceptual domain audio coding;Gaussian Mixture Model(GMM);Gammatone filter bank;Gauss-Newton algorithm
期刊:
计算机工程
ISSN:
1000-3428
年:
2015
卷:
41
期:
10
页码:
265-269
基金类别:
国家自然科学基金资助项目(614712710);
机构署名:
本校为其他机构
院系归属:
计算机学院
摘要:
传统感知音频编码方案采用心理声学掩蔽降低编码码率,其声道模型+信号激励的方式难以同时实现高质量的中低码率语音和音频信号编码。为此,提出一种基于高斯混合模型的感知域音频编码方法,利用Gammatone滤波器组模拟人耳听觉系统,采用多路复用掩蔽模型替换降低包络脉冲的数量,对结构化模型进行拟合,使用高斯-牛顿算法对听觉包络进行高斯混合模型参数的拟合,将高斯混合模型参数替代音频信号特征。实验结果表明,与基于稀疏包络表示重构的音频编码方法相比,该方法的主观测试高0.5分~0.8分,客观测试高5分~10分,解码得到的语音和大部分音乐信号都能还原到原始音频信号,可用于实现高质量的中低码率语音...
摘要(英文):
For the traditional perceptual audio encoding scheme using the psychoacoustic mask effect to reduce coding rate,the channel model+signal incentive way is difficult to simultaneously realize high quality in low bit rate speech and audio signal coding.It proposes a perceptual domain audio coding algorithm based on Gaussian Mixture Model(GMM).The algorithm uses Gammatone filter groups to simulate the human auditory system,using multiplexer masking model and replace to reduce the number of pulse envelope and facilitate the use of structural mode...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com