版权说明 操作指南
首页 > 成果 > 详情

基于声纹嵌入的语音增强算法

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
高戈;曾邦;王霄;尹文兵;陈怡
作者机构:
[尹文兵; 高戈; 曾邦; 王霄] 武汉大学国家多媒体软件工程技术研究中心
[陈怡] 华中师范大学计算机学院
语种:
中文
关键词:
语音增强;低信噪比;声纹嵌入;掩码;映射
关键词(英文):
speech enhancement;low signal-to-noise ratio;speaker embedding;masking;mapping
期刊:
计算机应用研究
ISSN:
1001-3695
年:
2022
卷:
39
期:
3
页码:
688-692
机构署名:
本校为其他机构
院系归属:
计算机学院
摘要:
频域语音增强算法在高信噪比的条件下有明显的降噪效果,而在低信噪比条件下频域语音增强算法的性能会大幅下降。针对这个问题,将基于声纹的掩码应用到频域语音增强网络,利用声纹的先验信息,提升网络对说话人和噪声的区分度。另外,为了进一步改善频域语音算法在低信噪比条件下的性能,提出基于映射的声纹嵌入语音增强算法,避免了可能因采用掩模方案造成的语音失真问题。实验结果表明,在引入相同声纹信息时,基于映射的声纹嵌入语音增强网络在低信噪比条件下的增强性能表现更好,特别是在改善语音失真方面优势明显。相较于基于掩模的声纹掩码网络,基于映射的声纹嵌入网络在PESQ、STOI和SSNR这三项指标...
摘要(英文):
Speech enhancement in the frequency-domain can achieve a good noise reduction effect and improve speech communication quality under the condition of a high signal-to-noise ratio.However, speech enhancement performance in frequency-domain decreases significantly under low SNR conditions.To address this problem, this paper applied a mask based on speaker embedding to a frequency-domain speech enhancement network, and used the a priori information of speaker embedding to improve the network’s ability to distinguish between speakers and noise.To f...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com