版权说明 操作指南
首页 > 成果 > 详情

基于时频域生成对抗网络的语音增强算法

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
尹文兵;高戈;曾邦;王霄;陈怡
作者机构:
[尹文兵; 高戈; 曾邦; 王霄] 武汉大学国家多媒体软件工程技术研究中心
[陈怡] 华中师范大学计算机学院
语种:
中文
关键词:
语音增强;生成对抗网络;时频域;低信噪比;语音质量;语音可懂度
期刊:
计算机科学
ISSN:
1002-137X
年:
2022
卷:
49
期:
6
页码:
187-192
机构署名:
本校为其他机构
院系归属:
计算机学院
摘要:
传统基于生成对抗网络的语音增强算法(Speech Enhancement algorithm based on Generative Adversarial Networks,SEGAN)在时域上对语音进行增强处理,完全忽略了语音样本在频域上的分布情况。在低信噪比条件下,语音信号会淹没在噪声中,带噪语音的时域分布信息很难捕获,因此,SEGAN的增强性能会急剧下降,其增强语音的语音质量和语音可懂度很低。针对该问题,提出了基于时频域生成对抗网络的语音增强算法(Time-Frequency Domain SEGAN,TFSEGAN)。TFSEGAN采用了时频域双判别器的模型结构和时频域L1损失函数,时域判别器的输入为语音样本的时域特征,频域判别器的输入为语音样本的频域特...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com