基于时频域生成对抗网络的语音增强算法

首页 > 成果 > 详情

认领

导出

Link by 中国知网学术期刊 Link by 万方学术期刊

反馈

作者信息关键词期刊信息基础信息归属信息摘要

成果类型：

期刊论文

作者：

尹文兵;高戈;曾邦;王霄;陈怡

作者机构：

[尹文兵; 高戈; 曾邦; 王霄] 武汉大学国家多媒体软件工程技术研究中心

[陈怡] 华中师范大学计算机学院

语种：

中文

关键词：

语音增强;生成对抗网络;时频域;低信噪比;语音质量;语音可懂度

期刊：

计算机科学

ISSN：

1002-137X

年：

2022

卷：

期：

页码：

187-192

DOI：

10.11896/jsjkx.210500114

机构署名：

本校为其他机构

院系归属：

计算机学院

摘要：

传统基于生成对抗网络的语音增强算法（Speech Enhancement algorithm based on Generative Adversarial Networks，SEGAN）在时域上对语音进行增强处理，完全忽略了语音样本在频域上的分布情况。在低信噪比条件下，语音信号会淹没在噪声中，带噪语音的时域分布信息很难捕获，因此，SEGAN的增强性能会急剧下降，其增强语音的语音质量和语音可懂度很低。针对该问题，提出了基于时频域生成对抗网络的语音增强算法（Time-Frequency Domain SEGAN，TFSEGAN）。TFSEGAN采用了时频域双判别器的模型结构和时频域L1损失函数，时域判别器的输入为语音样本的时域特征，频域判别器的输入为语音样本的频域特...

反馈

产权有误：本人成果被他人认领

数据有误：数据基本信息有误

归属有误：成果的院系归属、机构署名归属有误

其他原因：

验证码：

看不清楚，换一个

确定

取消

成果认领

标题：

用户	作者	通讯作者	--
	请选择	请选择	--

确定

取消

基于时频域生成对抗网络的语音增强算法

反馈

成果认领

提示

该栏目需要登录且有访问权限才可以访问