본문 바로가기


[토막]T. Hasumi, T. Kobayashi and T. Ogawa, "Investigation of Network Architecture for Single-Channel End-to-End Denoising," 2020 28th European Signal Processing Conference (EUSIPCO), Amsterdam, Netherlands, 2021, pp. 441-445, doi: 10.23919/Eusipco479.. 한줄요약 : decoder를 speech용과 noise 용으로 나눠서 해봤는데 별로였다. Investigation of Network Architecture for Single-Channel End-to-End Denoising This paper examines the effectiveness of a fully convolutional time-domain audio separation network (Conv-TasNet) on single-channel denoising. Conv-TasNet, which has a structure to explicitly estimate a mask for encoded features, has shown to be effective ieeexplore.iee.. 2023. 3. 6.
(2023,ICASSP[submit])Deep Neural Mel-Subband Beamformer for In-car Speech Separation Deep Neural Mel-Subband Beamformer for In-car Speech Separation 자세한 스펙 및 구성은 공개되지 않음 submit 이긴한데, 저자의 해당 모델 시리즈가 INTERSPEECH. ICASSP에 계속 등재되어 왔음 ABSTRACT 기존의 문제 DL 기반 빔포밍이 효과적이기는 하지만 각 주파수를 독립적으로 처리하는 Narrow Band로 수행한다. 이 때문에, 연산량이 많고 연산 시간이 길며, 실제 환경에서는 잘 동작하지 않게된다. 제시한 방식 DL기반의 mel-subband spatial-temporal beamformer를 통해 차량환경에서 적은 연산량과 시간으로 음성 분리를 수행하는 모델을 제시한다. 기존의 subband 방식과는 다르게 mel-scale .. 2022. 11. 30.
(2022,arXiv)On the Use of Deep Mask Estimation Module for Neural Source Separation Systems | 3줄 요약 https://arxiv.org/abs/2206.07347 On the Use of Deep Mask Estimation Module for Neural Source Separation Systems Most of the recent neural source separation systems rely on a masking-based pipeline where a set of multiplicative masks are estimated from and applied to a signal representation of the input mixture. The estimation of such masks, in almost all network arc arxiv.org Mask 추정 레이어를 3층(dep.. 2022. 7. 25.
(2022,ICASSP)UFORMER _ A UNET BASED DILATED COMPLEX & REAL DUAL-PATH CONFORMER Uformer: A Unet based dilated complex & real dual-path conformer network for simultaneous speech enhancement and dereverberation ABSTRACT 기존 방식들은 spectrum 과 magnitude를 서로간의 관계를 무시하고 분리해서 접근했다. 본 논문에선 Uformer, Unet기반의 dilated complex & real dual-path conformer network로 complex 와 magnitude domain에서 동시에 음성향상과 반향제거를 한다. 본 논문은 TA(Time Attention) 과 DC(Dilated Convolution)으로 log, global context를 얻고, FA.. 2022. 1. 6.
(2020,TRAN)Complex Spectral Mapping for Single- and Multi-Channel Speech Enhancement and Robust ASR Complex Spectral Mapping for Single- and Multi-Channel Speech Enhancement and Robust ASR - IEEE Journals & Magazine 3 줄 요약 Offline : 성능을 위해 최대한 욱여넣음 Complex domain spectral mapping DNN + Beamforming + DNN + Beamfroming ABSTRACT 제안 : single- & multi-channel complex spectral mapping direct-path 신호의 real & image 성분을 각각 추정 두개의 DNN single-channel complex spectral mapping : 출력을 MVDR Beamformer에 사용 빔포밍.. 2021. 3. 21.