Szukana fraza: [Afiliacje = "Pondel\-Sycz, Karolina \: Faculty of Electronics and Information Technology, Warsaw University of Technology, Warsaw, Poland"]

Wyniki wyszukiwania

Szukana fraza: [Afiliacje = "Pondel\-Sycz, Karolina \: Faculty of Electronics and Information Technology, Warsaw University of Technology, Warsaw, Poland"]

Filtruj wyniki

Czasopisma
- International Journal of Electronics and Telecommunications (1)
Data
- Data początkowa: Data końcowa:

Wyniki wyszukiwania

Wyników: 1

Wyników na stronie: 25 50 75

Sortuj wg:

z 1

End-To-End deep neural models for Automatic Speech Recognition for Polish Language

Karolina Pondel-Sycz Agnieszka Paula Pietrzak Julia Szymla

International Journal of Electronics and Telecommunications | 2024 | vol. 70 | No 2 | 315-321 | DOI: 10.24425/ijet.2024.149547

Słowa kluczowe Automatic Speech Recognition Deep Neural Networks End-To-End Polish Language

Pobierz PDF Pobierz RIS Pobierz Bibtex

Abstrakt

This article concerns research on deep learning models (DNN) used for automatic speech recognition (ASR). In such systems, recognition is based on Mel Frequency Cepstral Coefficients (MFCC) acoustic features and spectrograms. The latest ASR technologies are based on convolutional neural networks (CNNs), recurrent neural networks (RNNs) and Transformers. The article presents an analysis of modern artificial intelligence algorithms adapted for automatic recognition of the Polish language. The differences between conventional architectures and ASR DNN End-To-End (E2E) models are discussed. Preliminary tests of five selected models (QuartzNet, FastConformer, Wav2Vec 2.0 XLSR, Whisper and ESPnet Model Zoo) on Mozilla Common Voice, Multilingual LibriSpeech and VoxPopuli databases are demonstrated. Tests were conducted for clean audio signal, signal with bandwidth limitation and degraded. The tested models were evaluated on the basis of Word Error Rate (WER).

Przejdź do artykułu

Autorzy i Afiliacje

Karolina Pondel-Sycz

Agnieszka Paula Pietrzak

Julia Szymla

Faculty of Electronics and Information Technology, Warsaw University of Technology, Warsaw, Poland