eprintid: 782
rev_number: 3
eprint_status: archive
dir: disk0/00/00/07/82
datestamp: 2026-05-10 20:55:21
lastmod: 2026-05-10 20:55:21
status_changed: 2026-05-10 20:55:21
type: article
metadata_visibility: show
creators_name: Авезов, Сухроб
title: СОПОСТАВИТЕЛЬНЫЙ АНАЛИЗ РЕЗУЛЬТАТОВ ДОБУЧЕНИЯ МОДЕЛЕЙ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ ДЛЯ УЗБЕКСКОГО ЯЗЫКА
ispublished: pub
abstract: В статье проведён сопоставительный анализ десяти моделей автоматического распознавания речи (ASR) применительно к узбекскому языку, относящемуся к категории малоресурсных. Рассмотрены архитектуры Whisper, Wav2Vec 2.0 XLSR-53, XLS-R, HuBERT, Conformer, MMS, DeepSpeech2, NeMo Conformer и w2v-BERT 2.0. Проведена серия экспериментов по добучению (fine-tuning) предобученных моделей на корпусе узбекской речи объёмом 120 часов. Оценка качества выполнена по метрике WER (Word Error Rate). Результаты показывают, что добученная модель w2v-BERT 2.0 демонстрирует наименьший показатель WER (13,8%), а Whisper large-v3 после добучения достигает 12,4%. Выявлены специфические трудности обработки узбекской речи, связанные с агглютинативной морфологией, вариативностью фонетической реализации и ограниченностью размеченных данных.
date: 2026-01-01
date_type: published
id_number: OJS:1016
full_text_status: public
publication: Scientific and innovative research in the social and humanitarian sphere
volume: 3
number: 4
pagerange: 329-225
refereed: 1
issn: 3060-5059
citation:   Авезов, Сухроб  (2026) СОПОСТАВИТЕЛЬНЫЙ АНАЛИЗ РЕЗУЛЬТАТОВ ДОБУЧЕНИЯ МОДЕЛЕЙ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ ДЛЯ УЗБЕКСКОГО ЯЗЫКА.  Scientific and innovative research in the social and humanitarian sphere, 3 (4).  pp. 329-225.  ISSN 3060-5059     
document_url: https://arxiv.publishscience.uz/782/1/fulltext.pdf