eprintid: 782 rev_number: 3 eprint_status: archive dir: disk0/00/00/07/82 datestamp: 2026-05-10 20:55:21 lastmod: 2026-05-10 20:55:21 status_changed: 2026-05-10 20:55:21 type: article metadata_visibility: show creators_name: Авезов, Сухроб title: СОПОСТАВИТЕЛЬНЫЙ АНАЛИЗ РЕЗУЛЬТАТОВ ДОБУЧЕНИЯ МОДЕЛЕЙ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ ДЛЯ УЗБЕКСКОГО ЯЗЫКА ispublished: pub abstract: В статье проведён сопоставительный анализ десяти моделей автоматического распознавания речи (ASR) применительно к узбекскому языку, относящемуся к категории малоресурсных. Рассмотрены архитектуры Whisper, Wav2Vec 2.0 XLSR-53, XLS-R, HuBERT, Conformer, MMS, DeepSpeech2, NeMo Conformer и w2v-BERT 2.0. Проведена серия экспериментов по добучению (fine-tuning) предобученных моделей на корпусе узбекской речи объёмом 120 часов. Оценка качества выполнена по метрике WER (Word Error Rate). Результаты показывают, что добученная модель w2v-BERT 2.0 демонстрирует наименьший показатель WER (13,8%), а Whisper large-v3 после добучения достигает 12,4%. Выявлены специфические трудности обработки узбекской речи, связанные с агглютинативной морфологией, вариативностью фонетической реализации и ограниченностью размеченных данных. date: 2026-01-01 date_type: published id_number: OJS:1016 full_text_status: public publication: Scientific and innovative research in the social and humanitarian sphere volume: 3 number: 4 pagerange: 329-225 refereed: 1 issn: 3060-5059 citation: Авезов, Сухроб (2026) СОПОСТАВИТЕЛЬНЫЙ АНАЛИЗ РЕЗУЛЬТАТОВ ДОБУЧЕНИЯ МОДЕЛЕЙ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ ДЛЯ УЗБЕКСКОГО ЯЗЫКА. Scientific and innovative research in the social and humanitarian sphere, 3 (4). pp. 329-225. ISSN 3060-5059 document_url: https://arxiv.publishscience.uz/782/1/fulltext.pdf