<mods:mods version="3.3" xsi:schemaLocation="http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-3.xsd" xmlns:mods="http://www.loc.gov/mods/v3" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"><mods:titleInfo><mods:title>СОПОСТАВИТЕЛЬНЫЙ АНАЛИЗ РЕЗУЛЬТАТОВ ДОБУЧЕНИЯ МОДЕЛЕЙ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ ДЛЯ УЗБЕКСКОГО ЯЗЫКА</mods:title></mods:titleInfo><mods:name type="personal"><mods:namePart type="given">Сухроб</mods:namePart><mods:namePart type="family">Авезов</mods:namePart><mods:role><mods:roleTerm type="text">author</mods:roleTerm></mods:role></mods:name><mods:abstract>В статье проведён сопоставительный анализ десяти моделей автоматического распознавания речи (ASR) применительно к узбекскому языку, относящемуся к категории малоресурсных. Рассмотрены архитектуры Whisper, Wav2Vec 2.0 XLSR-53, XLS-R, HuBERT, Conformer, MMS, DeepSpeech2, NeMo Conformer и w2v-BERT 2.0. Проведена серия экспериментов по добучению (fine-tuning) предобученных моделей на корпусе узбекской речи объёмом 120 часов. Оценка качества выполнена по метрике WER (Word Error Rate). Результаты показывают, что добученная модель w2v-BERT 2.0 демонстрирует наименьший показатель WER (13,8%), а Whisper large-v3 после добучения достигает 12,4%. Выявлены специфические трудности обработки узбекской речи, связанные с агглютинативной морфологией, вариативностью фонетической реализации и ограниченностью размеченных данных.</mods:abstract><mods:originInfo><mods:dateIssued encoding="iso8601">2026-01-01</mods:dateIssued></mods:originInfo><mods:genre>Article</mods:genre></mods:mods>