<didl:DIDL xmlns:didl="urn:mpeg:mpeg21:2002:02-DIDL-NS" xmlns:dip="urn:mpeg:mpeg21:2002:01-DIP-NS" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:dii="urn:mpeg:mpeg21:2002:01-DII-NS" DIDLDocumentId="https://arxiv.publishscience.uz/id/eprint/782" xsi:schemaLocation="urn:mpeg:mpeg21:2002:02-DIDL-NS http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-21_schema_files/did/didl.xsd urn:mpeg:mpeg21:2002:01-DII-NS http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-21_schema_files/dii/dii.xsd urn:mpeg:mpeg21:2005:01-DIP-NS http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-21_schema_files/dip/dip.xsd">
  <didl:Item>
    <didl:Descriptor>
      <didl:Statement mimeType="application/xml">
        <dii:Identifier>https://arxiv.publishscience.uz/id/eprint/782</dii:Identifier>
      </didl:Statement>
    </didl:Descriptor>
    <didl:Descriptor>
      <didl:Statement mimeType="application/xml">
        <dcterms:modified>2026-05-10T20:55:21Z</dcterms:modified>
      </didl:Statement>
    </didl:Descriptor>
    <didl:Component>
      <didl:Resource ref="https://arxiv.publishscience.uz/cgi/export/eprint/782/DIDL/arxiv-eprint-782.xml" mimeType="application/xml"/>
    </didl:Component>
    <didl:Item>
      <didl:Descriptor>
        <didl:Statement mimeType="application/xml">
          <dip:ObjectType>info:eu-repo/semantics/descriptiveMetadata</dip:ObjectType>
        </didl:Statement>
      </didl:Descriptor>
      <didl:Component>
        <didl:Resource mimeType="application/xml">
          <oai_dc:dc xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:dc="http://purl.org/dc/elements/1.1/" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
        <dc:relation>https://arxiv.publishscience.uz/782/</dc:relation>
        <dc:title>СОПОСТАВИТЕЛЬНЫЙ АНАЛИЗ РЕЗУЛЬТАТОВ ДОБУЧЕНИЯ МОДЕЛЕЙ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ ДЛЯ УЗБЕКСКОГО ЯЗЫКА</dc:title>
        <dc:creator>Авезов, Сухроб</dc:creator>
        <dc:description>В статье проведён сопоставительный анализ десяти моделей автоматического распознавания речи (ASR) применительно к узбекскому языку, относящемуся к категории малоресурсных. Рассмотрены архитектуры Whisper, Wav2Vec 2.0 XLSR-53, XLS-R, HuBERT, Conformer, MMS, DeepSpeech2, NeMo Conformer и w2v-BERT 2.0. Проведена серия экспериментов по добучению (fine-tuning) предобученных моделей на корпусе узбекской речи объёмом 120 часов. Оценка качества выполнена по метрике WER (Word Error Rate). Результаты показывают, что добученная модель w2v-BERT 2.0 демонстрирует наименьший показатель WER (13,8%), а Whisper large-v3 после добучения достигает 12,4%. Выявлены специфические трудности обработки узбекской речи, связанные с агглютинативной морфологией, вариативностью фонетической реализации и ограниченностью размеченных данных.</dc:description>
        <dc:date>2026-01-01</dc:date>
        <dc:type>Article</dc:type>
        <dc:type>NonPeerReviewed</dc:type>
        <dc:format>application/pdf</dc:format>
        <dc:language>en</dc:language>
        <dc:identifier>https://arxiv.publishscience.uz/782/1/fulltext.pdf</dc:identifier>
        <dc:identifier>  Авезов, Сухроб  (2026) СОПОСТАВИТЕЛЬНЫЙ АНАЛИЗ РЕЗУЛЬТАТОВ ДОБУЧЕНИЯ МОДЕЛЕЙ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ ДЛЯ УЗБЕКСКОГО ЯЗЫКА.  Scientific and innovative research in the social and humanitarian sphere, 3 (4).  pp. 329-225.  ISSN 3060-5059     </dc:identifier>
        <dc:relation>OJS:1016</dc:relation>
        <dc:identifier>OJS:1016</dc:identifier></oai_dc:dc>
        </didl:Resource>
      </didl:Component>
    </didl:Item>
    <didl:Item>
      <didl:Descriptor>
        <didl:Statement mimeType="application/xml">
          <dip:ObjectType>info:eu-repo/semantics/objectFile</dip:ObjectType>
        </didl:Statement>
      </didl:Descriptor>
      <didl:Component>
        <didl:Resource ref="https://arxiv.publishscience.uz/782/1/fulltext.pdf" mimeType="application/pdf"/>
      </didl:Component>
    </didl:Item>
    <didl:Item>
      <didl:Descriptor>
        <didl:Statement mimeType="application/xml">
          <dip:ObjectType>info:eu-repo/semantics/humanStartPage</dip:ObjectType>
        </didl:Statement>
      </didl:Descriptor>
      <didl:Component>
        <didl:Resource mimeType="application/html" ref="https://arxiv.publishscience.uz/782/"/>
      </didl:Component>
    </didl:Item>
  </didl:Item>
</didl:DIDL>