Навигација

19Д031ГТ - Говорне технологије

Спецификација предмета
НазивГоворне технологије
Акроним19Д031ГТ
Студијски програмЕлектротехника и рачунарство
Модулмодул Телекомуникације
Тип студијадокторске академске студије
Наставник (предавач)
Наставник/сарадник (вежбе)
    Наставник/сарадник (ДОН)
      Број ЕСПБ9.0Статус предметаизборни
      Условљност другим предметимаПоложен испит из предмета Основи говорних комуникација
      Циљеви изучавања предметаЦиљ је овладавање E2E архитектурама, синтезом говора и SSL методама. Кроз истраживачки рад, фокус је на критичкој анализи и развоју решења за изазове робусности, биометрије и паралингвистичке екстракције информација. Студент развија капацитет за пројектовање иновативних говорних система и писање научних радова.
      Исходи учења (стечена знања)Студент ће оспособити за пројектовање E2E и дифузионих модела за препознавање и синтезу говора. Овладаће SSL техникама за екстракцију карактеристика и решавање паралингвистичких изазова са мало података. Развиће способност формулисања оригиналних решења у говорној биометрији и припреме научних радова према врхунским међународним стандардима.
      Садржај предмета
      Садржај теоријске наставеОснови физиологије, акустикa говора и елементи лингвистике. Елементи психоакустике, психолингвистике и перцепције говора. Теорија и системи у препознавању и синтези говора. Методе препознавања језика и говорника (биометријске и форензичке апликације). Стратегије у пројектовању дијалога човек-рачунар. Специфичне примене говорних технологија у мултимодалним комуникацијама.
      Садржај практичне наставеПримена различитих софтверских алата у обради говорног сигнала и разрада усвојених теоријских и практичних знања кроз семинаре и/или пројекте.
      Литература
      1. Jurafsky, D., & Martin, J. H. (2024). Speech and Language Processing (3rd Edition Draft).
      2. Tan, X. (2022). Neural Speech Synthesis. Springer Nature.
      3. Tan, X., Qin, T., Soong, F., & Liu, T. Y. (2021). A Survey on Neural Speech Synthesis. Microsoft Research Asia. (Published in IEEE Access/arXiv).
      4. Li, J. (2020). Recent Advances in End-to-End Automatic Speech Recognition. Signal Processing: Algorithms, Architectures, Arrangements, and Applications (SIP), Cambridge University Press.
      5. Mohamed, A., Lee, H. Y., Borgholt, L., et al. (2022). Self-Supervised Speech Representation Learning: A Review. IEEE Journal of Selected Topics in Signal Processing.
      Број часова активне наставе недељно током семестра/триместра/године
      ПредавањаВежбеДОНСтудијски и истраживачки радОстали часови
      8
      Методе извођења наставеКонсултације, израда семинарског рада и/или учешће у пројектима.
      Оцена знања (максимални број поена 100)
      Предиспитне обавезеПоенаЗавршни испитПоена
      Активности у току предавања20Писмени испит0
      Практична настава0Усмени испит30
      Пројекти
      Колоквијуми0
      Семинари50