Navigacija

19D031GT - Govorne tehnologije

Specifikacija predmeta
Naziv Govorne tehnologije
Akronim 19D031GT
Studijski program Elektrotehnika i računarstvo
Modul modul Telekomunikacije
Tip studija doktorske akademske studije
Nastavnik (predavač)
Nastavnik/saradnik (vežbe)
    Nastavnik/saradnik (DON)
      Broj ESPB 9.0 Status predmeta izborni
      Uslovljnost drugim predmetima Položen ispit iz predmeta Osnovi govornih komunikacija
      Ciljevi izučavanja predmeta Cilj je ovladavanje E2E arhitekturama, sintezom govora i SSL metodama. Kroz istraživački rad, fokus je na kritičkoj analizi i razvoju rešenja za izazove robusnosti, biometrije i paralingvističke ekstrakcije informacija. Student razvija kapacitet za projektovanje inovativnih govornih sistema i pisanje naučnih radova.
      Ishodi učenja (stečena znanja) Student će osposobiti za projektovanje E2E i difuzionih modela za prepoznavanje i sintezu govora. Ovladaće SSL tehnikama za ekstrakciju karakteristika i rešavanje paralingvističkih izazova sa malo podataka. Razviće sposobnost formulisanja originalnih rešenja u govornoj biometriji i pripreme naučnih radova prema vrhunskim međunarodnim standardima.
      Sadržaj predmeta
      Sadržaj teorijske nastave Osnovi fiziologije, akustika govora i elementi lingvistike. Elementi psihoakustike, psiholingvistike i percepcije govora. Teorija i sistemi u prepoznavanju i sintezi govora. Metode prepoznavanja jezika i govornika (biometrijske i forenzičke aplikacije). Strategije u projektovanju dijaloga čovek-računar. Specifične primene govornih tehnologija u multimodalnim komunikacijama.
      Sadržaj praktične nastave Primena različitih softverskih alata u obradi govornog signala i razrada usvojenih teorijskih i praktičnih znanja kroz seminare i/ili projekte.
      Literatura
      1. Jurafsky, D., & Martin, J. H. (2024). Speech and Language Processing (3rd Edition Draft).
      2. Tan, X. (2022). Neural Speech Synthesis. Springer Nature.
      3. Tan, X., Qin, T., Soong, F., & Liu, T. Y. (2021). A Survey on Neural Speech Synthesis. Microsoft Research Asia. (Published in IEEE Access/arXiv).
      4. Li, J. (2020). Recent Advances in End-to-End Automatic Speech Recognition. Signal Processing: Algorithms, Architectures, Arrangements, and Applications (SIP), Cambridge University Press.
      5. Mohamed, A., Lee, H. Y., Borgholt, L., et al. (2022). Self-Supervised Speech Representation Learning: A Review. IEEE Journal of Selected Topics in Signal Processing.
      Broj časova aktivne nastave nedeljno tokom semestra/trimestra/godine
      Predavanja Vežbe DON Studijski i istraživački rad Ostali časovi
      8
      Metode izvođenja nastave Konsultacije, izrada seminarskog rada i/ili učešće u projektima.
      Ocena znanja (maksimalni broj poena 100)
      Predispitne obaveze Poena Završni ispit Poena
      Aktivnosti u toku predavanja 20 Pismeni ispit 0
      Praktična nastava 0 Usmeni ispit 30
      Projekti
      Kolokvijumi 0
      Seminari 50