Oferta dydaktyczna Instytutu Informatyki

Poniższa lista przedstawia przedmioty, które są uczone w Instytucie Informatyki, niektóre z nich co roku, niektóre z mniejszą częstotliwością Każdy student Instytutu Informatyki studiuje wg indywidualnego toku studiów, wybierając (zgodnie z pewnymi zasadami) z tej listy swoje przedmioty.

Jeżeli zastanawiasz się nad studiami u nas, jeżeli chcesz wiedzieć, czy na Uniwersytecie można zostać inżynierem, jeżeli interesuje Cię 1000 zł stypendium miesięcznie - zapraszamy na naszą stronę główną

Synteza mowy

Nazwa angielska (title in English): Speech synthessis
Prowadzący (lecturer): Paweł Rychlikowski
Liczba punktów (ECTS): 9
Liczba punktów 2007 (ECTS since 2007): 6
Rodzaj (type): zaawansowany
Rodzaj od 2007 (type since 2007): informatyczny.I2
Liczba godzin (hours in semester):
wykład:30
ćwiczenia+pracownia:30
Egzamin (exam): tak
Możliwe zajęcia w języku angielskim (can be taught in English): nie
Przedmiot zostal uaktualniony na biezacy rok (updated): nie
Semestr (semester): zimowy

Wymagania (prerequisites)

Opis (description)

Wraz z rozwojem technologii informacyjnej rośnie rola syntezy i analizy mowy, które zapewne w przyszłości będą głównymi sposobami komunikacji człowieka i komputera.

Niniejszy wykład poświęcony będzie syntezie mowy, czyli procesowi przekształcania tekstu na zapis fali dźwiękowej, który umożliwia odtworzenie oryginalnego tekstu i dodatkowo możliwie jak najbardziej przypomina ludzki sposób odczytania tekstu. W wielu sytuacjach używanie syntezatora ułatwia korzystanie z komputera (czytanie maili, dostęp telefoniczny, ...), a czasami wręcz umożliwia (np. czytanie tekstu "z ekranu" przez niewidomych).

Wykład ma kilka celów:

  1. zrozumienie mechanizmów używanych na różnych poziomach syntezy mowy
  2. napisanie własnego syntezatora mowy (którego mowę da się zrozumieć)
  3. zapoznanie się z istniejącymi systemami syntezy mowy oraz narzędziami używanymi w ich tworzeniu
  4. zorientowanie się w wyzwaniach stojących przed syntezą mowy

Program (program)

  1. Definicja problemu Text-to-speech
  2. Podział tekstu na słowa i zdania
  3. Przetwarzanie tekstu zgodne z potrzebami syntezatora (dezambiguacja homonimów, sposoby czytania skrótów i skrótowców, liczby i inne jednostki nieleksykalne).
  4. Wyznaczanie prozodii na podstawie analizy tekstu (podział na frazy, wybór akcentu zdaniowego, ustalanie linii prozodycznej)
  5. Podstawy fonetyki i fonologii (sposób działania narządów mowy, akustyczna charakterystyka mowy, akcent wyrazowy, wyznaczanie czasu trwania głosek)
  6. Wymowa (sposób przekształcania ciągu liter na ciąg fonemów -- Grapheme-to-phoneme conversion)
  7. Fizyczna realizacja prozodii
  8. Filtrowanie sygnałów akustycznych
  9. Synteza mowy bazująca na symulacji działania organów mowy
  10. Synteza konkatenacyjna (głównie difoniczna, w której mowa składana jest z dwudźwięków i następnie poddawana dalszej obróbce, związanej z wprowadzeniem intonacji), np: http://www.staff.amu.edu.pl/~fonetyka/synteza/przyklady.htm
  11. Synteza korpusowa, w której mowa syntetyzowana jest z dłuższych fragmentów (sylab, czasem słów lub fraz), zasadniczo nie poddawanych obróbce (np http://tts.loquendo.com/ttsdemo/default.asp?page=id&voice=Zosia albo www.ivona.com)
  12. Inne zagadnienia: biblioteki i narzędzia używane w syntezie mowy, synteza tekstów wielojęzycznych (rozpoznawanie języka), wykorzystanie analizy mowy do wspomagania syntezy mowy, tworzenie baz difonów, dodawanie "uczucia" do tekstów, ...

Literatura (references)

Jeżeli jesteś zainteresowany studiowaniem w naszym instytucie, zapraszamy na stronę poświęconą tegorocznej rekrutacji.

Nazwa użytkownika (user name):
Hasło (password):