ČeskyEnglish
Západočeská univerzita v Plzni

Audiovizuální syntéza řeči

Řešitel

Ing. Krňoul Zdeněk  <zdkrnoul@kky.zcu.cz>

Syntéza řeči

Syntézou řeči rozumíme napodobení lidské promluvy a v tomto případě využitím počítače. Tuto problematika je obecně složena ze dvou částí: syntéza akustické řeči a syntéza vizuální řeči. Syntéza vizuální i akustické části řeči se často skrývá pod společným názvem "Mluvící hlava" nebo také ve zkratce TTAVS systém. Syntéza akustické části řeči je vytváření právě té složky řeči, kterou můžeme slyšet a vizuální syntéza je pak tedy plynulé vytváření viditelné složky řeči, tedy to co můžeme pozorovat na tváři mluvícího člověka. Obecné schéma můžeme vidět na obr.1. Vstupem tohoto systému jsou libovolná slova ve formě posloupnosti hlásek doplněná o prozodické informace. Výstupem je pak audio-vizální řeč ve formě obrazu a zvuku.

TTAVS systém
Obrázek 1: Obecné schéma systému Mluvící hlava.

Po doplnění modelu hlavy, který vznikl počítačovou rekonstrukcí, dostáváme věrně vypadající animaci "virtuálního dvojníka".

Hlava
Obrázek 2: Foto reálné osoby a virtuální dvojník v počítači.

Prezentaci virtuálního dvojníka, vytvořeného týmem projektu MUSSLAP, zařadila Česká Televize i do pořadu České hlavy, který byl poprvé odvysílán 21.9.2005.