Beszédszintézis

A beszédszintézis célja az, hogy mesterségesen hozzon létre beszélő emberi – vagy ahhoz a lehető legjobban hasonlító – hangot. Az első ilyen szerkezetet Kempelen Farkas konstruálta, melynek egy példánya ma a müncheni Deutsches Museumban tekinthető meg. Magyarországon az MTA Nyelvtudományi Intézetében is látható egy működő, rekonstruált változat Kempelen beszélő gépéből (2002-ből), valamint a rekonstruált gép hangja meghallgatható a magyarbeszed.tmit.bme.hu honlapon is az interaktív anyagok között.

Többféle eljárás létezik, ezek a leggyakrabban két fokozatban dolgoznak:

az írott szöveget fonémákká alakítják;
a fonémákat hangfeldolgozó eljárások segítségével – lehetőleg szakadásmentesen összeillesztve – valamilyen hangkeltő eszközön keresztül hanggá alakítják, például a hangképző szervek utánzásával vagy tárolt hangminták felhasználásával.

Megfontolások

Nem minden fonéma létezik minden nyelvben (pl ü nincs az angol nyelvben).
Egy írott szöveg lefordítása fonémákká nem triviális (például a hanglejtés miatt).
Egy írott szöveg fonémákká alakítása nyelv- és kontextusfüggő.

Programok

Felolvasók:

Hangos (angol) szótárak (és még más is. például concordance)

– Hongkongi egyetem

Magyar kutatás (az egyik):

A másik az MTA;

a harmadik:

a Speakboard (angol vagy magyar szöveget) felolvasó program

Kulcsszavak: voice portal, számítógépes nyelvészet, hangkódolás, prozódia, hangsúlyozás, nyelvfelismerés, Kempelen Farkas

Ez a nyelvészeti tárgyú lap egyelőre csonk (erősen hiányos). Segíts te is, hogy igazi szócikk lehessen belőle!

Informatikai portál • összefoglaló, színes tartalomajánló lap