Hlasová rozhraní již dokáží zachytit celé věty

Největší technické úskalí rozpoznávání hlasu spočívalo až doposud ve vzájemném přiřazování specifických vokalizací a jim odpovídajících fonémů (foném je základní jednotka řeči). Jen pro anglický jazyk vyžadovalo rozpoznávání obrovské databáze výslovnosti jednotlivých fonémů pro lidi různého věku, jazykové kultury a pohlaví a pro různé stavy telefonní linky.

Ačkoliv jsme od 90. let zaznamenali v této oblasti velký pokrok, nedosáhl vývoj dosud svého cíle. Kromě toho se ukázalo, že rozpoznávání řeči představuje pouze zčásti technický problém. Kvalita dialogu totiž vyplývá z kontextu vztahů: navázání vztahu bezprostředně implikuje určitou strukturu předpokladů a očekávání.

Míra nepřesností v rozpoznávání řeči již klesá pod 30 %. a pro systémy není problém zachytit celou větu. Většina uživatelů však navíc požaduje vysoce strukturovaný dialog a reakci na každý jednotlivý krok sjednávané transakce.

**Datum vydání: X/2001**
Zdroj: CIO.com - Internetové stránky časopisu CIO pro vedoucí pracovníky v oboru informačních technologií
Zobrazit přehled článků ze zdroje CIO.com