MRI- és UH-felvételek geometriai elemzése a beszédszintézisben / Trencsényi Réka
Bibliogr.: p. 64-65. - Abstr. hun., eng.
In: Acta Medicinae et Sociologica. - ISSN 2062-0284, eISSN 2559-866X. - 2020. 11. évf. 31. sz., p. 55-65. : ill.
A gépi beszéd előállításának egyik új vonulata az artikulációs beszédszintézis, ami a hangképzéshez kapcsolódó vizuális információk feldolgozásán alapszik. A hangképző szervek statikus és dinamikus geometriai paramétereinek pontos ismerete alapvető szerepet játszik a beszédszintézis megvalósításában. Ezen adatok vizuális kinyerésének alkalmas forrásai lehetnek a beszéd közben készült MRI- és UH-felvételek, melyek különböző geometriával jellemezhetők. Az UH-keretek képpontjai egy polárkoordináta-rendszer kijelölésével kezelhetők a legkényelmesebben, míg az MRIkeretek képpontjainak leírásához egy descartes-i koordináta-rendszer adhat megfelelő kiindulópontot. Mivel az UH-felvételeken nem látható a nyelv hátsó része és a nyelvhegy, így az MRI-hez képest csak részleges információt kaphatunk a nyelv mozgásáról. Ennélfogva fontos és egyben nem triviális feladat az MRI- és UH-források geometriájának összehangolása. A publikációban bemutatom a geometriai transzformációk egy lehetséges módját. Kulcsszavak: MRI, UH, beszédszintézis, gépi beszéd