Magyar beszéd Magyar beszéd
  • Nyelv-írás-beszéd
    • SzakszótárA legfontosabb beszédkutatási szakkifejezések gyűjteménye
    • Kiejtési szótárInteraktív szótár amely 1.5 millió magyar szó kiejtését adja meg hangszimbólumokkal
    • Írás és beszédA beszéd és az írás kapcsolata, a fonetikus átirat
    • HangszimbólumokA beszédkutatásban használatos IPA, SAMPA és más hangszimbólum készletek táblázatai
    • Nyelvi statisztikákBetű- szótag- szó- és hangkapcsolat statisztikák
  • Beszédakusztika
    • AlapokA beszédakusztikához tartozó alapvető témakörök rövid áttekintése
    • BeszédadatbázisokKülönböző beszédreprezentációk adatbázisai fejlesztésekhez
    • Interaktív programok6 interaktív program
    • MondatdallamokA magyar mondatfajták sematikus dallam modellje
    • Hangsúly adatbázisMagyar mondatok hangsúly kiosztása szóhangsúly szinten
  • Beszédszintézis
    • 1980 - kezdetekA magyar beszédszintézis kezdetei 1791-1987
    • 1988 - BME MultivoxBME TMIT Beszédtechnológiai Labor Multivox család 1987-2002
    • 1996 - ProfiVox családBME TMIT Beszédtechnológiai Labor Profivox család 1998-2022
    • 2002 - FlexVoiceMindmaker Kft. Felxibilis hybrid beszédszintézis
    • 2020 - BME Neural ProfiVoxXXI. századi technológia
  • Beszédfelismerés
    • 1971 - a kezdetekMagyarországi kezdetek
    • 1990 - BME TMITOktatás, kutatás, fejlesztés
    • 2013 - Speech TexXXI. századi technológia
  • Alkalmazások
    • TTSBeszédszintézis alkalmazások
    • ASRGépi beszédlejegyző, feliratozó
    • Beszélő fejVirtuális bemondó és transzparens artikuláció oktató
    • VarázsdobozBeszéd oktató siketek segítésére
    • ASR-TTSPárbeszédes gépi rendszerek
  • Egyéb
    • A fenntartókrólA honlap elindítói és fenntartói
    • A honlap történeteHonnan hová érkeztünk
    • OktatásBeszédtechnológiával kapcsolatos oktatás
    • Letölthető irodalomPublikus könyvek és cikkek
    • Kapcsolódó honlapokMás kapcsolódó honlapok
    • Kapcsolódó programokMás kapcsolódó programok
    • KapcsolatElérhetőségek

ProfiVox HMM

A Profivox HMM megoldás statisztikai elvű gépi tanuláson alapul és rejtett Markov-modelleket használ a szintetizálandó beszédjelet reprezentáló paraméterek létrehozására. Ezt a számítástechnika fejlődése tette lehetővé. Nem közvetlenül a hullámformával dolgozik, hanem a hullámformából spektrális és prozódiai jellemzők sokaságát nyeri ki. Komoly fonetikai, nyelvészeti tudásra nincs szükség. Az eljárás a gépi beszédelőállítás új iránya. Utólagos jelfeldolgozásra nincs szükség, mivel a dallam és a ritmus jellegzetességeit is megtanulja. A szintetizált hullámformát egy beszédkódoló (hangvisszaállító) kimenete szolgáltatja. A tanulás alapját több beszélővel elkészített sok-sok órányi tanító beszédadatbázis szolgáltatja. Az algoritmus 5 beszédhangnyi elemsorozat középső hangjára határozza meg a paramétereket. Környezet függő címkék és döntési fák segítségével figyelembe veszi a vizsgált beszédhangot, annak időszerkezeti helyét szó- és mondat szinten, valamint felhasználja a szóhatárokat, a szó hosszúságát is a tanulás során. A tanulás eredményeként létrehoz egy optimális paraméter adatbázist, ami sokkal kisebb, mint a tanító beszéd adatbázis volt. A HMM alapú tanítás idő- és tudás igényes folyamat. A tanítást csak egyszer kell elvégezni. A szintézis során a Profivox-HMM a bemeneti mondat betűsorozata alapján válogat a paraméter adatbázisából. Így állítja össze a mondat szintézisét reprezentáló komplex adatsorozatot. Kijelentő és kérdő mondatokat helyesen tud ejteni. A szintézis gyors, különösebben nagy erőforrást nem igényel. A hangkimenet jó minőségű és kötetlen tartalom felolvasására alkalmas. Lehet lassítani és gyorsítani a beszédet. Előnye az eljárásnak, hogy kis munkával más személy hangjából is lehet paraméter adatbázist készíteni, vagyis az alaprendszert adaptálni lehet többféle hangra is. Az adaptáláshoz elég 10-20 percnyi beszéd az új célszemélytől. További részletek a rendszert fejlesztő Tóth Bálit Pál PhD disszertációjában olvashatók itt.

ProfiVox HMM hangok

Hallgassa meg ezen ismertető első mondatát különböző személyek hangján!

Mátyás
Your browser does not support the audio element.

Tamás
Your browser does not support the audio element.

Géza
Your browser does not support the audio element.

Gábor
Your browser does not support the audio element.

Kati
Your browser does not support the audio element.

Eszter
Your browser does not support the audio element.
Kiemelt
  • Kiejtési szótár
  • Beszédszintézis alkalmazások
Letöltések
  • Letölthető könyvek és cikkek
Rólunk
  • A fenntartókról
  • Elérhetőségünk
Magyar beszéd Magyar beszéd

Copyright 2022. Olaszy Gábor és Abari Kálmán
Utolsó frissítés: 2022. 09. 01. (Last update: 01. 09. 2022)