ProfiVox korpusz
A Profivox-korpusz szövegfelolvasó rendszer rugalmas hullámforma elemkiválasztás-alapú beszédszintézis módszert alkalmaz. Ehhez gyors számítógépre van szükség, mivel nagy a számítási igény. Az eljárásnál figyelembe veszik, hogy a beszéd a pillanat eseménye, a hanghullám folyamatosan változik. Még ugyanazon beszédhang kimondása sem adja pontosan ugyanazt a hullámformát két egymás utáni ejtésben. Ezért tekinthetjük egyéninek beszédünk hangszínezetét, ami erősen személyhez köthető. A korpusz alapú módszer jó hangminőséget biztosít, fel lehet ismerni a hang tulajdonosát. Ez annak köszönhető, hogy szavak-, vagy annál is hosszabb szöveg elemek hullámformáját kapcsolja össze, amikor a szövegből beszédet generál. Igényes helyeken használják, ahol a kifogástalan hangminőség a követelmény (például időjárás jelentés, bank, pályaudvar). Ennek a jó minőségnek az ára, hogy ez a módszer csak kötött témakörben képes ezt a jó teljesítményt szolgáltatni. A szintézis adattára emberi beszédből készített több órás beszédadatbázis. A felolvasó olyan mondatokat, kifejezéseket olvas fel, amelyek nagy valószínűséggel előfordulnak az adott témakörű szövegekben. A felolvasandó szöveget komoly, precíz munkával kell megtervezni. A hangfelvétel készítéskor a ‘mester mondat’elvű eljárást kell alkalmazni. A beszédadatbázist részletesen felcímkézik. A beszédszintézist ezek után keresési algoritmusokkal végzik, ami több lépcsőben, súlyozásokkal kiválogatja a korpuszban eltárolt folyamatos beszédből a legmegfelelőbb hullámforma elemeket és azokat fűzi egymáshoz, figyelembe véve a prozódiát is. Utólagos jelfeldolgozát ez a módszer nem alkalmaz! A bonyolult válogató algoritmus futási időben működik. Az eredmény személyhez köthető és természetes hangzású beszéd. A beszédadatbázist minden témakörhöz egyedileg kell elkészíteni.