- Akusztikai vetület
-
Az artikuláció során kialakított képzési hely a mássalhangzóknál(például a nyelvhegy a fogmederhez tapad, a t, d, n hangok képzésénél) meghatároz egy elméleti formáns struktúrát, amihez a megelőző vagy követő magánhangzó formánsai mozogni fognak az átmeneti fázisaikban. Ez az elméleti formáns struktúra az adott képzési hely akusztikai vetülete a mássalhangzó képzési módjától (zár, rés, pergetett, zöngés zöngétlen)függetlenül. Ez más mássalhangzók képzési helyére is igaz. Tehát a t, d, n mássalhangzókat követő, illetve megelőző magánhangzókban (pédául ta, da, na vagy at, ad, an) ugyanolyan irányú formáns mozgások lesznek a mássalhangohoz kapcsolódó átmeneti fázisokban. Tehát az ugyanazon képzési helyhez tartozó mássalhangzók a magánhangzók formánsmozgásaira egyforma hatással vannak, függetlenül attól, hogy az adott mássalhangzó képzési helyéhez milyen képzési módú mássalhangzó tartozik. Ennek a beszédszintézisnél van lényeges szerepe.
- Alapfrekvencia
-
A hangszalagok rezgésének frekvenciája a beszédben, amikor zöngés hangot ejtünk. Alaphangnak is szokták nevezni. Fonetikai jelölése F0. Értéke: férfi beszélőnél átlagosan 100 Hz, nőinél 180 Hz, gyermeknél 400 Hz. Fontos megjegyzés: az F0-nak semmi köze az F1, F2, F3, F4-el jelölt formánsokhoz. Az alapfrekvenciát tudatosan tudjuk változtatni, ezzel hozzuk létre a beszéddallamot.
- Aperiodikus rezgés
-
Szabálytalan, nem periodikus rezgés. Aperiodikus rezgés keletkezik például a zörejes beszédhangok (például: sz, s, f ) ejtésekor.
- Artikuláció
-
A beszédképző szervek, folyamatos automatikus mozgatása a beszéd előállításához.
- Artikulációs csatona
-
A hangszalagoktól a szájnyílásig terjedő hangképző terület. Toldalékcsőnek is nevezik. A férfiaknál az átlagos hossza 17 cm, a nőknél: 14 cm)
- Artikulációs sebesség
-
A másodpercenként ejtett beszédhangok száma folyamatos ejtésnél (a szünettartásokat nem számítva). A magyar átlag 14 hang/s, a nyugodt beszédnél jellemzően 12 hang/s, a 18 hang/s a gyorsabb beszédnek felel meg.
- Beszéddallam
-
A zönge frekvenciájának (F0) változtatása a mondat zöngés hangjaiban a mondat dallamának (ereszkedő, eső, emelkedő, lebegő és kombinációik) és a hangsúlyozásnak az érzékeltetésére, valamint érzelmek kifejezésére.
- Beszédsebesség
-
A beszéd hangzásának teljes idejében (a szüneteket is beleértve) egységnyi időtartam alatt elhangzott beszédhangok száma. Mértékegysége: hang/s. Értéke kisebb, mint az artikulációs sebességé.
- Beszédszintetizátor
-
A beszéd mesterséges előállítására szolgáló eszköz, gépi eljárás. Általában az írott alakot alakítják át ezzel a módszerrel emberi beszéddé (gépi felolvasás).
- Beszédfelismerő
-
Az emberi beszédet géppel felismerő automatikus eszköz, gépi eljárás. A gépi beszédfelismerést statisztikai módszerek alkalmazásával végzik.
A géppel felismert beszédből automatikusan szöveget is készítenek, ezek a leiratozó eljárások. A gépi beszédfelismerésnek komoly szerepe van a beléptető rendszerekben és alkalmazzák a személy azonosításban is. - Beszédfrekvencia
-
A beszédben előforduló frekvencia értékek összessége, amelynek sávja: 50Hz - 12000 Hz. Ez kisebb, mint a hallás tartomány.
- C
-
A mássalhangzók rövid jele a beszédtudományokban (Consonant). A magánhangzó rövidített jelölése a V (Vowel).
- Címkézés
-
A beszédjelekkel párhuzamosan elhelyezett időszinkron címkék (markerek) összessége, amelyek nyelvi, akusztikai jellemzőket jelölnek. Ilyen lehet például egy szó hanghatárainak, szótaghatárainak megjelölése, vagy a zöngés periódusok jelölése egy magánhangzóban.
- Diád
-
Beszédépítő hullámforma elem, amely két fél beszédhangot tartalmaz. A magyar beszéd max. 1600 féle diáddal lefedhető. Beszédszintézisnél használják.
- Felharmonikus
-
A zöngés beszédhangoknak olyan frekvencia összetevői a felharmonikusok, amik az alapfrekvencia egész számú többszörösei. A felharmonikusok építik fel a zöngés beszédrészek spektrumát. A felharmonikusok jellemzően a 100Hz-4000 Hz frekvencia tartományban fordulnak elő a beszédben.
- Fojtott zönge
-
A zöngés zárhangok (b, d, g, gy) kezdő szakaszán a zöngerész képzésekor keletkező rövid idejű zöngehang. A fojtást a zár okozza, ilyen esetben nincs hangkiáramlás a szájon át. A fojtott zönge amplitúdója kicsi, nem tartalmaz formánsokat. A zöngés zárhangokban a fojtott zöngét követi a hirtelen zárfelpattanás.
- Fonéma
-
Elméleti nyelvészeti fogalom. Azt az elvont nyelvi egységet jelenti amely szójelentéseket különböztet meg. A fonéma hangrealizációja a beszédhang. A magyar nyelvben összesen 65 fonéma van, 15 féle magánhangzó és 50 féle mássalhangzó. A fonémáknak a nyelvi időtartam osztály szerint két csoportja van: rövid és hosszú. Például a sok és sokk szavak közötti jelentés különbséget a k hang hosszú változata hozza létre.
- Formáns
-
A gégében keletkezett egészséges zönge hang egyszerű formájú rezgése felharmonikusokban gazdag. A gége feletti artikulációs csatorna üregrendszerének rezonancia frekvenciái felerősítik a zönge adott felharmonikusait a pillanatnyi rezonancia frekvencián és környékén. Így ezek a felerősített felharmonikus nyalábok nagyobb energiával rendelkeznek, mint a környezetük. Ezt az energiakoncentrációs részt nevezik formánsnak, hiszen ez formálja ki az adott hang hangzását. A rezonancia frekvenciák minden beszédhang esetében más-más frekvencián vannak, ez az artikulációtól függ. A formánsokat az F1, F2, F3, F4, jelekkel jelölik az emelkedő frekvenciájuk szerint. A beszédjelben a formánsok a 200-4000 Hz-es frekvenciasávban találhatók. Minden formánsnak megvan a saját előfordulási frekvencia sávja. A formánsok a nagy energiájú zöngés beszédhangokban, például magánhangzókban mutathatók ki a legjobban.
- Frekvencia
-
A rezgés időegység alatti periódusainak gyakorisága. Mértékegysége a Hz. 1 Hz a frekvencia akkor, ha a rezgés 1 másodperc alatt egy periódust ír le. A beszédben az alapfrekvencia értéke: férfi beszélőnél átlagosan 100 Hz, nőinél 180 Hz, gyermeknél 400 Hz.
- Hallástartomány
-
Az a frekvenciatartomány, amin belül az emberi fül az akusztikus jeleket (beszédet, zenét, zajokat) érzékeli. Az ember hallástartománya 20 Hz-től 20000 Hz-ig terjed. Ezen belül van a beszédhallás tartomány, ami 50 Hz-től 12000 Hz-ig terjed. Idős korra gyakran jelentősen szűkül a hallástartomány.
- Hangátmeneti fázis
-
A beszédhangoknak három része van: két hangátmeneti rész, valamint a tiszta fázis (a hang közepe). A beszédhangok a hangátmeneti részeikkel csatlakoznak a szomszédos beszédhanghoz. Mindezek szorosan összefüggnek az artikulációs szervek folyamatos mozgásával. A hangátmeneti fázis a koartikuláció következménye.
- Hanghatár
-
A beszédhang kezdete és vége. Ezt általában a spektrumban vagy a hullámformában szokták megjelölni beszédtechnológiai célzattal.
- Hang jelölések
-
A beszédhangoknak általánosan valamilyen írásjelek felelnek meg. Az írásjelek pedig nyelvfüggő egységek. Ezért vezették be a nemzetközi beszédhang jelölési rendszert 1889-ben (International Phonetic Alphabet, IPA), amelyben a hangokat függetlenül az írásjelektől egyértelműen definiálni lehet grafikai jelekkel. A számítógépes hangjelölésekre hozták létre a SAMPA hangjelölési rendszert 1989-ben.
- Hangsebészet
-
A beszéd időfüggvényében végzett emberi beavatkozás, aminek hatására a beszéd minősége megváltozhat (például hangcserével jelentés csere jön létre). A hangsebészet számítógépes beavatkozás.
- Hangspektrogram
-
A beszéd frekvencia- és intenzitás-összetevőinek képi megjelenítése az idő függvényében három dimenziós képen. Ezt a képi megjelenítést nevezzük hangszínképnek, vagy „látható beszéd"-nek is. A hangspektrogra vízszintes tengelye az időskála, a függőleges tengelyén látható a frekvencia. A harmadik dimenzió az adott frekvencia elem intenzitása, aminek fokát színnnel fejezik ki.
- Hangzósság
-
Egy beszédhang relatív hangereje a többi hanghoz képest az adott közlésen belül. A beszédhangok relatív intenzitását a hangzóssági skálán fejezik ki. A leghagzósabb magyar beszédhang az á magánhangzó, a legkevésbé hangós a h mássalhangzó.
- IPA
-
Nemzetközi fonetikai abc a beszédhangok egyértelmű írott jelölésére grafikai jelekkel (International Phonetic Alphabet). Az IPA jelek ACSII átírása a SAMPA jelölési rendszer, amit számítógépes használatra fejlesztettek ki és a billentyűzettel adhatók meg.
- Képzési mód
-
A gége és az artikulációs szervek felhasználási módjai a beszédhangok képzése során. A magyar beszédben ilyenek például: orális-, nazális zöngés képzési mód, nem zöngés képzés, rés képzés, zár képzés, a nyelvhegy pergetése, a nyelv függőleges és vízszintes helyzete, az ajkak csücsörítése, az állkapocs nyitása stb.
- Képzési hely
-
A beszédhang képzésének jellemző helye az artikulációs csatornában. A magyar mássalhangzók képzési helyei: két ajak (bilabiális: b, p, m), alsó ajak+felső fogsor (labio-dentális: v, f), Fogmeder+nyelvhegy (denti-alveoláris: d, t, sz, z, c, dz, n, l, r), a szájpad elülső része (alveoláris: s, zs, cs, dzs), kemény szájpad (palatális: ny, gy, ty, j), lágy szájpad (veláris: g, k), gége (larinx: h)
- Koartikuláció
-
Az artikuláció a beszédképzés során folyamatos. Két beszédhangot a képzés szintjén a koartikuláció köt össze, vagyis az az artikulációs mozgássor, ami a két hangra jellemző artikulációs konfiguráció között zajlik le. A koartikulációból következik, hogy a beszédhangokra jellemző rezgésformák folyamatos átmeneti formákkal csatlakoznak egymáshoz, ezeket a beszédszakaszokat nevezik hangátmeneteknek. A hangátmenet tehát a koartikuláció következménye. A koartikuláció el is tolhatja a szomszédos hang jellemző képzési helyét. A palatális mássalhangzók ilyenek, magukhoz illesztik az őket megelőző, illetve követő egyes magánhangzók F2 formánsait.
- Néma fázis
-
A zöngétlen zárhangok (p, t, k, ty) és zár-rés hangok (c, cs) első képzési része, amelyben nincs hangkiáramlás a zár miatt. A tüdőből kiáramlandó levegő a toldalékcsőben képzett akadály miatt feltorlódik és a zárfelpattanásig levegőáram nem hagyja el az artikulációs csatornát. Ilyenkor a beszédjel amplitúdója nulla. A néma fázis a magyar beszédhangoknál 50-150 ms között van.
- Periódusidő
-
A periodikus hangrezgés egy periódusának időtartama (T0). Ha a beszélő személy alapfrekvenciája 100 Hz (például férfi zönge), akkor a periódusidő 10 ms. Képlettel kifejezve:T0=1/F0
- Prozódia
-
A beszéddallam, a hangsúly és a ritmus összefoglaló kifejezése. Lényegesen járul hozzá az emberi beszéd megszokott hangzásához, a mondatfajták hangzó kialakításához.
- Rezonancia-frekvencia
-
Az a frekvenciaérték, aminél egy test egy másik test által keltett rezgéstől saját maga is rezgésbe jön és ezzel a korábbi rezgés amplitúdója megnövekszik. Az artikulációs csatorna rezonancia frekvenciáin felerősödnek a zönge hang ugyanazon, vagy közel ugyanazon frekvenciával rendelkező felharmonikusai, ezzel intenzitásuk megnő. Ezeket a nagyobb energiájú felhang nyalábokat nevezik formánsoknak.
- SAMPA
-
A SAMPA egy beszédhang jelölési rendszer, amely a beszédhangok egyértelmű számítógépes jelölésére szolgál ASCII kódokkal.
- Specifikus időtartam
-
A beszédhangra jellemző elméleti időtartam, amely a hangot megelőző és követő hang függvényében alakul ki a folyamatos beszédben.
- Spektrum
-
A beszédhang hullámforma összetevőinek frekvenciáit, amplitúdóit és fázisait meghatározó adatok összessége. A zöngés beszédhangok esetében a spektrum vonalas képet mutat. Ez azt jelenti, hogy csak a felharmonikusok frekvencia értékeinél van tartalom. A zörejes hangok esetében a spektrum folytonos, mivel ezekben a hangokban nincsenek felharmonikusok. A spektrum időbeni változását mutatja a hangspektrogram (látható beszéd).
- Szegmentális szerkezet
-
Elméleti fogalom. A beszéd artikulációs, idő- és intenzitásszerkezetének alapformáit összegző kifejezés. Más szóval: a beszéd alapelemeit jelenti a prozódiai elemek nélkül, tehát a beszédhangok, a hangátmenetek, a specifikus hangidőtartamok és a specifikus hangintenzitások. Szegmentális szerkezetű beszéd a gyakorlatban csak beszédtechnológiai eszközökkel hozható létre.
- Szupraszegmentális szerkezet
-
Elméleti fogalom. A komplex beszédjelnek azon része, amely a beszéd dallamát, hangsúlyviszonyait, tempóját, ritmusát, hangerősségét és hangszínezetét, vagyis a komplex prozódiai szerkezetet foglalja magában. Az emberi ejtésű beszédben a szegmentális- és a szupraszegmentális szerkezet egyszerre képződik.
- Tiszta fázis
-
A beszédhangoknak három része van: két hangátmeneti rész, valamint a tiszta fázis (a hang középső része). Akusztikailag a tiszta fázis jellemzi legpontosabban az adott beszédhangot.
- Triád
-
Olyan 3 elemű beszédhang kapcsolat, amelyben a középső hang egészben, a két szélső pedig felében van jelen. Beszédszintézisnél használják, mint hangsor építő elemet. Általában CVC triádokat készítenek.
- V
-
A magánhangzó rövidített jelölése a beszéd tudományokban (Vowel). A mássalhangzóknál a C jelölést használják (Consonant).
- Zárfelpattanás
-
A zárhangok képzésének utolsó része, amikor az artikulációs csatornában képzett zárat feloldja a beszélő. A zárfelpattanás gyorsan zajló folyamat (10-40 ms).
- Olyan 3 elemű beszédhang kapcsolat, amelyben a középső hang egészben, a két szélső pedig felében van jelen. Beszédszintézisnél használják, mint hangsor építő elemet. Általában CVC triádokat készítenek.
- Zárhang
-
A zárhagok képzése két szakaszból áll: zárképzés és zárfeloldás. A magyar zárhangok a betű jeleikkel megadva a következők: b, p, d, t, g, k, gy, ty.
- Zár-rés hang
-
Olyan másslhangzók amelyek képzése két szakaszból áll: zár képzés és rés képzés. A magyar zár-rés hangok a betű jeleikkel megadva a következők: c, dz, cs, dzs.
- Zönge
-
A hangszalagok rezgéséből létrejött, gége szintű periodikus, trapézhoz hasonló hulláformájú jel. Alaphangnak is szokták nevezni.
A zönge megléte az alapja a beszédnek. A zönge amplitúdója határozza meg a beszéd hangerejét. A zönge mindenkori frekvenciája adja a beszélő alapfrekvenciáját. Ezt F0-al jelölik Értéke: férfi beszélőnél átlagosan 100 Hz, nőinél 180 Hz, gyermeknél 400 Hz. A zönge frekvenciájának folyamatos változtatásával hozzuk létre a beszéd dallamát. A hangsúly kialakításában is lényeges szerepe van.