Originalie 303

Stimmprofile zur Normalstimme auf der Grundlage akustischer und elektroglottografischer Analysen Acoustic- and EGG-parametrisations of Phonatory Quality Provide Voice Profiles of Normal Speakers

Institute

Schlüsselwörter ▶ Elektroglottografische ● Stimmanalyse ▶ akustische Stimmanalyse ● ▶ multiparametrische ● Stimmqualitätserfassung ▶ geschlechtsspezifische ● Subgruppendefinition zur Normalstimme ▶ Stimmprofile ● Key words ▶ electroglottographic voice ● analysis ▶ acoustic voice analysis ● ▶ multi-parameter voice ● quality categorisation ▶ subgroup classification of ● normal phonation ▶ voice profiles ●

M. Pützer1, W. Wokurek2 1 2

Institut für Phonetik, Universität des Saarlandes, Saarbrücken Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart, Stuttgart

Zusammenfassung



Hintergrund: Die vorliegende Studie beschäftigt sich mit der Dimensionierung normalstimmlicher Phonation. Es wird allgemein akzeptiert, dass diese Dimensionierung mit einer großen Bandbreite einhergeht. Material und Methoden: Unter komplementärer Verwendung akustischer und elektroglottografischer Analysemethoden zur Parametrisierung von Stimmqualität werden gehaltene Vokalproduktionen von 267 männlichen und 267 weiblichen Sprechern analysiert. Clusterverfahren dienen auf der Grundlage dieser Analyseergebnisse zur Definition geschlechtsspezifischer Subgruppen.

Einleitung



eingereicht 08. April 2014 akzeptiert 02. Juni 2014 Bibliografie DOI http://dx.doi.org/ 10.1055/s-0034-1382058 Online-Publikation: 25.9.2014 Laryngo-Rhino-Otol 2015; 94: 303–310 © Georg Thieme Verlag KG Stuttgart · New York ISSN 0935-8943 Korrespondenzadresse Prof. Manfred Pützer Institut für Phonetik Universität des Saarlandes Campus Geb. C7.2 66123 Saarbrücken [email protected]

Bei der instrumentellen Beurteilung normalstimmlicher Phonation kann die Suche nach phonetisch differenzierten Stimmprofilen für die männliche und weibliche Normalstimme hilfreich für die Einschätzung und Bewertung von individueller Stimmqualität sein [1–3]. Differenzierte Stimmprofile mit ihren statistisch gewonnenen mittleren Parameterwerten können nämlich als Referenzstimmprofile verstanden werden, mit denen individuelle Analysedaten mit pathologischem oder sog. normalem Hintergrund verglichen und im Grad und in der Art ihrer Abweichung erfasst werden können [4–7]. Stimmprofile werden somit durch eine Reihe von Messparametern repräsentiert, die zusammen als Referenzprofile zum einen stimmliche Gemeinsamkeiten einer Gruppe von Individuen charakterisieren, zum andern aber auch als Individualprofile die jeweilige Stimme einzelner Personen beschreiben [8, 9]. Folglich ist ihre Erstellung in parameterbezogener Hinsicht jeweils mit dem Prinzip der Multidimensionalität verbunden. Dieses Prinzip ist dem Grundgedanken ver-

Ergebnisse: Zunächst werden für beide Geschlechter getrennt sowohl auf der Basis der elektroglottografischen als auch der akustischen Analyse 3 stabile Subgruppen geliefert. Diese Subgruppendefinition ermöglicht darüber hinaus durch eine Kombination der Parametermittelwerte beider Analyseverfahren die Darstellung von Stimmprofilen. Schlussfolgerungen: Die präsentierten Stimmprofile sollen als Referenzstimmprofile eine solidere Basis zur Klassifikation verschiedener normalstimmlicher und pathologischer Phonationstypen liefern und darüber hinaus dazu dienen, Veränderungen des individuellen Phonationsverhaltens aufgrund von therapeutischen Ansätzen oder spontaner Genesung evaluieren zu können.

pflichtet, dass das „Phänomen Stimme“ ein sehr komplexes Gebilde ist und sich aus verschiedenen Dimensionen zusammensetzt, deren einzelne Existenz, besonders aber deren Interaktion die nichtpathologische und pathologische Stimmqualität ausmachen [10]. Ein weiterer wichtiger Grund, verschiedene Stimmprofile anhand einer Gruppe von Normalsprechern zu betrachten, besteht in der Erkenntnis, dass die Dimensionierung normalstimmlicher Phonation mit einer großen Bandbreite einhergeht. Da diese Situation auch auf pathologische Stimmen zutrifft, erscheint eine kategorienbezogene Differenzierung zwischen den beiden Phonationsgruppen schwierig bzw. kaum möglich. Dieser Standpunkt wird in zurückliegenden Studien ebenfalls vertreten, in denen sowohl bei Normalstimmen [4] als auch bei pathologischen Stimmen eine große Bandbreite dokumentiert wird [11, 12]. Folglich wird in diesen Studien von einer Überlappung zwischen normalstimmlicher und pathologischer Phonation berichtet. Begründet liegt diese Tatsache in der Einschätzung, dass zum einen unterschiedliche (patho)physiologi-

Pützer M, Wokurek W. Stimmprofile zur Normalstimme auf … Laryngo-Rhino-Otol 2015; 94: 303–310

Heruntergeladen von: University of Pennsylvania Libraries. Urheberrechtlich geschützt.

Autoren

304 Originalie

zu phonieren. Sie wurden simultan mit dem EGG-Signal in einem schallarmen Untersuchungsraum aufgezeichnet.

Die Aufzeichnungen wurden mit dem kommerziell erhältlichen Sprachverarbeitungssystem „Computerized Speech Lab (CSL), Modell 4300B“, der Firma Kay Elemetrics Corp. unter Verwendung eines Nacken-Kondensatormikrophons (NEM 192.15, beyerdynamic) gemacht, wobei die beiden Signale mit einer Abtastrate von 50 KHz und einer Amplitudenauflösung von 16 Bit digitalisiert wurden. Durch die Verwendung des Nackenmikrophons war der für den interindividuellen Vergleich des akustischen Signals unbedingt zu beachtende Abstand des Mikrophons zum Mund der Probanden gewährleistet [13]. Bei den zur Analyse aufbereiteten akustischen und elektroglottografischen Signalen, die durchschnittlich eine Dauer von 2 s aufwiesen, wurde darauf geachtet, dass eine Sekunde aus der Mitte der Vokalproduktion vorlag [14]. b

c

a

e

d

f

e

t

t

t

t

t

t

t

Zeit

T0

Abb. 1 Phasen und Signalabschnitte der EGG-Einzelkurve.

Analyse der Daten Material und Methoden



Personen Eine Gruppe von 534 stimmgesunden erwachsenen Personen (267 männliche und 267 weibliche) ohne bekannte Sprech- bzw. Hörprobleme mit einer geschlechtsspezifisch ausgeglichenen Altersstruktur (18–65 Jahre) wurden zur Analyse ausgesucht. Das mittlere Alter der Gruppe betrug 38 Jahre. Die Einordnung der Probanden als normalstimmlich erfolgte nach einer auditiven sowie laryngoskopischen Bewertung ihres aktuellen stimmlichen Status durch einen Phoniater und durch einen klinisch tätigen wissenschaftlichen Mediziner und Phonetiker. Für die akustische Analyse konnten allerdings bei der Phonationsgruppe der Männer nur 153 Sprecher und bei die Phonationsgruppe der Frauen nur 203 Sprecherinnen (insgesamt 356 Personen) in der Untersuchung berücksichtigt werden. Bei den Analysen hat sich nämlich herausgestellt, dass die Signale von 114 männlichen und 64 weiblichen Personen mit der hier verwendeten Methode nicht bearbeitet werden konnten, da die erforderliche harmonische Struktur nicht vorlag. Die elektroglottografische Analyse basiert hingegen auf den Signalen aller 534 Probanden.

Sprachdaten Bei den analysierten Produktionen der jeweiligen Probanden handelt es sich um die in mittlerer Stimmlage einmal isoliert gehaltenen Vokale [i:, a:, u:]. Die Probanden wurden gebeten, die Vokale in der für sie normalen Sprechlautstärke (ungefähr 60 dB Schallintensität bezogen auf 10 − 12 W/m2 ohne Bewertungsfilter)

Zur Analyse der Stimmqualität wurde sowohl das elektroglottografische als auch das akustische Zeitsignal herangezogen. Für das elektroglottografische Signal wurde die Methode zur Quantifizierung der EGG-Einzelkurve von Marasek berücksichtigt [15]. Bei dieser Methode geht man davon aus, dass wichtige Informationen über den Phonationsprozess nicht nur in der relativen Dauer der verschiedenen Phasen der glottalen Periode enthalten sind, sondern auch in der Gestalt der gesamten EGGSchwingung. Als Hauptmerkmal für den Beginn der EGG-Perio▶ Abb. 1) gilt das Maximum der ersten de (siehe Punkt t0 in ● Signalableitung. Das gewonnene Signal erreicht seinen höchsten Wert beim maximalen Kontakt der Stimmlippen. Die Beschreibung der einzelnen Schwingungsperioden ist am 2-PhasenModell der Stimmlippenschwingungen und an dem von Rothenberg 1981 entwickelten Modell des Flächenkontakts der Stimmlippen orientiert [16]. Dieses Modell beinhaltet eine Aufteilung der Einzelperiode des EGG-Signals in 6 Phasen vom Zeitpunkt ▶ Abb. 1 des Schließens bis zum Ende der offenen Phase. In der ● werden diese Phasen durch die Segmente a–f verdeutlicht [17]. Zur Verdeutlichung der bei der Parametrisierung berücksichtigten Variabilität in den Phasen des Verschlusses, ausgedrückt durch die Parameter SCV, ECV und CV bzw. in den Phasen der Öffnung, ausgedrückt durch die Parameter SOV, EOV und OV ▶ Abb. 2. dient die ● In ihr werden die den Variabilitätsberechnungen zugrunde liegenden Flächen (schwarze Flächen) dargelegt. Diese ergeben sich aus der Distanz zwischen dem Signalverlauf und der geraden ▶ Abb. 1. Die Berechnung der ParameLinie (schwarze Linie) in ● terwerte besteht in der Division der jeweils unterschiedlichen Flächeninhalte durch die Dauer der entsprechenden Phasen.

Pützer M, Wokurek W. Stimmprofile zur Normalstimme auf … Laryngo-Rhino-Otol 2015; 94: 303–310

Heruntergeladen von: University of Pennsylvania Libraries. Urheberrechtlich geschützt.

Aufzeichnungsmodus

Kontaktfläche

sche Vorgänge zur gleichen phoniatrischen Klassifikation gehören und in der Folge ein vergleichbares akustisches bzw. quellensignalbezogenes Output liefern können, während zum andern unterschiedliche Larynxsignale bzw. akustische Signale von den gleichen (patho)physiologischen Verhältnissen stammen können. Die Zielsetzung der vorliegenden Studie besteht zunächst darin, die oben erwähnte große Bandbreite normalstimmlicher Phonation anhand einer clusterbasierten Definition von Subgruppen unter Verwendung einer großen Anzahl normalstimmlicher Sprecher instrumentell zu belegen. Darüber hinaus verfolgt die Studie das Ziel, Stimmprofile (Referenzprofile) für die normalstimmliche Phonation auf der Basis dieser Subgruppendefinition zu etablieren. Zur Realisierung dieser Zielsetzung wird auf eine seit dem Jahre 2005 bestehende Datenbank zur normalstimmlichen und pathologischen Stimmqualität (www.stimm datenbank.coli-uni-saarland.de) zurückgegriffen. Sie enthält u. a. Vokalproduktionen von mehr als 2 200 Sprechern (ungefähr 900 als sog. Normalstimmen und 1 350 als pathologisch klassifizierte Stimmen). Die Subgruppendefinition und die Spezifizierung von Stimmprofilen werden auf der Basis elektroglottografischer und akustischer Analyseergebnisse vollzogen. Die die Studie abschließende Diskussion legt ihren Fokus auf die Wertigkeit und Zweckmäßigkeit der Subgruppendifferenzierung innerhalb der normalstimmlichen Phonation und den daraus resultierenden Stimmprofilen (Referenzprofilen) unter Betrachtung der anhand dieser Profile sich ergebenden Möglichkeit einer prospektiven Evaluation bei Veränderungen normalstimmlicher und pathologischer Phonationsqualität.

In der vorliegenden Studie werden 7 der 22 Analyseparameter berücksichtigt. Diese Parameter haben sich als diejenigen mit dem größten Differenzierungspotenzial herausgestellt [9]. Die Parameterselektion basierte unter Verwendung einer großen Datenmenge auf statistischen Methoden (Hauptkomponentenanalyse u. a.). Die Parameter quantifizieren die folgenden Aspekte der EGG-Kurve: 1. Öffnungsquotient (Parameter OQ); 2. Variabilität in der Startphase der Schließungsbewegung (Parameter SCV); 3. Steilheit der Startphase der Schließungsbewegung (Parameter SCA); 4. Variabilität in der Endphase der Schließungsbewegung (Parameter ECV); 5. Variabilität in der Kontaktphase (Parameter CV); 6. Steilheit der gesamten Schließungsbewegung (Parameter CLA); 7. Steilheit der gesamten Öffnungsbewegung (Parameter OPA). Über die Relevanz der Parameter zur Differenzierung von Stimmqualität ist bereits in einigen zurückliegen▶ Tab. 1 wird den Studien berichtet worden [5, 18–22]. In der ● ein Überblick über den elektroglottografischen Analyseansatz gegeben. Dabei werden die oben erwähnten Parameter und ihre ▶ Abb. 1 anhand Berechnung angeführt [18]. Diese kann in der ● der annotierten Phasen innerhalb des Phonationszyklus nachvollzogen werden. Weitere Details zur EGG-Analyse und zu den anderen nicht berücksichtigten Parametern sind bereits publiziert worden [15, 17, 18]. Das akustische Zeitsignal ist unter Verwendung einer von Wokurek und Pützer angepassten Methode analysiert worden [23, 24]. Sie basiert auf der Beobachtung von Stevens und Hanson [25], dass die Stimmeigenschaften Öffnungsquotient, Grad der glottalen Öffnung, Schiefe des Anregungsimpulses und Verschlussrate das Anregungsspektrum jeweils in einem bestimmten Frequenzbereich dominant beeinflussen. Deshalb werden

Kontaktfläche

CV

ECV

SOV

EOV

SCV

OV

Zeit Abb. 2 Variabilitätsparameter zu den Phasen des Verschlusses und der Öffnung.

die Stimmqualitätsparameter durch den geeigneten Vergleich verschiedener höherer harmonischer Schwingungen mit der Grundschwingung berechnet (geschätzt). Ursprünglich wurden die Stimmqualitätsparameter durch die Dezibel-Abstände zwischen der korrigierten Grundwelle H1~ und den korrigierten spektralen Amplituden der zweiten Harmonischen H2~ und der Harmonischen bei den 3 Formanten A1~, A2~ und A3~ definiert und berechnet. Diese Vorgehensweise ist angemessen, wenn immer derselbe Vokal wie z. B. [a:] untersucht wird. Jede abweichende Artikulation verschiebt aber die Formanten und führt selbst bei unveränderter Stimme zu veränderten Stimmqualitätsparametern. Eine Vergrößerung der Formantfrequenz bringt höherfrequente, also tendenziell schwächere Teile des Anregungsspektrums in die Berechnung und vergrößert so den entsprechenden „Stimmqualitätsparameter“. Um diese Form der Vokalabhängigkeit aus den Stimmqualitätsparametern zu eliminieren, werden in der vorliegenden Arbeit spektrale Abstiegsgradienten anstelle der Amplitudendifferenzen verwendet. Dazu wird der Amplitudenabstieg durch den Frequenzabstand geteilt. Beim Vergleich von linearem-, logarithmischem- und Bark-Frequenzabstand zeigte der in Bark gemessene Frequenzabstand die besten statistischen Resultate. Die spektralen Gradienten entsprechen der abfallenden Stei▶ Abb. 3 gezeigten Dreiecke und haben die Einheit gung der in ● Dezibel/Bark. Das 1. Dreieck wird über dem Frequenzintervall zwischen der Grundfrequenz (erste Harmonische) und der doppelten Grundfrequenz (zweite Harmonische) errichtet. Sein Abstiegsgradient wird nach Stevens und Hanson [25], Sluijter [26] und Claßen et al. [27] mit dem Öffnungsquotienten in Verbindung gebracht und hier als Parameter OQG (opening quotient gradient) bezeichnet. Das 2. Dreieck wird über dem Frequenzintervall zwischen der Grundfrequenz und der Harmonischen mit der höchsten Amplitude nächst dem ersten Formanten errichtet. Sein Abstiegsgradient wird nach Stevens und Hanson [25], Sluijter [26] und Claßen et al. [27] mit der glottalen Öffnung in Verbindung gebracht und hier als Parameter GOG (glottal opening gradient) bezeichnet. Das 3. Dreieck wird über dem Frequenzintervall zwischen der Grundfrequenz und der Harmonischen mit der höchsten Amplitude nächst dem zweiten Formanten errichtet. Sein Abstiegsgradient wird nach Claßen et al. [27] als Parameter der Steilheit des glottalen Anregungsimpulses SKG (skewness gradient) bezeichnet. Das 4. Dreieck wird schließlich über dem Frequenzintervall zwischen der Grundfrequenz und der Harmonischen mit der höchsten Amplitude nächst dem dritten Formanten errichtet. Sein Abstiegsgradient wird nach Claßen et al. [27] als Parameter der Verschlussrate RCG (rate of closure gradient) bezeichnet. Bei diesen Parameternamen deutet die Endung G (gradient) immer nur auf die Art der Definition des Parame-

Analyseansatz

Parameter

Parameterberechnung

Öffnungsquotient Verschlussphase

OQ SCV SCA ECV CLA CV OPA

(tf- tc)/T0 × 100 (Segmente d + e + f) te bis tf (Segment f): Variabilität te bis tf (Segment f) (Amplitude (tf-te)/Dauer (te bis tf)) t0 bis ta (Segment a): Variabilität te bis ta (Segmente f + a) (Amplitude (ta-te)/Dauer (te bis ta)) ta bis tb (Segment b): Variabilität tb bis td (Segmente c + d) (Amplitude (tb-td)/Dauer (tb bis td))

Kontaktphase Öffnungsphase

Tab. 1 Analyse des EGG-Signals.

Analyseansatz, Parameter und Parameterberechnung: OQ = Öffnungsquotient, SCV = Variabilität in der Startphase der Schließungsbewegung, SCA = Steilheit der Startphase der Schließungsbewegung, ECV = Variabilität in der Endphase der Schließungsbewegung, CLA = Steilheit der gesamten Schließungsbewegung, CV = Variabilität in der Kontaktphase, OPA = Steilheit der gesamten Öffnungsbewegung

Pützer M, Wokurek W. Stimmprofile zur Normalstimme auf … Laryngo-Rhino-Otol 2015; 94: 303–310

Heruntergeladen von: University of Pennsylvania Libraries. Urheberrechtlich geschützt.

Originalie 305

ters im Spektrum hin und soll nicht fälschlich als Gradient des Parameters selbst gelesen werden. Je unvollständiger der Glottalverschluss stattfindet, umso größer ist der Energieverlust der Schwingung des ersten Formanten im subglottalen Raum und umso größer ist daher auch dessen Bandbreite. Um den Einfluss der Vokalqualität zu verkleinern, wird hier die auf die Frequenz des ersten Formanten bezogene Bandbreite als Maß für die Unvollständigkeit des Glottalverschlusses IC = B1/F1 (incompleteness of closure) verwendet. Die 5 berücksichtigten Stimmqualitätsparameter betreffen also den Öffnungsquotienten (OQG), den Grad der Glottisöffnung (GOG), die Steilheit der Glottiswelle (SKG), die Geschwindigkeit des glottalen Verschlusses (RCG) sowie die Unvollständigkeit des glottalen Verschlusses (IC) und sind so gewählt, dass die Ausprägung des jeweiligen Merkmals mit dem Zahlenwert wächst. Weitere Details zu dieser Methode der akustischen Stimmqualitätsanalyse sind bereits publiziert worden [12, 24]. Die Daten wurden nach Geschlechtern getrennt analysiert. Diese Vorgehensweise ist an zurückliegenden Studien orientiert, in denen im Hinblick auf Charakteristika des Quellensignals Unterschiede zwischen der männlichen und weiblichen Phonation nachgewiesen werden [3, 4, 9, 28, 29].

Schritt 3 Clusterzentrenanalysen unter Berücksichtigung aller 7 EGGund 5 Akustik-Parameter zur Definition von Subgruppen innerhalb der Geschlechter. Die Clusteranzahl wurde unter Berücksichtigung einer hierarchischen Clusteranalyse anhand einer reduzierten Stichprobe festgelegt. Schritt 4 Diskriminanzanalysen zur Bestimmung der Parameter, die für die Erklärung der durch die Clusteranalysen erhaltenen Modelle der Subgruppen am besten geeignet sind (Schrittweise Methode). Schritt 5 Geschlechtsspezifische Mittelwertberechnungen (mit Standardabweichungen) für die Parameter, mithilfe derer die Subgruppen innerhalb des Modells am besten erklärt werden können.

Statistik

Subgruppen zu männlichen und weiblichen Normalstimmen

Die statistische Bearbeitung der Analysedaten wurde mit SPSS Version 20 vollzogen. Sie beinhaltet die folgenden Schritte: Schritt 1 Homogenitätstest der Varianzen (Levene-Test). Schritt 2 Korrelationsanalysen (nach Pearson) zwischen den abhängigen Variablen (akustische und elektroglottografische Parameter) beider Analysemethoden.

OQ

GO

SK

RC

H1~

S/dB

H2~

A1P~

A2P~ A3P~

F0P

2F0P

F1P

F2P

F3P

f/Hz Abb. 3 Definition der Stimmqualitätsparameter als spektrale Abstiegsgradienten (Hypotenuse der Dreiecke z. T. verdeckt: H1~ = Bezugspunkt für verdeckten Teil der Hypotenuse).

Analyseansatz

Parameter

Wilks-Lambda

Verschlussphase

SCV ECV CLA CV OPA

0,195 0,164 0,143 0,156 0,141



Korrelationen Zwischen den abhängigen Variablen beider Analysemethoden können keine signifikanten Korrelationen herausgestellt werden.

Im Folgenden werden jeweils 3 Subgruppen zur männlichen und weiblichen Normalstimme präsentiert. Sie basieren auf signifikant unterschiedlichen Mittelwertausprägungen bei den Parametern und werden durch eine Clusterzentrenanalyse definiert. Darüber hinaus wird das durch die Clusteranalyse erhaltene Modell durch eine Diskriminanzanalyse unter Verwendung der schrittweisen Methode evaluiert (Korrektheit der Klassifikation in Subgruppen > 95 %). Dadurch können die Qualität der durch die Clusteranalysen ermittelten Gruppierungen überprüft und die für die Differenzierung der Subgruppen am besten geeigneten Parameter ermittelt werden. Die Mittelwerte (mit Standardabweichung) dieser Parameter sowie der jeweilige ▶ Tab. 2 (Männer) und 3 Wilks-Lambda-Wert werden in den ● (Frauen) für die elektroglottografische Analyse und 4 (Männer) und 5 (Frauen) für die akustische Analyse angeführt. Die Subgruppen spiegeln das Ausmaß individueller phonatorischer Variation wider [12]. Jede Subgruppe wird durch mind. 4 EGGParameter und 3 Akustik-Parameter definiert. ▶ Tab. 2 und 3) betreffen die VerschlussDie EGG-Parameter (● phase, die Kontaktphase und die Öffnungsphase. Diese sind bedeutende Phasen innerhalb des phonatorischen Zyklus. Die normalstimmlichen Subgruppen deuten auf unterschiedliche Phonationsqualitäten hin.

Gruppen 1 (n = 128 )

Kontaktphase Öffnungsphase

Ergebnisse

1 081,39 (361,08) 1 160,69 (301,94) 637,43 (296,57) 1 460,16 (297,25) − 124,82 (39,05)

2 (n = 27) 2 103,16 (398,34) 1 679,72 (340,99) 529,58 (250,19) 2 398,88 (497,29) − 133,60 (38,67)

3 (n = 112) 512,37 (227,11) 652,18 (225,95) 224,45 (155,16) 885,18 (218,25) − 60,05 (25,92)

Parameter; Wilks-Lambda; Mittelwert und Standardabweichung; Subgruppendifferenzierung, p < 0,001; Korrektheit der Klassifikation 97 %; SCV = Variabilität in der Startphase der Schließungsbewegung, ECV = Variabilität in der Endphase der Schließungsbewegung, CLA = Steilheit der gesamten Schließungsbewegung, CV = Variabilität in der Kontaktphase, OPA = Steilheit der gesamten Öffnungsbewegung

Pützer M, Wokurek W. Stimmprofile zur Normalstimme auf … Laryngo-Rhino-Otol 2015; 94: 303–310

Tab. 2 Subgruppen zur männlichen Normalstimme (EGGAnalyse).

Heruntergeladen von: University of Pennsylvania Libraries. Urheberrechtlich geschützt.

306 Originalie

Originalie 307

Analyseansatz

Parameter

Wilks-Lambda

Verschlussphase

SCV SCA CV OPA

0,176 0,232 0,159 0,131

Gruppen 1 (n = 85 )

Kontaktphase Öffnungsphase

2 (n = 117)

570,16 (370,01) 2 292,17 (655,14) 1 699,07 (379,25) − 142,51 (30,23)

3 (n = 65)

984,35 (433,52) 628,01 (427,31) 1 080,20 (242,27) − 107,12 (27,36)

1 863,72 (539,82) 769,30 (410,60) 1 798,63 (393,33) − 150,43 (29,05)

Tab. 3 Subgruppen zur weiblichen Normalstimme (EGGAnalyse).

Parameter; Wilks-Lambda; Mittelwert und Standardabweichung; Subgruppendifferenzierung, p < 0,001; Korrektheit der Klassifikation 95,5 %; SCV = Variabilität in der Startphase der Schließungsbewegung, SCA = Steilheit der Startphase der Schließungsbewegung, CV = Variabilität in der Kontaktphase, OPA = Steilheit der gesamten Öffnungsbewegung

Parameter

Wilks-Lambda

Gruppen 1 (n = 29 )

Öffnungsquotient Grad Glottisöffnung Geschwindigkeit glottaler Verschluss

OQG GOG RCG

0,411 0,460 0,245

4,52 (1,70) − 4,54 (1,35) − 0,91 (0,40)

2 (n = 71)

3 (n = 53)

5,02 (1,51) − 0,52 (1,15) − 0,55 (0,40)

1,89 (1,34) − 2,15 (1,68) − 0,95 (0,41)

Tab. 4 Subgruppen zur männlichen Normalstimme (akustische Analyse).

Parameter; Wilks-Lambda; Mittelwert und Standardabweichung; Subgruppendifferenzierung, p < 0,001; Korrektheit der Klassifikation 96,7 %; OQG = Öffnungsquotient, GOG = Grad der Glottisöffnung, RCG = Geschwindigkeit des glottalen Verschlusses

Analyseansatz

Parameters

Wilks-Lambda

Öffnungsquotient Grad Glottisöffnung Steilheit Glottiswelle

OQG GOG SKG

0,264 0,268 0,232

Gruppen 1 (n = 42 ) 2,24 (1,01) − 0,60 (1,03) − 0,42 (0,69)

2 (n = 77) − 0,41 (0,78) − 0,11 (0,96) − 1,77 (0,63)

3 (n = 84) 0,79 (0,84) 1,27 (0,64) − 0,37 (0,54)

Tab. 5 Subgruppen zur weiblichen Normalstimme (akustische Analyse).

Parameter; Wilks-Lambda; Mittelwert und Standardabweichung; Subgruppendifferenzierung, p < 0,001; Korrektheit der Klassifikation 97,5 %; OQG = Öffnungsquotient, GOG = Grad der Glottisöffnung, SKG = Steilheit der Glottiswelle

Bei den 3 männlichen Subgruppen deuten die Parameterwerte auf ein unterschiedliches Adduktionsverhalten der Stimmlippen hin: Während für die Gruppe 3 ein geringes Ausmaß zu erkennen ist, kann der Gruppe 1 ein mittleres Ausmaß und der Gruppe 2 ein hohes Ausmaß zuerkannt werden. Anhand der Parameter SCV (Startphase der Schließungsbewegung), ECV (Endphase der Schließungsbewegung), CV (Verschlussphase) und CLA (Steilheit der gesamten Schließungsbewegung) lässt sich dieses Ausmaß instrumentell einschätzen: Die Mittelwerte (und Standardabweichung) der Parameter SCV, ECV und CV sind in allen Gruppen unterschiedlich. Der CLA-Parameter weist in den Gruppen 1 und 2 in etwa gleiche Werte auf. Durch den einzigen die Abduktion betreffenden Parameter (Parameter OPA = Steilheit der gesamten Öffnungsbewegung) können die Gruppen 1 und 2 gegenüber der Gruppe 3 (reduzierte Abduktion) opponiert werden. Eine auf dem RBH-System [30] basierende auditive Einschätzung der Stimmqualität lässt Angehörigen der dritten Subgruppe mehr Behauchtheitsanteile zukommen als denjenigen der Subgruppen 1 und 2. Behauchtheitsanteile bei der Phonation korrelieren mit dem Ausmaß des Adduktionsverhaltens der Stimmlippen. Bei den weiblichen Subgruppen spiegeln die Parametermittelwerte der Angehörigen der Gruppe 3 im Vergleich zu den beiden anderen Gruppen den regulärsten Phonationsablauf wider. Die höheren Parameterwerte für die Verschlussphase (Parameter SCV), die Kontaktphase (Parameter CV) und für die Öffnungs▶ Tab. 3). phase (Parameter OPA) belegen diese Einschätzung (● Die auditive Einschätzung der Stimmqualität für die Mitglieder dieser Gruppen bestätigt durch eine fehlende Zuerkennung von relevanten Rauhigkeits-, Behauchtheits- und Heiserkeitsanteilen das instrumentelle Ergebnis.

Bei der akustischen Stimmqualitätsanalyse sind 2 Parameter (OQG und GOG) bei beiden Geschlechtern v. a. für die Aufteilung in Subgruppen relevant. Dies wird durch die relativ geringen Wilks-Lambda-Werte ausgedrückt. Wilks-Lambda-Werte charakterisieren die Varianz innerhalb der Gruppen relativ zur Gesamtvarianz. Die Parameterwerte liefern Information über das Adduktionsverhalten der Stimmlippen und über den Grad der Glottisöffnung während des phonatorischen Ablaufs. Charakteristika des Phonationsverhaltens können in unterschiedlicher Form in den männlichen und weiblichen Subgruppen nach▶ Tab. 4 und 5). gewiesen werden (● Die Parameterwerte in der Gruppe 3 der männlichen Sprecher spiegeln v. a im Vergleich zur Gruppe 1 ein reguläreres Adduktionsverhalten wider (geringere Werte für die Parameter OQG und GOG). Bei den weiblichen Sprechern kann dieses Verhalten bei der Gruppe 2 beobachtet werden. Folglich fällt die Stimmqualitätsbeurteilung für diese beiden Gruppen bei einem Vergleich mit den anderen Subgruppen geschlechtsübergreifend gleich aus.

Stimmprofile zur männlichen und weiblichen Normalstimme Für die männliche und weibliche Normalstimme können jeweils 9 Stimmprofile auf der Basis der oben angeführten Klassifikation in 3 Subgruppen definiert werden. Die Stimmprofile werden durch eine Kombination der Parametermittelwerte der 3 elektroglottografisch bestimmten Subgruppen mit denjenigen der 3 akustisch bestimmten Subgruppen erstellt. Sie können innerhalb eines durch individuell variierende Phonationsqualität gekennzeichneten Kontinuums der normalstimmlichen Phonation separiert werden. Als Beispiele werden im Folgenden jeweils 2 Stimmprofile für jedes Geschlecht angeführt. Sie unter-

Pützer M, Wokurek W. Stimmprofile zur Normalstimme auf … Laryngo-Rhino-Otol 2015; 94: 303–310

Heruntergeladen von: University of Pennsylvania Libraries. Urheberrechtlich geschützt.

Analyseansatz

308 Originalie

SCV (1 081,39 / 10)

SCV (570,16 / 10)

ECV (1 160,69 / 10)

SCA (2 292,17 / 10) CV (1 699,07 / 10) Parameter

CLA (637,43) OPA (–124,82)

OQG (2,24 × 100)

OQG (4,52 × 100) GOG (–4,54 × 100)

GOG (–0,60 × 100)

RCG (–0,91 × 100)

SKG (–0,42 × 100)

–1 000

–500

0 Mittelwert

500

1 000

Abb. 4 Stimmprofil zur normalstimmlichen männlichen Phonation (Mittelwerte zu den elektroglottografischen und akustischen Parametern).

–1 000

–500

0 Mittelwert

500

1 000

Abb. 6 Stimmprofil zur normalstimmlichen weiblichen Phonation (Mittelwerte zu den elektroglottografischen und akustischen Parametern).

SCV (2 103,16 / 10)

SCV (984,35 / 10)

ECV (1 679,72 / 10)

SCA (628,01 / 10)

Parameter

CV (2 398,88 / 10) Parameter

OPA (–142,51)

CLA (529,58) OPA (–133,60)

CV (1 080,02 / 10) OPA (–107,12) OQG (–0,41 × 100)

OQG (5,02 × 100) GOG (–0,11 × 100)

GOG (–0,52 × 100)

SKG (–1,77 × 100)

RCG (–0,55 × 100) –1 000

–500

0 Mittelwert

500

–1 000

1 000

Abb. 5 Stimmprofil zur normalstimmlichen männlichen Phonation (Mittelwerte zu den elektroglottografischen und akustischen Parametern).

scheiden sich in ihren elektroglottografischen und akustischen Parametermittelwerten.

Normalstimmliche männliche Phonation ▶ Abb. 4 und 5 werden 2 unterschiedliche Stimmprofile In den ● der normalstimmlichen männlichen Phonation gezeigt. Sie repräsentieren ein breites Spektrum möglicher Parameterausprägungen. Die Abbildungen zeigen durch EGG- und akustische Stimmqualitätsparameter definierte Profile, die verschiedene Phasen des glottalen Zyklus betreffen. Während die EGG-Parameter die Variabilität in der Startphase (SCV) und der Endphase der Schließungsbewegung (ECV), die Variabilität in der Kontaktphase (CV), die Steilheit der gesamten Verschlussphase (CLA) und die Steilheit der gesamten Öffnungsphase (OPA) beleuchten, konkretisieren die ebenfalls physiologisch orientierten akustischen Parameter den Öffnungsquotient (OQG), den Grad der glottalen

–500

0 500 Mittelwert

1 000

Abb. 7 Stimmprofil zur normalstimmlichen weiblichen Phonation (Mittelwerte zu den elektroglottografischen und akustischen Parametern).

Öffnung (GOG) und die Geschwindigkeit des glottalen Verschlusses (RCG). Dadurch wird der komplementäre Charakter der beiden Analysesysteme bezüglich des Analyseansatzes und der Analyseschwerpunkte offenkundig.

Normalstimmliche weibliche Phonation ▶ Abb. 6 und 7 zeigen Beispiele zu weiblichen norDie beiden ● malstimmlichen Stimmprofilen. Durch den Vergleich des Ausmaßes der Balkenersteckung in den beiden Abbildungen wird die Variabilität innerhalb der 2 Stimmprofile (ebenso wie bei den Profilen zur männlichen Phonation) leicht ersichtlich. Diese Variabilität wird durch die verschiedenen Parametermittelwerte ausgedrückt. Die komplementäre Orientierung der beiden Analysesysteme wird ebenso offenkundig. Der fehlende EGG-Parameter zur Steilheit der gesamten Verschlussphase wird durch den akustischen Parameter zur Steilheit der Glottiswelle (SKG) ersetzt.

Pützer M, Wokurek W. Stimmprofile zur Normalstimme auf … Laryngo-Rhino-Otol 2015; 94: 303–310

Heruntergeladen von: University of Pennsylvania Libraries. Urheberrechtlich geschützt.

Parameter

CV (1 460,16 / 10)

Diskussion



In der vorliegenden Studie wird unter Verwendung des elektroglottografischen und akustischen Signals auf 2 Analysemethoden zur Definition normalstimmlicher männlicher und weiblicher Stimmqualität zurückgegriffen. Signifikant unterschiedliche Parametermittelwerte unterstreichen die Validität der beiden Methoden für die Dimensionierung der sog. Normalstimme. Durch eine Unterteilung der männlichen und weiblichen Sprechergruppen in signifikant unterschiedliche Subgruppen (3 Gruppen pro Geschlecht) kann auf der Basis einer instrumentellen Objektivierung innerhalb der sog. Normalstimme auf differenziertere Phonationsqualitäten aufmerksam gemacht werden. Die statistisch unterschiedlichen Parametermittelwerte der Subgruppen spiegeln bei beiden Geschlechtern gruppenspezifische Unterschiede im Adduktions- und Abduktionsverhalten der Stimmlippen wider. Dieses unterschiedliche Phonationsverhalten wird durch höhere oder geringere Parametermittelwerte der beiden Analysesysteme nachgewiesen. Auf diese Weise wird die Notwendigkeit einer differenzierteren Klassifikation normalstimmlicher Phonationsqualität aufgezeigt und die Relevanz von Subgruppen zur Definition von Phonationstypen nachgewiesen. Darüber hinaus verweisen die vorhandenen Subgruppen auf ein Phonationskontinuum innerhalb normalstimmlicher Phonation, das durch individuell variierende Stimmqualität charakterisiert wird [12]. Somit ist jede individuelle Phonationsqualität innerhalb der Parameterregionen von einer der Subgruppen zur männlichen und weiblichen Stimme zu positionieren. Darüber hinaus deuten nicht vorhandenen Korrelationen zwischen den Parametern der beiden Analysesysteme darauf hin, dass beide Systeme komplementär orientiert sind und somit verschiedene Abschnitte des phonatorischen Zyklus charakterisieren. Während die elektroglottografischen Parameter verschiedene Phasen der Stimmlippenvibration analytisch registrieren (z. B. den Start der Schließungsphase, das Ende der Schließungsphase oder die Steilheit der gesamten Öffnungsphase) und Ergebnisse zu ihrer Quantifizierung liefern, sind die akustischen Parameter auf den Öffnungsquotienten, den Grad der glottalen Öffnung sowie auf die Steilheit bzw. Geschwindigkeit des glottalen Verschlusses fokussiert. Somit sind bei der Subgruppendifferenzierung Parameter zu finden, die verschiedene Abschnitte des phonatorischen Zyklus betreffen und methodisch verschiedene Quantifizierungsansätze beinhalten. Diese komplementäre Orientierung der beiden Analyseansätze verweist auf eine potenziell feinere Differenzierungsmöglichkeit der Phonationsqualität. Ein weiteres Ergebnis der Studie besteht in der Präsentation verschiedener Stimmprofile (Referenzprofile) auf der Grundlage der etablierten Subgruppen. Diese Stimmprofile resultieren aus unterschiedlichen individuellen stimmlichen Dimensionen, deren Interaktionen schließlich eine bestimmte Phonationsqualität repräsentieren. Die oben erwähnte komplementäre Ausrichtung der beiden Analysesysteme wird somit durch unterschiedliche Parameterwerte belegt, anhand derer die Stimmprofile konstituiert werden. Eine Gegenüberstellung der zur Charakterisierung der männlichen und weiblichen Stimmprofile relevanten Parameterwerte der beiden Analysemethoden zeigt die Tendenz eines sich ergänzenden Ansatzes bei der physiologisch orientierten Darstellung des gesunden Phonationszyklus. Die Stimmprofile zur normalstimmlichen Phonation liefern eine verfeinerte Referenzbasis für zukünftige Untersuchungen be-

züglich individueller Veränderungen der Normalstimme. Darüber hinaus kann diese Referenzbasis durch einen Vergleich individueller Analysedaten mit ihren Daten dazu dienen, den potentiellen pathologischen Status eines Sprechers zu bestimmen und Veränderungen individuellen Phonationsverhaltens aufgrund von therapeutischen Ansätzen oder spontaner Genesung zu belegen. Somit wird die Möglichkeit geschaffen, individuelle Phonationsvariationen besser kontrollieren zu können. Zusammenfassend sei erwähnt, dass die Ergebnisse der vorliegenden Studie auf die Notwendigkeit einer differenzierten Klassifikation normalstimmlicher Phonation in Subgruppen hinweisen. Diese Klassifikation ermöglicht die Definition von Stimmprofilen, die eine subtilere Evaluation individueller normalstimmlicher und pathologischer Phonation erlauben. Unter Berücksichtigung dieser Vorgehensweise sollte in einer zukünftigen Studie anhand eines kontrollierten Experimentes überprüft werden, ob instrumentell definierte Stimmprofile auch auditiv zu unterscheiden sind.

Abstract

Acoustic- and EGG-parametrisations of Phonatory Quality Provide Voice Profiles of Normal Speakers



Objective: The present study deals with the dimensions of normal phonation. It is generally accepted that there exists a wide range of normal voices. Material and Methods: Using complementarily orientated electroglottografic and acoustic parametrisations of phonation quality, sustained vowel productions of 267 male and 267 female speakers without any reported voice pathology were analysed. A clustering technique serves to differentiate gender specific subgroups of normal phonation on the basis of these analysis results. Results: Firstly, 3 subgroups within each gender on the basis of the EGG, and 3 subgroups on the basis of the acoustic parameters are presented. Secondly, this subgroup definition allows one to present voice profiles of normal speakers by combining the parameter means of the electroglottografically determined subgroups with those of the acoustically determined subgroups. Conclusions: The present voice profiles can be used as a reference and are aimed at providing a firmer basis for the classification of different normal and pathological phonation types as well as for the evaluation of shifts in individual phonation behaviour due to therapy or spontaneous recovery. Interessenkonflikt: Kein Interessenkonflikt angegeben. Literatur 1 Muñoz J, Mendoza E, Fresneda MD, Carballo G, López P. Acoustic and Perceptual Indicators of Normal and Pathological Voice. Folia Phoniatr Logop 2003; 55: 102–114 2 Bhuta T, Patrick L, Garnett JD. Perceptual evaluation of voice quality and its correlation with acoustic measurements. J Voice 2004; 18: 299–304 3 Koreman J, Pützer M, Just M. Correlates of varying vocal fold adduction deficiencies in perception and production: Methodological and practical considerations. Folia Phoniatr Logop 2004; 56: 305–320 4 Pützer M. Multiparametrische Stimmqualitätserfassung männlicher und weiblicher Normalstimmen. Folia Phoniatr Logop 2001; 53: 73–84 5 Pützer M, Erriquez A, Barry WJ, Just M. Differenzierte Stimmprofile zur männlichen und weiblichen Normalstimme. In: Groß M, Kruse E, Hrsg. Aktuelle phoniatrisch-pädaudiologische Aspekte 2000/2001. Heidelberg: Median Verlag von Killisch-Horn GmbH, 2001; 71–75

Pützer M, Wokurek W. Stimmprofile zur Normalstimme auf … Laryngo-Rhino-Otol 2015; 94: 303–310

Heruntergeladen von: University of Pennsylvania Libraries. Urheberrechtlich geschützt.

Originalie 309

6 Zwirner P, Kruse E. Wertigkeit der akustischen Stimmanalyse für die Qualitätssicherung in der Behandlung von Stimmstörungen. In: Groß M, Hrsg. Aktuelle phoniatrisch-pädaudiologische Aspekte. Berlin: Renate Gross Verlag, 1995; 29–32 7 Zwirner P, Michaelis D, Kruse E. Akustische Stimmanalysen zur Dokumentation der Stimmrehabilitation nach laserchirurgischer Larynxkarzinomresektion. HNO 1996; 44: 514–520 8 Pützer M, Just M. Akustische und elektrophysiologische Stimmanalysen nach laserchirurgischer Larynxkarzinomresektion: Eine Fallstudie. In: Barry WJ, Koreman J, Hrsg. PHONUS 4. Saarbrücken: Institut für Phonetik, Universität des Saarlandes, 1999; 103–121 9 Pützer M. Stimmqualität und Artikulation bei Dysarthrophonien in der individuellen, tendenziellen und referentiellen Bewertung. Ein instrumenteller Beitrag zu Phonations- und Artikulationsvariationen. PHONUS 13. Saarbrücken: Institut für Phonetik, Universität des Saarlandes, 2008 10 Kempster GB, Kistler DJ, Hillenbrand J. Multidimensional scaling analysis of dysphonia in two speaker groups. J Speech Hear Res 1991; 34: 534–543 11 Parsa V, Jamieson DG. Acoustic discrimination of pathological voice: sustained vowels versus continuous speech. J Speech Hear Res 2001; 44: 327–339 12 Pützer M, Barry WJ. Instrumental dimensioning of normal and pathological phonation using acoustic measurements. Clin Linguist Phon 2008; 22: 407–420 13 Titze IR, Winholts WS. Effect of microphone type and placement on voice perturbation measurements. J Speech Hear Res 1993; 36: 1177–1190 14 Klingholz F. Jitter. Sprache Stimme Gehör 1991; 15: 79–85 15 Marasek K. Electroglottographic Description of Voice Quality. Arbeitspapiere des Instituts für Maschinelle Sprachverarbeitung 1997; 3: Stuttgart 16 Rothenberg M. Some relations between glottal air flow and vocal fold area. ASHA Reports 1981; 11: 88–96 17 Marasek K, Pützer M. Electroglottographical differentiation of pathological voice qualities. Proceedings of Larynx 1997; 91–94 18 Pützer M, Marasek K. Differenzierung gesunder Stimmqualitäten und Stimmqualitäten bei Rekurrensparese mit Hilfe elektroglottographischer Messungen und RBH-System. Sprache Stimme Gehör 2000; 24: 154–163

19 Pützer M, Barry WJ, Moringlane JR, Fuß G, Spiegel J, Dillmann U, Sittinger H. Auswirkungen der Elektrostimulation subkortikaler Hirnstrukturen auf das glottale Schwingungsverhalten bei Patienten mit M. Parkinson und multipler Sklerose. Folia Phoniatr Logop 2003; 55: 220–232 20 Moringlane JR, Pützer M, Barry WJ. Bilateral hight-frequency electrical impulses to the thalamus reduce voice tremor: acoustic and electroglottographic analysis. A case report. Eur Arch Otorhinolaryngol 2004; 261: 334–336 21 Pützer M, Barry WJ, Moringlane JR. Effect of deep brain stimulation on different speech subsystems in patients with multiple sclerosis. J Voice 2007; 21: 741–753 22 Pützer M, Barry WJ, Moringlane JR. Effect of bilateral stimulation of the subthalamic nucleus on different speech subsystems in patients with Parkinson’s disease. Clin Linguist Phon 2008; 22: 959–975 23 Wokurek W, Pützer M. Automated corpus based spectral measurement of voice quality parameters. Proceedings of the ICPhS XV 3-9 August 2003. Barcelona, Spain 2003; 2173–2176 24 Pützer M, Wokurek W. Multiparametrische Stimmprofildifferenzierung zu männlichen und weiblichen Normalstimmen auf der Grundlage akustischer Analysen. Laryngo-Rhino-Otol 2006; 85: 1–8 25 Stevens KN, Hanson HM. Classification of glottal vibration from acoustic measurements. In: Fujimura O, Hirano M, Hrsg. Vocal fold physiology. Cambridge MA: Hilltop University Press, 1994; 147–170 26 Sluijter A. Phonetic correlation of stress and accent. The Hague, Holland Academic Graphics 1995 27 Claßen K, Dogil G, Jessen M, Marasek K, Wokurek W. Stimmqualität und Wortbetonung im Deutschen. Linguistische Berichte 1998; 174: 202–245 28 Klatt D, Klatt L. Analysis, synthesis and perception of voice quality variations among female and male talkers. J Acoust Soc Am 1990; 87: 820–857 29 Hanson HM, Chuang ES. Glottal characteristics of male speakers: Acoustic correlates and comparison with female data. J Acoust Soc Am 1999; 106: 1064–1077 30 Nawka T, Anders LC, Wendler J. Die auditive Bewertung heiserer Stimmen nach dem RBH-System. Sprache Stimme Gehör 1994; 18: 130–133

Pützer M, Wokurek W. Stimmprofile zur Normalstimme auf … Laryngo-Rhino-Otol 2015; 94: 303–310

Heruntergeladen von: University of Pennsylvania Libraries. Urheberrechtlich geschützt.

310 Originalie

[Acoustic- and EGG-parametrisations of Phonatory Quality Provide Voice Profiles of Normal Speakers].

The present study deals with the dimensions of normal phonation. It is generally accepted that there exists a wide range of normal voices...
520KB Sizes 1 Downloads 6 Views