Arch. orthop. Unfall-Chir. 84, 169--177 (1976)

ArchivfOr orthop dische und UnfalI-Chirurgie @by L F. Bergmann-Verlag t976

Gefahren der Statistik am Beispiel einer Dysplasieuntersuchung H. Kristen, W. Dorda mad K. Zweymiiller Orthop~dische Universit/~tsklinik (Vorstand: Prof. Dr. K. Chiari) und Ordinariat fiir medizinische Computerwissenschaften und Gastroenterologie (Vorstand: Prof. G. Grabner) Wien (0st~rreich)

Pitfalls of Statistics as Shown in a Study on Dysplastie Hips Summary. In 97 cases of randomly selected children of an age from 5 to 16 weeks the angles of Hilgenreiner are determined. In relation to these findings also the influence of various factors such as hereditary anamnesis and untimely birth are observed. The so found data are compared with those published from TSnnis and Brunken. I t seems t h a t their data are higher than those in an average population. The necessity of an exact random test is pointed out. Zusammenfassung. Anhand yon 97 zuf/~llig ausgew/~hlten Kindern im Alter yon 5---16 Woehen werden die Winkel nach Hilgenreiner und der Einflu$ verschiedener Faktoren darauf, wie etwa famili/~re Anamnese und Frfihgebm% untersucht. Die gefundenen Werte werden mit den yon TSnnis u. Brunken pubhzierten verglichen. Dabei scheinen die Werte dieser Autoren fiir die NormalbevSlkerung zu hoeh zu liegen. Auf die Notwendigkeit einer exakten Stichprobenauswahl wird hingewiesen. Es gilt heute als erwiesen, dab nur in den ersten Stunden bzw. Tagen nach der Geburt die alleinige klinische Untersuchung ffir die Diagnosestellung einer Dysplasie oder Luxation Bedeutung hat (Walch [12]). Das RSntgenbild hat noeh wenig Aussagewert. Zu einem sp/iteren Zeitpunkt ist unbedingt aueh das RSntgenbild notwendig (Sehmidt [8] ; Peic [7] ; Schw/~gerl [10] ; Keller [4]). Noch entscheidender ist das RSntgenbfld f'tir die Objektivierung des Therapieerfolges einer Dysplasiebehandlung. Am RSntgenbild wird in erster Linie das Pfannendach bzw. dabei der Pfannendaehwinkel naeh ttflgenreiner beurteilt. Bis zur Arbeit yon TSnnis u. Brunken (1968) galt trotz verschiedener Versuche, Normalwerte des Pfannendaehwinkels zu erhalten, ein Winkel yon fiber 30 ° im Alter yon etwa 3 Monaten als pathologisch (Caffey [1]). Die Untersuchung fiber ~qormalwer~e waren deshalb problematiseh, weft entweder nur geringe Anzahlen yon Kindern untersucht werden konnten oder die sogenannte ,,gesunde Seite" einer dysplastischen Hfifte (Friind [2]), oder eine Anzahl yon Kindern, die unter dem Verdacht einer Dysplasie ohne pathologischen klinischen Befund an Kliniken verwiesen wurden (Schuster [9]).

170

H. Kristen et al.

Es war deshalb nur verst~ndlich, dab die statistiseh errechneten ,,Normalwerte" von TSnnis u. Brunken [11] an einem scheinbar groBen Material als Grundlage der Diagnosestellung und Therapieeinleitung gew~hlt warden. Die dabei ermittelten Grenzwerte waren jedoch den in der Praxis stehenden Orthop~den zu hoeh (Keller [4]). An der Orthop~disehen Universit~tsklinik haben wir uns deshalb bemiiht, eine Studie zur Ermittlung der Grenzwerte normaler Pfannendachwinkel durchzufiihren. Bei dieser Untersuchung, die selbstverst~ndlich mit einer begrenzten Zahl yon Kindern durehgefiihrt werden muBt~, war es notwendig, sieh aueh mit Fragen der Statistik auseinanderzusetzen.

Material und Methodik a) Stichprobenau]bau und Auswahl der Stichprobe. Um eine entspreehende Zahl gesunder Hiiften zu erfassen, wurden an beiden Gyn~kologisehen Universit~ts. kliniken in Wien (Vorstand: Prof. Dr. Husslein und Prof. Dr. Gitsch) im Friihjahr und im Herbst 1971 an 1000 Miitter eine Mitteilung ausgegeben, daB die klinische und rSntgenologisehe Untersuchung ihrer Kinder im Alter yon 3 Monaten zum Ausschlul~ einer Hiiftdysplasie wiinschenswert w~re. Von diesen Kindern erhielten wir s~mtliehe Befunde der Erstuntersuehung und auch Angaben hinsiehtlich einer famili~ren Dysplasieanamnese. Primi~r war vorgesehen, alle diese 1000 Kinder an unserer Klinik zu untersuchen, doch muBte sparer eine Stichprobenauswahl getroffen werden, da eine routinem~Bige RSntgenuntersuehung in 0sterreich noeh problematisch ist und zum Teil auch auf den Widerstand der praktizierenden Orthop~den stieS. Es warden deshalb aus dieser Zahl 100 Kinder durch Zufall ausgew~hlt und 1 Monat nach der Entbindung zu einer Untersuehung an die Klinik gebeten. Die Zufallsauswahl schien uns dureh wiederholtes Misehen der Ersterfassungsbelege und Ziehen aus der Summe yon 1000 Belegen ausreiehend gew£hrleistet (Mittenecker [6]). Von den 100 ausgew~hlten kamen nach zweimaliger Einberufung letztlieh nur 2 Kinder nieht zur Untersuchung. (Es handelte sich um Fremdarbeiterkinder, die nicht mehr in 0sterreieh waren.) Bei einem Kind war das mitgebrachte RSntgenbild nieht verwertbar. Somit wurden die Befunde yon 97 K i n d e m und deren Erstr5ntgen bei der Auswer~ung beriicksichtigt. Die Bilder waren alle zwischen der 5. und 16. Woehe nach der Entbindung angefertigt worden. Einzelne Verlaufskontrollen bei grenzwertigen oder dysplastischen Hiiften wurden nieht ausgewertet, da damit die Normalverteilung nicht mehr gew~hrleistet gewesen w~re. Unterscheidung zwisehen Knaben und M~dehen wurde bei der Stichprobenauswahl keine durehgeffihrt. Es ergab sich daher rein zuf~llig eine Verteilung yon 57 M~dehen und 40 Knaben. Folgende Daten wurden yon den ausgew~hlten Patienten festgehalten: 1. Geburtsgewicht, 2. KSrpergrSfle bei der Geburt, 3. Geschleeht, 4. famili~re Belastung beziiglich Dysplasie oder MiBbildungen, 5. abnorme Verh~ltnisse bei der Entbindung (SteiBlage, Seetio), 6. Erstuntersuchungsbefund durch Kinderarzt.

Gefahren der Statistik am Beispiel einer Dysplasieuntersuchung

171

An den RSntgenbildern wurden folgende Werte abgelesen: 1. Symphysensitzbeinwinkel zur Ermittlung der Beekenkippung, 2. querer Durehmesser der Foramina opturatoria zur Ermittlung des Index fftr die Beekendrehung (TSnnis [i1]), 3. die Beekenbreite bzw. der quere Durehmesser des Beekens auf der Konstrttktionsgrundlinie naeh Hilgenreiner, 4. der Pfannendaehwinkel beidseits naeh Hilgenreiner, 5. die L~nge des Pfannendaches, 6. die WSlbung des Pfannendaehes (soweit diese beurteilbar). Durch die standardisierte Aufnahmetechnik bei Kleinkindern an der Orthop~dischen Universit~tsklinik waren die Grenzwerte fiir die Beckendrehung und Beckenkippung (TSnnis [11]) in keinem der angefertigten RSntgenbilder iiberschritten. b) ~berpri~/ung der Stichprobe. Vor Beginn unserer Auswerttmg wurde an_hand des Geburtsgewichtes und der KSrpergrS]3e die Representanz der Stichprobe iiberpriift. Der Mittelwert des Geburtsgewichtes betrug bei den yon uns untersuchten Kindern m i t 3286,7 -~ 423,7 g zwar etwas mehr als die derzeR noch giiltigen Mittelwerte der Grenzwertkurve nach Griinwald fiir die 40. Schwangerschaftswoche, die auf jeder Geburtsstation aufliegen (2600 g untere Grenze, 3400 g obere Grenze), doch entspreehen diese Werte nieht mehr den Tatsachen. Augenblicklich sehwankt das Geburtsgewieht zwisehen 2900 und 3600 g. I n diesem neuen Bereich entsprechert unsere Werte vollkommen. Der Mittelwert der KSrperl~nge betrug 49,7 1,8 em und deckt sieh ebenfalls mit den Normalwerten. Ein Riicksehlul~ auf die NormalbevSlkerung yon Wien ist damit gerechtfertigt.

A uswertung der Stichprobe 1. Ermittlung der Pfannendachwinkel nach Hilgenreiner Das H a u p t a u g e n m e r k unserer Untersuchung lag in der E r m i t t h m g des Pfannendachwinkels. Der Mittelwert betrug fiir die gesamte Stichprobe (Knaben und M~idchen beide ttiiftgelenke) 23,4 ± 4,5 °. D a in der Literatur zwischen rechts und links unterschieden wird und teflweise signifikant verschiedene Werte gefunden werden (TSnnis [11]), haben wit ebenfalls den Mittelwert des Pfannendachwinkels ffir rechts und links errechnet. Fiir die rechte Hiifte ergab sich dabei 23,2 :L 4,5 °, f'tir die linke Hiifte 23,5 ~ 5,2 °. Bei diesem geringfiigigen Unterschied erschien uns eine weitere Unterteilung zwischen rechts und links nicht erforderlich. Wir fanden dagegen einen deutlichen Unterschied zwischen den Mittelwerten der Hiiftgelenke yon K n a b e n und M/idchen. W/~hrend bei den 57 Mi~dchen f'dr rechbs und links gemeinsam 24,9 ~: 4,4 ° gefunden wurden, war der arithmetische Mittelwert fiir die 40 Knabenhfiften 21,0 :L 4,5 °. Wir haben nun den EinfluB verschiedener klinischer Befunde auf den Pfannendachwinkel iiberpriift.

a) Einflufl der Steifllage. 4 der 97 Kinder warden in Steilllage geboren. Der arithmetisehe Mittelwert der Pfannendaehwinkel betrug mit 21,6 -~- 3,6 ° weniger als der sonst fibliche Mittelwert. Es kann deshalb unseres Eraehtens nicht direkt yon der SteiBIage auf eine Dysplasie gesehlossen werden. b) Posltiver klinischer Untersuehungsbe/und zum Zeitpunkt der RSntgenkontrolle. Bei 61 Kindern wurde ein positiver Befund erhoben. Dies war einerseits eine geringe oder deutliehe Spreizhemmung bzw. in einem Fall ein Ph~inomen (Reluxationsph~nomen). Diese positiven Beftmde wurden in Beziehung zum Pfannendachwinkel gesetzt, und der arithmetisehe Mittel-

172

H. Kristen e$ al.

weft der Hiiftgelenke dieser Kinder betrug 23,6 J= 4,9 °. Da dieser Weft nur knapp fiber dem allgemeinen Mittelwert |iegb, muB angenommen werden, da~ eine geringe Spreizhemmung der Hfifte bezfiglich der Aussage einer Dysplasie kein entseheidender Weft zukommt. Dami~ wird die Notwendigkeit einer Rfn~genuntersuchung neuerlieh unterstrichen (Schmidt [8]). Bei 15 Kindern bestand eine massive Spreizhemmlmg. Der Pfannendachwinkel betrug in diesen F~llen 24,7 =[= 3°. Obwohl auch damit nicht direkt auf eine Dysplasie geschlossen werden kann, unters~reich~ dieser h6here Wer~ doeh die Ansich~ yon Keller [4] und Waleh [12].

c) Verdachteiner H~/$erkrankuny bei Erstuntersuchung dutch den Kinderarzt. Bei 19 Kindern wurden unmittelbar nach der Entbindung pathologische Verhi~ltnisse vom Kinderarzt diagnostiziert. Der Pfannendaehwinkel dieser 19 Patienten betrug 23,8 =]=4,7 ° und lag damit ebenfalls nur unbedeu~end fiber dem Mittelwert. d) Orthopgd~sche Untersuchung und routinemdfllge Behandlung. Alle Kinder wurden unabh~ngig yon unserer Auswertung an der Klinik untersucht, befundet und aueh routinem~l~ig behandel~. In 13 F~llen wurde eine Dysplasie diagnos~iziert, in 6 F~llen wurde beidseits die Hfifte dysplas¢isch befundet. Der arithmetische Mittelwert der dysplastisch befundeten Hfifte be~rug 30,3 ~ 4,8 °. Die 7 sogenannten gesunden Hfiften dieser behandelten Kinder lagen mi~ ihrem ~Iit~elwert des Pfannendaehes yon 23,9 -~ i,8 ° fiber dem sonstigen Mittelwer~ der normalen Hfiften, was fiir eine Mitbeteiligung auch dieser sogenannten normalen Hfiften sprich~ (Frfind [2]). e) Positeve Eamilienanamnese. Bei 5 M~idehen und 7 Knaben wurdo Hfiftdysplasie in der Familie festgehalten. Es lag der Mittelwcrt der lYi~lchen mit 27,1 ~ 4,5 °doch 2,2 ° fiber dem Mittelwert der fibrigen MKdehen. Bei den Knaben lag dot Mittelwert mit 21,7 ~ 4,2 ° nur um 0,7 ° fiber dem Mittelwert der fibrigen Knaben. Damit seheint die Familienanamnese bei M~dchen eher eine ungfinstigo Auswirkung zu zeigen, als dies bei Knaben der Fall ist. ]) Entwlcklungsr~kstand bei JFri~hgeburten. Da einer Hfiftbeurteilung des Rfntgenbildes in den ersten 3 Lebensmonaten gelegentlieh vorgeworfen wird, dal] bei Frfihgeburten eine Fehlbeurteilung mfglieh sol und deshalb das erste Rfnggen erst mi~ 6 Monaten erfolgen sollte (Hopf, 1973), haben wir versueht, s~mtliche Frfihgeburten getrennt zu erfassen. Der arithmetische Mittelwert yon 24 Knaben und M~klehen, die alle mindestens 8 Tage vor dem Terrain geboren warden, betrug 23,9 =]= 6°. Es zeigt sich, dal] dieser Wert nur geringffigig fiber dem sons~igen ~igtelwert liegt, jedoch eine hohe Streuung aufweisg. Es kann also nieht generell gesagt werden, dal~ eine Frfihgeburt einen hfheren Pfannendachwinkel zeigen muff (Zcebfek, 1952). Da wir aus therapeugischen Grfinden eine m6glichs~ friihe Erfassung einer Dysplasie anstreben mfissen, glauben wir, dab deshalb die Forderung nach dem Rfntgenbild bis zum 3. Lebensmonat gerechgfertigt bleibt (Keller [3, 4]). ~) Einflufl der GrTfle des Kindes bet der Geburt. Wir haben auch diesen Einfiul~ auf den Pfannendaehwinkel festgestellt. Bei Kindem fiber 51 cm Kfrpergrffle lag der Migtelwert bei Knaben und M~dehen bei 22,8 ~ 5,3 °. Der Un~ersehied zum l~Iittelwert der Gesam~stichprobe is~ nieht bedeutend, ti~hnliehe Verh~ltnisse zur KfrpergrfBe iindeg aueh ZcebTek (1952) [13]. h) Einflufl der Beekenbrelte au[ den P/annendaehwinkel. Die Beekenbreite zeigt~ ffir Knaben mad 1K~dehen einen Mi~Celwer~yon 497,5 :t: 37,4 turn. Ffir ~I~dehen allein 491,8 4- 35,6 ram. Der Untersehied ist relativ gering. Die Beekenbreite bei Pfannenwinkel fiber 27 ° (24 Pa~ienten) war mi~ 482,1 q- 33,2 mm deutlich geringer. Kinder mi~ einem Geburtsgewieh~ fiber 3200 g und gIeiehzeitiger Beekenbrei~e unter 490 mm (18 Pa~ien~en) zeigten einen ~fannendaehwinkel yon 25,7 4- 4,5°. Dieser Untersehied betr~gt immerhin 2,3 °. Der SehluB yon einem auffallend sehmalen Beeken, das kliniseh leieh¢ fes~zustellen wKre, indirekt auf eine Dysplasie seheint uns jedoeh nieht ausreichend, um ohne Rfntgen den Befund einer Dysplasie stellen zu kfnnen. Die geringe Beckenbreit~ der M~dehen und aueh h6here Pfannendachwinkel (24,9 :t: 4,4 °) sprechen jedoch ebenfalls ffir einen Zusammenhang zwisehen Beckenbrei~e und PfannendachwinkeL 2. D i e A u s s a g e fiber d i e P f a n n e n d a c M ~ n g e W i r m u B t e n j e d o c h feststellen, dal~ z w a r b e i d y s p l a s t i s c h e n H f i f t e n m i t 10,9 1,5 m m die P f a n n e n d a c h l ~ n g e e t w a s g e r i n g e r i s t als b e i d e n fibrigen H i i f t e n

Gefahren der Statistik am Beispiel einer Dysplasieuntersuchung

173

m i t 11,4 =~ 1,4 ram, doch seheint uns die Effassung dieses Wertes Ftir die praktisehe Beurteilung k a u m wertvoll. Obwohl bei der klinischen Beurteilung des RSntgenbfldes die WSlbung der Pfanne yon entseheidender Bedeutung ist, seheint uns dieser Wert ebenfalls nieht mel3bar bzw. die Messung nieht sinnvoll. 3. Statistisehe Auswertung der Stiehprobe Wir haben bei bisherigen Vergleichen bewuBt nur yon deutlichen oder geringer, jedoch nieht yon signifikanten Untersehieden gesproehen. Der statistisehe Begriff signifikant heiBt n~mlich nur, dab zwischen 2 Kollek~iven ein Unterschied gegeben ist, der mit 95% Sicherheit nieht zufi~llig entstanden ist, w e n n in den vergleichenden Stiehproben ]eder F a k t o r beseitigt wurde, der eine Zufallsauswahl beeinflussen kSnnte. Der Begriff ,,signifikant" sagt niehts fiber die GrSBe oder den Wert des Unterschiedes aus. Die Auslegung der Unterschied ist signifikant ist gleieh deutlich oder ist gleich auifallend besteh~ zu Unrecht und ist falseh. Z u m Beispiel: Der Unterschied des arithmetischen Mittelwertes zwischen rechten und linken Hfiften ist m i t 23,2 4- 4,5 ° fiir rechts bzw. 23,5 ± 5,2 ° ffir links m i t 0,3 ° keineswegs deutlieh und auch praktisch k a u m meBbar und deshalb bedeutungslos. Bei statistiseher Priifung is~ dieser Untersehied in unserer Untersuchung zwisehen reehts und links aueh nicht signifikant. Die Tatsache, dab TSnnis durchwegs Ftir die linke Hiifte hShere Werte finder als Ffir die rechte, seheint deshalb nur durch seine Stichprobenauswahl zu erkli~ren. Denn auch ZeebSck fmdet wechselnd Werte fiir die linke oder rechte Hiifte h5her. Ein deutlieher Unterschied anderersei~s besteht zwisehen den Hfiftwerten yon K n a b e n (21,0 ~- 4,5 °) und M~dchen (24,9 =L 4,4°). Dieser Unterschied ist mit 3,9 ° auch in der Praxis brauchbar. Bei s~atis~ischer Priifung erweis~ sich dieser W e r t auch als signifikan~. Da bei biologischen Daten grSBere Streuungen meist vorhanden sind, haben geringe Unterschiede of~ Iceine praktische Bedeutung. U m Irrefiihrungen zu vermeiden, sollten nur deutliche Unterschiede daraufhin gepriift werden, ob sie zufiillig aufgetreten oder aber signifikant sind. Ansonsten l~uft m a n Gefahr, fiber den statistischen Wahrseheinliehkeitsrechnungen den pralc. tischen Wert einer Aussage zu fibersehen. Die gr59ere Zahl untersuehter Patienten k a n n einen Unterschied vielleicht signifikant ,jedoch nicht deutlicher maehen. U m einen Vergleich der yon uns erhobenen Werte mi~ den Werben yon TSnnis (1968) zu ermSgliehen, soil eine Aufgliedertmg der Winkelwerte naeh dem Alter getrennt nach K n a b e n und M~dchen erfolgen (Tabelle 1). Vergleieht m a n diese Tabelle bzw. die Werte in den ersten 3 Monaten sowohl im Mittelwert als aueh in den Standardabweichungen, so miissen wir feststellen, dab die Wer~e yon TSnnis durehaus zu hoch liegen.

Tabelle 1. Pfannendachwinkcl bei verschiedenem Alter und ,,Grenzwerte"

Alter

Mi~dchen ~- a

-b 2 ~

Zahl

Knaben

-b a

~ 2a

Zahl

3--8 Wochen 9--12 Wochen 13--16 Wochen

27,6° 25,0° 23,1 °

36,2° 33,0° 30,3°

13 29 15

21,8 ° 21,2° 20,1 °

26,8 ° 25,8 ° 23,8 °

31,8° 30,4° 27,5°

9 20 11

31,9 ° 29,0 ° 26,7 °

174

H. Kristen et al.

i

35~ I

•Bereich 6- 2~,Tonnis {verd~chtig)

30° F-

.:ich 6-26 eigene Unt. AI'4 ~ TSnnis

25° -

A~ ? eigene Un!. 2O°

15 °

6

10

14

Wochen

18

Abb. 1. Pfannendachwinkel f'ur M&dchen (1. Trimenon, Vergleieh zu T6nnis) 3 5 ° r-"

~ ~~i!

30°

~:~

~.-...'!~ ~!~I~ ~ Bere~ch~- 25 Tonn~s ~J (verd~ichtig}

~ !~.:~b':!:!:: :$:~.. ~

25°

reich ~,- 2 ~ AN1 6' Tonnis --

20°

15°[-

,

I

6

~

....

I

10

I

Unt.

AM d eigene Unt.

1

t

I

14

Wochen

18

Abb. 2. Pfannendachwinkel fiir Knaben (1. Trimenon, Vergleieh zu T6nnis)

Wenn wir annehmen dfirfen, dab es sich um eine Untersuehung der Normalbev61kerung handelt, so ist eine Normalverteflung der Werte zu erwarten. Damit ergibt sieh, wenn die Grenze zum Dysplasieverdaeh~ mi~ ~- a angenommen wird, da6 17 ~ % der NormalbevSlkerung eine grenzwertige kontrollbedfirftige Dysplasie erwarten lassen. In unserer Untersuehung lagen bei 21 Patienten (21,7 %) die erhobenen Werte fiber -~ a. 6 Patienten waren gerade an der Grenze einzustufen. Bei 15% war also eine kontrollbediirftige Dysplasie zu erwarben.

Gefahren der Statistik am Beispiel einer Dyspiasieuntersuchung

175

Als pathologiseh miissen jene F~lle gewertet werden, die oberhalb der Grenze yon ~- 2 a liegen. Dies ist entspreehend der Normalverteilung bei 2 ~ % zu erwarren. In unserer Untersuehung waren dies 2 Patienten, 3 Patienten lagen knapp an der Grenze zu -~ 2 (~. Bei unserer Untersuehung waren demnach 5,1% eehte Dysplasie, was mit den fibliehen Literaturangaben fiir Luxationsgegenden iibereinstimmt (zit. b. Waleh). Wfirden wir die Tabelle yon TSnnis zur Beurteilung unserer Stichprobe heranziehen, so kSnnten 3 M~dchen und 1 Knabe an der Grenze zu ~- (~, also als verd~eh~ig gefunden werden (4%). Pathologisch (also fiber 2 a) wi~re kein einziger Fall unserer Stiehprobe. Da ansonsten die Umgebung von Wien als Luxationsgegend gilt und die Dysplasieh~ufigkeit ungef~hr bis 10% angenommen werden daft, liegen die Werte yon TSnnis sieher ffir die NormalbevSlkerung zu hoeh. Eine graphische Darstellung der Verteilung bzw. sogenannten Grenzwerte getrennt fiir M~dehen und Knaben verdeutlicht dies noeh besser. Diese hochgradigen Unterschiede bei der Verteilung lassen sich unseres Erachtens nur durch eine falsche Auswahl der Stichprobe erkl~ren.

Diskussion Die Statistik stellt in der empirischen Forschung einen entscheidenden Fortsehritt dar. Eine Untersuchung ist aber nieht genauer, wenn mehrere Personen erfaBt werden. Die entsprechende Auswahl lg135 aufgrund der statistischen Berechnung aueh an einem kleinen Untersuehungsgut Riieksehliisse auf die grSBere Population zu. Die Ergebnisse werden exakt sein, wenn die Stichprobenauswahl richtig getroffen wurde. Deshalb muB der Beurteilung der Stichprobenauswahl mehr Bedeutung zukommen als der statistischen Berechnung (Mittenegger [6]). In der Arbeit yon TSnnis u. Brunken [11] wird das Untersuchungsmaterial exakt bis ins Detail angegeben. Die Art der Angabe ist jedoeh nicht klar und teilweise sogar irreffihrend. Zum Beispiel: ,,Es standen zur Berechnung 1582 RSntgen zur Verfiigung" is$ falseh. 435 RSntgenbilder wurden ni~mlieh wegen extremer Beckenneigung und starker Beekendrehung nieht verwertet. Richtig w~re demnach, dal3 zur Beurteilung 1142 RSntgenbilder vorhanden waren. Obwohl es riehtig ist, dal3 2294 Hiiftgelenke ausgewertet wurden, entspricht es dem Streben naeh einer groBen Zahl, denn jeder Beurteiler kann letztlich errechnen, dab 1147 RSntgenbilder die doppelte Anzahl yon ausgewerteten Hfiften ergibt. Welter ist zu entnehmen, dal3 diese RSntgenbilder yon 257 Patienten s~ammen, denn yon 238 Patienten stammen 1128 RSntgenbilder im Verlauf. E x a k t w~re demnach die Angabe: ,,Es wurden yon 257 Patienten RSntgenbilder der Hiiften ausgewertet, wobei yon 238 Patienten wiederholt RSntgenbilder im Verlauf beriieksiehtigt wurden. Insgesamt standen 1147 RSntgenbilder zur Auswertung zur Verffigung." Eine Erkli~rung der relativ groBen Zahl yon RSntgenbildern im Verlauf w~re dabei wiinschenswert, da normalerweise eine Verlaufskontrolle nur bei grenzwertigen Befunden erfolgt. Dieser Umstand mfiBte jedoeh bei Beurteilung einer NormalbevSlkerung berficksichtigt werden, da er eine Zufallsauswahl beeinfluBt. Bei der Stiehprobenauswahl is~ in der Arbeit yon TSnnis ein entscheidender Fehler un~erlaufen. Der Autor selbst beschSnigt ihn, wenn er feststellt, dal3 im

176

It. Kristen et al,

Falle yon Faltenasymmetrie nur in etwa einem Drittel der F~lle ein pathologischer Befund an den Hfiften festzustellen ist. Wenn er weiter sehreibt, dab bei Untersuchungen an der Klinik in Berlin Kinder ,,h~ufig schon beim Aufgreten einer Faltenasymmetrie" zugewiesen win'den, so heiBt dies doch, dab in den meisten anderen F/~llen oder zumindest in einigen F~Uen st~rkere Verdachtsmomente ffir eine Dysplasie vorlagen. Eine AuswaM ist damit aber zweifeUos gegeben. Falsch ist die Interpretation des Autors, dab ,,Dysplasie fiberhaupt nur in geringem Prozentsatz vorkommen und deshalb seine Untersuchung trotz der obigen Auswahl als relativ normal und nur in begrenztem MaBe ausgelesen" betrachtet werden daft. Gerade bei einer selten in der NormalbevSlkerung vorkommenden Ver~nderung ist eine Vorauswahl yon grSBerer Bedeutung, und ein RfickschluB bei einer solchen Vorauswahl auf die Normalwerte der Gesamtverteilungen in der BevSlkerung ist unzul~ssig. Mit einer fehlerhaften Stichprobenauswahl ist abet auch das Resultat nur ffir die Stichprobe aussagekr~ftig, nieht aber der RfickschluB yon dieser Stichprobe auf die Normalbev61kerung mSglich. T6nnis [11] versucht in seiner Arbeit welter, durch die Verwendung yon statistisch definierten Punkten (~ und 2 a) eine Grenzziehung zwischen normalen und pathologischen Pfannendaehwinkeln zu erreichen. Die Streuung ist jedoch ein mathematischer Wert, der einzig und allein fiber eine zu erwartende H~ufigkeit des Auftretens eines bestimmten Wertes im l~ahmen einer Normalverteilungskurve etwas aussagt, nicht aber fiber die medizinisehe Bedeutung. Die Beurteilung der Grenze zum Pathologischen kann nur empirisch gefunden werden. Dies gilt ganz besonders ffir Krit~rien, die flieBend ins Pathologische fibergehen. Wenn z. B. Mittelmaier [5] den Pfannendachwinkel fiber 80 ° i m Alter yon 3 Monaten als pathologisch betrachtet, so ist dies in Anbetracht einer empirisch gewonnenen persSnlichen Eftahrung und der Literaturkenntnisse genauso weftroll, wie wenn TSnnis feststeUt, ein Wert im Bereiche fiber + ~ ist pathologisch. W£hrend aber die Angabe ,,grSBer als 30 °'' einen fixen Wer~ darstellt, so ist die Aussage ,,gr6Ber als + 2 ~" eine Variable, die bei fehlerhafter Stichprobenauswahl f'dr die Normalbev61kerung wertlos ist. Die vorliegende Arbeit soil keineswegs den Weft der Arbeit yon T6nnis schm~lern. Es soll nut darauf hingewiesen werden, wie exakt die l~berprfifung der Stichprobenauswahl notwendig ist. Speziell bei der ]~berprfifung yon in langer Zeit empirisch gefundenen Werten sollte bei auftretenden Divergenzen durch statistische l~berpriifung unbeding~ die Stichprobenauswahl bis ins letzte kontrolliert werden, bevor man entsprechende Konsequenzen fordert.

Literatur 1. Caffey, J,: Contradiction of the congenital dysplasia-predislocation hypothesis of congenital dislocation of the hip though a study of the normal variation in acetabelur angels at successive periods in infancy. Pediatrics 17, 5, 632 (1956) 2. ~Yiind, R.: Die sogenannte gesunde Seite der einseitigen Hiiftluxation. Z. Orthop. $8, 483 (1957) 3. Keller, G.: Zur Friihdiagnose und Therapie der Hiiftdysplasie. Z. Orthop. 106, 577 (1969) 4. Keller, G.: Zum heutigen Aspekt der Hiiftdysplasie in Klinilr und ROntgenenologie. Z. Orthop. 118, 243 (1975)

Gefahren der Statistik am Beispiel einer Dysplasieuntersuchung

177

5. Mittelmeier, H. : Die Hiiftdysplasie aus der Sicht des Orthopi~den. Prakt. Orthop. 4 (1973) 6. Mittenecker, E. : Planung und statistische Auswertung yon Experimenten, 4. Aufl. Wien: Franz Deuticke 1963 7. Peic, St. : Friihdiagnose und Frfihbehandlung der sogenannten angeborenen Hiiftluxation. Prakt. Orthop. 4 (1973) 8. Schmidt, H. : ~ber das Ffir und Wider yon RSntgenreihenuntersuchungenzur Friiherkennung der Luxationshfifte bei S~uglingen. Beitr. Orthop. 2], 338 (1974) 9. Schuster, W. : RSntgenologische Beobaehtungen der dysplastischen Hfiftpfanne. Orthop~de 2, 219 (1973) 10. Schw~gerl, W., Krepler, P., Flamm, Ch. : Vergleichende klinische und rSntgenologische Untersuchung zur Erfassung der I:Ififtdysplasie im S~uglingsalter. Z. Orthop. 113 (1975) 11. TSnnis, D., Brunken, D.: Eine Abgrenzung normaler und pathologischer Hfiftpfannenwinkel. Arch. orthop. Unfall-Chir. 64, 197 (1968) 12. Walch, H., Kolipp, D. : Erfahrungen und Ergebnisse der Hfiftuntersuchungen bei Neugeborenen. Beitr. Orthop. 19, 577 (1972) 13. ZcebSck, Z., Molnar, R., Nagy, E. : Deutung des RSntgenbildes der Frfihdiagnose der sogenannten angeborenen I-Ififtverre~kung. Z. Orthop. 82, 556 (1952)

Eingegangen am 1. Juli 1975

Dr. H. Kristen Orthop~dische Universit~tsklinik Garnisonsgasse 13 A-1090 Wien, (~sterreich

12

[Pitfalls of statistics as shown in a study on dysplastic hips (author's transl)].

In 97 cases of randomly selected children of an age from 5 to 16 weeks the angles of Hilgenreiner are determined. In relation to these findings also t...
653KB Sizes 0 Downloads 0 Views