Logo

eugenik.dk

Om race-hygiejne og IQ-forskning

Validate

Skanderborg II: Talfiflerier

10. januar 2013

I sidste blogindlæg så vi på den besynderlige ændring af antallet af forsøgspersoner fra 52 til 62 der forekom på et sent tidspunkt i forløbet, længe efter Nyborg havde været i pressen og forkynde de epokegørende resultater om kvinders påståede ringere intelligens.

Vi så, at der formentlig var tale om en tilføjelse af nye forsøgspersoner til materialet, idet gennemsnitsalder og spredning på samme ændrede sig for både drenge og piger. Vi så endvidere på Nyborgs meget skiftende forklaringer på hvor forsøgspersonerne kom fra.

I dette blogindlæg skal vi kigge lidt mere på problematikken vedrørende antal forsøgspersoner. Det viser sig nemlig når man graver yderligere i det tilgængelige talmateriale, at tingene slet ikke hænger sammen, og det hele bliver blot endnu mere mystisk og uforståeligt.

I det følgende vil vi undersøge nogle af de data, der blev stillet til rådighed for det sagkyndige udvalg i slutningen af 2005 (bilag 110 i aktindsigten). Filen Adult_sex.xls indeholder de rå testdata for 62 forsøgspersoner, kategoriseret som "voksne" men reelt stammer de fra to forskellige grupper 16-18 årige skoleelever.

De mest detaljerede informationer om Nyborgs egne beregninger findes i "spøgelsesdokumentet" (bilag 52 i aktindsigten). (Se kronologien den 23. januar 2002 for en forklaring på, hvorfor det kaldes således.) Tabel 2 er en kopi af dette dokuments tabel 4, som Nyborg angiver kommer fra et datasæt med 52 forsøgspersoner.

I et forsøg på at komme frem til Nyborgs tal i spøgelsesdokumentets tabel 4 (her tabel 2) har jeg eftergjort beregningerne, og det samme gjorde Det Sagkyndige Udvalg. Tabel 3 viser resultatet af disse beregninger. Det er bemærkelsesværdigt, at mange af tallene i vores beregning, som er foretaget med N=62 datasættet, er identiske med de tal, Nyborg beregner fra N=52 datasættet. Det skal igen understreges, at N=52 datasættet ikke længere eksisterer, da Nyborg hævder det er blevet overskrevet.

I Tabel 3 ses endvidere en beregning af kønsforskellen i IQ (3.2), foretaget efter Nyborgs tal udfra N=62 datasættet. Ej heller dette tal er til at stole på, og det vil jeg uddybe i et senere blogindlæg.

Tabel 2 og tabel 3 indeholder en masse tal som kan være vanskelige at forstå, men de fleste af søjlerne er heldigvis ikke heller ikke nødvendige at forstå for at følge denne diskussion. Der er en række i tabellen for hver af de 21 IQ-tests, forsøgspersonerne er blevet udsat for. For hver af disse tests er der udregnet en hel del statistiske størrelser. De to vigtigste søjler at lægge mærke til er markeret med mb og mg. De angiver hvor godt drenge hhv. piger i gennemsnit har klaret sig i den pågældende IQ-test. To andre søjler, det er værd at lægge mærke til, er spredningen på test-scores for drenge hhv. piger; disse søjler hedder sdb og sdg.

Nu kunne man tage tabel 2, som er Nyborgs N=52 tabel, og tabel 3, som jeg har beregnet på grundlag af Nyborgs rå data for N=62, og sammenligne dem række for række og søjle for søjle. Men det er langt lettere at trække de to tabeller fra hinanden. Der hvor tallene er ens, får man nul, og der hvor de er forskellige, får man tal forskellige fra nul. Så det prøver vi nu.

Tabel 4 herunder viser tal Nyborgs N=52 tal (tabel 2) trukket fra vores tilsvarende N=62 tal (tabel 3). Da tallene i de to tabeller er beregnet fra to angiveligt forskellige datasæt med et forskelligt antal forsøgspersoner ville man forvente små forskelle på alle tal i alle søjler og rækker. Grunden er, at man ikke kan tilføje ekstra forsøgspersoner uden at middleværdierne ændrer sig (se boks). Spredningen og de andre statistiske værdier ville ligeledes ændre sig. Men det er særdeles bemærkelsesværdigt, at næsten alle værdier er nul. Det er utænkeligt at man kan tilføje 10 forsøgspersoner som i 15 ud af 21 tests har scoret således, at hverken middelværdi eller spredning ændrer sig. Den enkleste forklaring er at Nyborg rent faktisk, som han hævder, har taget fejl af tallet 52, og at der hele tiden har været tale om 62 forsøgspersoner. Men i så fald ville man forvente, at alle tal i tabellen var nul, og det er de ikke. Der er endog store afvigelser, som ses i de celler, der er markeret med lyserødt.

Et eksempel

Lad os se på et helt simpelt eksempel, som illustrerer det vanskelige i at tilføje data uden at tallene for gennemsnit og spredning ændrer sig, og hvorfor dette er utænkeligt hvis man benytter ægte data. Vi har 6 skolebørn, hvis højder er målt til 160, 165, 170, 168, 172 og 161 centimeter; gennemsnitshøjden er således 166 cm. Hvis vi ønskede at svindle, fordi 6 forsøgspersoner var for lidt, kunne vi tilføje en forsøgsperson med højden 166 cm. Det ville give den samme middelværdi. Ingen ville opdage noget! Men ak, desværre. For spredningen på elevernes højde ville ændre sig, fra 4,43 til 4,11.

Med andre ord er det utænkeligt at Nyborg kunne tilføje data for 10 reelle forsøgspersoner uden at alle tallene i tabel 4 ville være forskellige fra nul, dvs. udelukkende lyserøde felter. Det er også utænkeligt, at der hele tiden har været tale om 62 forsøgspersoner, og at Nyborg bare havde skrevet forkert, for så ville alle tallene i tabel 4 være lig med nul, altså ingen lyserøde felter.

Den mest nærliggende forklaring på dette er at der er fiflet med tallene.

Det sagkyndige udvalg undrede sig også over disse forskelle i på side 6 deres rapport af af 16. marts 2006 (bilag 3 i aktindsigten) og kunne ved at regne på tallene i søjle pft bevise (rapportens side 18-19), at Nyborg i 15 af de 20 rækker i tabellen har benyttet N=62, mens det er uklart hvad der er sket med de 5 "lyserøde" rækker. Det sagkyndige udvalg udtaler i forbindelse med dette problem, at det er kritisérbart, at Nyborg som eneforfatter på artiklen ikke kender til det sande indhold af sine data.

Den uundgåelige konklusion er, at på trods af Nyborg selv er citeret for at sige »Tæl, mål og vej – eller hold din kæft!« (linket dødt, PDF her) er han bedøvende ligeglad med data. Hans konklusion er givet på forhånd: kvinder er dummere end mænd. Det er blot et spørgsmål om hvor meget.

Tabel 4. Difference mellem de af Nyborg opgivne tal (52 personer) og beregnede data (62 personer).
mbmgdifpttefspbsoldsdbsdgsdmratiopft
rft_frame_dependence0.090.22-0.140.01-0.03-0.02-0.16-0.09-0.160.15-0.05
rft_response_variability0.020.04-0.02-0.01-0.02-0.010.07-0.05-0.05-1.020.00
rft_field_dependence0.070.22-0.140.02-0.05-0.03-0.07-0.08-0.150.05-0.00
embedded_figures4.021.882.14-0.290.080.04-1.43-2.87-2.18-0.180.26
money0.00-0.000.000.000.00-0.000.000.00-0.090.00-0.00
mental_rotation-0.79-0.46-0.330.06-0.27-0.191.240.170.66-0.23-0.00
tapping_left_hand0.000.000.000.00-0.00-0.00-0.000.00-0.07-0.000.00
tapping_right_hand-0.000.000.000.000.000.00-0.00-0.00-0.010.00-0.00
oral_fluency-0.000.000.00-0.000.000.000.000.00-0.02-0.56-0.00
wais_information0.000.000.00-0.00-0.000.00-0.000.00-0.01-0.000.00
wais_comprehension-0.00-0.00-0.00-0.00-0.000.000.000.000.00-0.000.00
wais_arithmetic-0.00-0.000.000.00-0.00-0.000.000.000.00-0.000.00
wais_similarities0.00-0.00-0.00-0.000.000.000.000.00-0.01-0.00-0.00
wais_digit_span-0.00-0.00-0.000.00-0.00-0.00-0.00-0.00-0.00-0.16-0.00
wais_vocabulary0.000.00-0.000.000.000.00-0.000.00-0.020.000.00
wais_digit_symbol-0.000.00-0.000.00-0.000.000.000.000.00-0.120.00
wais_picture_completion-0.000.00-0.00-0.00-0.00-0.00-0.000.00-0.000.00-0.00
wais_block_design0.000.00-0.000.000.000.00-0.00-0.00-0.00-0.00-0.00
wais_picture_arrangement-0.00-0.00-0.00-0.00-0.000.000.00-0.00-0.00-0.15-0.00
wais_object_assembly-0.00-0.00-0.00-0.00-0.00-0.000.000.000.00-0.130.00

Tabel 4: Beregning af forskelle mellem de af Nyborg opgivne tal (52 personer) og beregnede data (62 personer). Lyserøde felter markerer værdier forskellig fra 0. Søjlerne i tabellen viser: mb: middel score mænd, mg: middel score kvinder, dif: forskel mænd-kvinder, ptt: pval fra t-test, efs: effect size, pbsold: point-biserial correlation beregnet ved brug af den samme (forkerte) formel som Nyborg anvendte på daværende tidspunkt, sdb: standard afvigelse mænd, sdg: standard afvigelse for mænd, sdm: middel standardafvigelse, ratio: forhold sdg/sdb, pft: pval fra F-test.


Permalink