Þegar meta á þýðingu
skýribreyta er mikilvægt að taka tillit til hversu vel
skýribreytur eru mældar. Ef mæliskekkjur eru í
skýribreytum bjagar það mat á þýðingu
skýribreytunnar og getur einnig bjagað mat á þýðingu
annara skýristærða. Hér er gert ráð
fyrir mjög einföldu umhverfi, þ.e. að við höfum
karla og konur og undirmenn og yfirmenn. Alger jöfnuður
ríkir milli kynja, yfirmenn eru tvöfald hærri en undirmenn.
Við mælingar er gert ráð fyrir að engin mæliskekkja
sé í launum en að við flokkun geti það
gerst að yfirmaður sé flokkaður sem undirmaður
og öfugt að undirmaður sé flokkaður sem yfirmaður.
Gert er ráð fyrir því að villan sé eins
fyrir bæði kyn og að hlutfall yfirmanna í hópi
karla sé stærra en í hópi kvenna. Tölurnar
sem ég nota í þessu dæmi eru byggðar á
reynslu sem ég öðlaðist við 5 ára starf
hjá Kjararannsóknarnefnd.
Tölurnar eru:
Hlutfall Y, yfirmanna meðal karla = 30%
Hlutfall Y, yfirmanna meðal kvenna = 5%
(algengar niðurstöður meðal úrtaks
skrifstofufólks, 1980-1989)
Líkur á að yfirmaður sé flokkaður
sem yfirmaður = 70%
Líkur á að undirmaður sé
flokkaður sem undirmaður = 95% (Eiginleikar flokkara)
Læknar ofl. þekkja þetta sem sensitivity og specificity(næmi og sértækni). Fyrir AIDS-prófin ELISA og Western-Blot voru þessar tölur 95-98% (1988). Ég held að gæði flokkara í úrtaki Kjararannsóknarnefndar sé talsvert minni. Ì óformlegri athugun á gæðum flokkunar (valideringu) í gagnabanka Kjararannsóknarnefndar reyndist miklu algengara að yfirmaður væri ranglega flokkaður sem undirmaður en að undirmaður væri flokkaður sem yfirmaður. Því nota ég tölurnar 70% og 95%.
Útreikningar í töflum
1 og 2 gefa okkur eftirfarandi töflu:
Tafla 3 Bjögunaráhrif flokkunarvillu á mæld laun
Mæld gildi
Sönn gildi
____________________________________________________________
Y
U
Y
U
____________________________________________________________
Karlar 1,86
1,12
2
1
Konur 1,42
1,02
2
1
____________________________________________________________
Útreikningar með reglu Bayes í EXCELeru hér