Dæmi D.  Áhrif flokkunarvillu.


Þegar meta á þýðingu skýribreyta er mikilvægt að taka tillit til hversu vel skýribreytur eru mældar. Ef mæliskekkjur eru í skýribreytum bjagar það mat á þýðingu skýribreytunnar og getur einnig bjagað mat á þýðingu annara skýristærða. Hér er gert ráð fyrir mjög einföldu umhverfi, þ.e. að við höfum karla og konur og undirmenn og yfirmenn.  Alger jöfnuður ríkir milli kynja, yfirmenn eru tvöfald hærri en undirmenn.  Við mælingar er gert ráð fyrir að engin mæliskekkja sé í launum en að við flokkun geti það gerst að yfirmaður sé flokkaður sem  undirmaður og öfugt að undirmaður sé flokkaður sem yfirmaður.  Gert er ráð fyrir því að villan sé eins fyrir bæði kyn og að hlutfall yfirmanna í hópi karla sé stærra en í hópi kvenna.  Tölurnar sem ég nota í þessu dæmi eru byggðar á reynslu sem ég öðlaðist við 5 ára starf hjá Kjararannsóknarnefnd.

Tölurnar eru:

Hlutfall Y, yfirmanna meðal karla = 30%
Hlutfall Y, yfirmanna meðal kvenna = 5%
(algengar niðurstöður meðal úrtaks skrifstofufólks, 1980-1989)

Líkur á að yfirmaður sé flokkaður sem yfirmaður = 70%
Líkur á að undirmaður sé flokkaður sem undirmaður = 95%   (Eiginleikar flokkara)

Læknar ofl. þekkja þetta sem sensitivity og specificity(næmi og sértækni). Fyrir AIDS-prófin ELISA og Western-Blot voru þessar tölur 95-98% (1988).  Ég held að gæði flokkara í úrtaki Kjararannsóknarnefndar sé talsvert minni. Ì óformlegri athugun á gæðum flokkunar (valideringu)  í gagnabanka Kjararannsóknarnefndar  reyndist  miklu algengara að yfirmaður væri ranglega  flokkaður sem undirmaður en að undirmaður væri flokkaður sem yfirmaður.  Því nota ég tölurnar 70% og 95%.

Útreikningar í töflum 1 og 2 gefa okkur eftirfarandi töflu:
 
 

Tafla 3   Bjögunaráhrif flokkunarvillu á mæld laun

                         Mæld gildi                                                  Sönn gildi
____________________________________________________________
                      Y                    U                                            Y                    U
____________________________________________________________
Karlar        1,86            1,12                                            2                     1

Konur        1,42             1,02                                           2                     1
____________________________________________________________
 

Útreikningar með reglu Bayes í EXCELeru hér