Økonometri 1: Binær responsmodeller: Logitog probit
1
Økonometri 1
Binær responsmodeller: Logit ogprobit
12. maj 2003
Økonometri 1: Binær responsmodeller: Logitog probit
2
Plan:
Modeller med en binær afhængig variabel: Afsnit 17.1.
Sidste gang:
Modeller for binær respons (p. 554-557).
Link-funktioner: Logistisk, normalfordelt, lineær.
Latent variabel motivation.
Partielle effekter: Kontinuert/diskret variabel.
Maximum likelihood estimation (p. 557-559).
I dag:
Fortolkning og sammenligning af binær respons modeller (p. 559-565).
Respons-sandsynligheder:
Ex. 17.1 fortsat
Tommelfingerregler for sammenligning mellem modeller
Goodness-of-fit
Eksempel: Data fra spørgeskemaerne.
Økonometri 1: Binær responsmodeller: Logitog probit
3
Modeller for binær respons variabler
Model for kvalitativ variabel     med to udfald:
Modellerer respons-sandsynligheden:
Forklarende variabler indgår som et lineært index:
     kan indeholde transformationer (log, kvadratiske,interaktionsled,…)
Ikke-lineær model (i parameteren     )  som følge affunktionsform for         (”link-funktionen”).
Logit:                           Probit:
Økonometri 1: Binær responsmodeller: Logitog probit
4
Partielle effekter på respons-sandsynligheden
Kontinuert forklarende variabel: Alt-andet-lige effekt af en marginalændring af     på respons-sandsynligheden:
Diskret forklarende variabel:     øges til          :
Med udgangspunkt i hvilken værdi af    ?
Gennemsnit for stikprøven,   :
Diskrete variabler: Referenceperson (som er velrepræsenteret istikprøven: kvinde, samlevende, et barn, mellemlanguddannelse,…).
Økonometri 1: Binær responsmodeller: Logitog probit
5
Partielle effekter på respons-sandsynligheden:Sammenligning af modeller
Koefficienter i det lineære indeks kan ikke sammenlignes direkte.
Ex. Samlevende amerikanske kvinder deltagelse i arbejdsstyrken:Forklaret ved samlevers indkomst, uddannelse,arbejdsmarkedserfaring, alder, (små) børn,…(Ex. 17.1).
Fokus: Effekten af småbørn (under skolealder), kidslt6 (antal børnunder 6 år), og effekten af samlevers indkomst, nwifeinc.
Uddrag af koefficienter i de tre modeller (afh. Variabel: inlf)
Variabel
Lineær sandsynlighedsm.
Logit
Probit
nwifeinc
-0.0034
(0.0015)
-0.021
(0.008)
-0.012
(0.005)
kidslt6
-0.262
 (0.034)
-1.443
(0.204)
-0.868
(0.119)
Økonometri 1: Binær responsmodeller: Logitog probit
6
Partielle effekter på respons-sandsynligheden:Sammenligning (2)
Referenceperson: Ex. 17.1.
Kvantitative variabler: nwifeinc=20.13, exper=10.6, expersq=112.36,age=42.5
Kvalitative variabler: kidsge6=1, kidslt6=0
P(y=1|x-ref)
Lineærsandsynlighedsm.
Logit
Probit
educ=5
0.388
0.320
0.333
educ=12.3
0.665
0.703
0.700
educ=17
0.844
0.870
0.873
Økonometri 1: Binær responsmodeller: Logitog probit
7
Partielle effekter på respons-sandsynligheden:Sammenligning (3)
Referenceperson: nwifeinc=20.13, exper=10.6, expersq=112.36,age=42.5, kidsge6=1, kidslt6=0.
Marginal effekt af at øge kontinuert variabel nwifeinc:
 
P(y=1|x)
Lineærsandsynlighedsm.
Logit
Probit
educ=5
-0.0034
-0.0046
-0.0044
educ=12.3
-0.0034
-0.0044
-0.0042
educ=17
-0.0034
-0.0024
-0.0025
Økonometri 1: Binær responsmodeller: Logitog probit
8
Partielle effekter på respons-sandsynligheden:Sammenligning (4)
Referenceperson: nwifeinc=20.13, exper=10.6, expersq=112.36,age=42.5, kidsge6=1.
Partiel effekt af at øge kidslt6 med 1:
 
LPM
Logit
Probit
 
Øgesfra:
 
educ
=5
educ
=12.3
educ
=17
educ
=5
educ
=12.3
educ
=17
0
-0.262
-0.220
-0.344
-0.257
-0.235
-0.335
-0.266
1
-0.262
-0.074
-0.242
-0.341
-0.082
-0.253
-0.332
2
-0.262
-0.025
-0.025
-0.191
-0.014
-0.094
-0.204
 
Økonometri 1: Binær responsmodeller: Logitog probit
9
Partielle effekter på respons-sandsynligheden:Sammenligning (5)
Signifikans: Direkte på
Sammenligning mellem logit-og probit-estimater: Skalering
Tommelfingerregel: Sammenligningsfaktor: 0.4/0.25 = 1.6.
Tommelfingerregel for sammenligning med LPM:
Faktor 4 i forhold til logit
Faktor 2.5 i forhold til probit
I arbejdsudbudseksemplet:
 
Økonometri 1: Binær responsmodeller: Logitog probit
10
Goodness of fit (1)
To mulige udfald: y=1 eller y=0
Prediktion fra logit eller probit model:
Pseudo-R2 mål: Sammenlign med model udenforklarende variabler:
Reminder: Topunkts-fordelingen:
Maximeret log-likelihoodværdi:
Økonometri 1: Binær responsmodeller: Logitog probit
11
Goodness of fit (2)
Maximeret log-likelihoodværdi for logit/probit:
Pseudo R2 baseret på max log likelihood (LR-index):
Egenskaber:
Økonometri 1: Binær responsmodeller: Logitog probit
12
Goodness of fit (3)
Andel korrekt predikterede observationer:
 
 
Optæl korrekt predikterede observationer, dvs. de individer hvor
eller
Andel ukorrekt predikterede observationer:
Økonometri 1: Binær responsmodeller: Logitog probit
13
Goodness of fit (4)
Benchmark for andel korrekt predikterede observationernaiv prediktion):
 
 
Andel ukorrekt naivt predikterede observationer:
Prediktionsbaseret goodness of fit mål:
Naiv model har altid mere end 50% korrekte: Ikke altidsærligt oplysende mål.
Økonometri 1: Binær responsmodeller: Logitog probit
14
Eksempel: Data fra spørgeskemaerne.
Statistiske resultater for binær responsmodeller erasymptotisk begrundede.
Konsistens
Asymptotisk normalitet af
Men vi vil alligevel (forsøgsvist) prøve at se lidt mere påresultater for spørgeskemaerne (n<100).
SAS kørsler for spørgeskemadata.
Økonometri 1: Binær responsmodeller: Logitog probit
15
Næste gang: Mandag 19. maj
Afslutningsforelæsning.
At udføre et empirisk projekt: Kap. 19.
Sammenfatning af faget: Ekstern evaluering.
Mere eksamensinfo.