KM2: F17
1
Kvantitative metoder 2
Dummyvariabler
2. april 2007
KM2: F17
2
Interaktionsled med dummyvariabler
Interaktionsled med dummyvariabler er heltanalogt til interaktionsled med kvantitativevariable og ofte anvendt
Eksempel: Lønregression med interaktionseffektmellem to dummyvariabler, civilstand og køn.
KM2: F17
3
Eksempel: Interaktionsled med todummyvariabler
Effekten af civilstand og køn.
Den forventede log timeløn (når vi ser bort fraeffekten af uddannelse, erfaring og intercept)
Param./est.
Gift
Single
Mand
0
0
-0.05
Kvinde
-0.19
-0.17
KM2: F17
4
Eksempel: Interaktionsled med dummyvariabler
Kan modellen formuleres således
hvor gift kvinde, single mand, og single kvindeer dummyvariabler ?
KM2: F17
5
Interaktionsled med dummyvariabler ogkvantitative variabler
Interaktionsled mellem dummyvariabler og kvantitativevariabler kan fortolkes som forskellig effekt af denkvantitative variabel
Grafisk: Forskellige hældninger (se figur 7.2)
Eksempel: Lønrelationen - afkastet af erfaring afhængeraf køn
Samme afkast af erfaring:
Ingen forskel på kvinder og mænd:
KM2: F17
6
Chow test: To grupper
Test for om der er forskel mellem to grupper.
Modellen kan formuleres ved brug af dummy (d2=0 forgruppe 1, d2=1 for gruppe 2)
Hypotesen kan formuleres som
Modellen kan ækvivalent skrives som
hvor g=1,2 (to forskellige grupper) og hypotesen er:
                                               k+1 restriktioner
Relationen mellem parametrene:
KM2: F17
7
Chow test: To grupper (fortsat)
Chow-teststørrelsen udregnes ved at lave treregressioner af y på en konstant og(uden brug af dummy-variabler)
SSR størrelsen til hver af de tre regressioner noteres:
Regression for gruppe 1 alene -> SSR1
Regression for gruppe 2 alene -> SSR2
Regression for både gruppe 1 og 2 -> SSRP
KM2: F17
8
Chow test: To grupper (fortsat)
Teststørrelsen
Hvor n er det samlede antal obs. (både fra gruppe 1og 2)
k+1 er antal restriktioner
Teststørrelsen er F-fordelt med (k+1, n-2(k+1))frihedsgrader
NB: Et klassisk F-test:
Forudsætter samme varians i hver gruppe
KM2: F17
9
Chow test: To grupper (fortsat)
Eksempel: Lønrelation med udd. og erfaring
Grupper: Mænd og kvinder
Model
Teststørrelse (se SAS-output)
F-fordelt med (3,1040) frihedsgrader
KM2: F17
10
Chow test: Generelt
Generaliserer til m forskellige grupper (perioder,regioner, lande, …)
Teststørrelsen
Hvor n er det samlede antal obs. (fra alle m grupper)
(m-1)(k+1) er antal restriktioner
Teststørrelsen er F-fordelt med
((m-1)(k+1), n-m(k+1)) frihedsgrader
Robust udgave kræver samlet model medinteraktionsled.
KM2: F17
11
Hvad nu hvis den afhængige variabel er enkvalitativ egenskab (med to kategorier)?
Indtil nu har vi betragtet afhængige variabler som erkvantitative (løn, priser, forbrug, indkomst,…)
Nu: Diskret afhængig variabel med to værdier
Eksempler:
Deltager på arbejdsmarkedet eller ej
Består et kursus eller ej
Har bil eller ej
Videregående udd. eller ej
Har investeret i aktier eller ej
Firma gået konkurs eller ej
KM2: F17
12
Lineær sandsynlighedsmodel
For en kvalitativ egenskab med to kategorier laver man endummyvariabel y med to mulige udfald: y=0 eller y=1
Regressionsmodellen er uændret:
Modellen kaldes den lineære sandsynlighedsmodel (linearprobability model, LPM)
Hvis antagelsen MLR.4 er opfyldt:
er den betingede middelværdi af y:
For binære variabler gælder generelt at:
Altså har vi en model for responssandsynligheden
KM2: F17
13
Lineær sandsynlighedsmodel
Sandsynligheden for y=0 (betinget på x) kan så udregnes som
Fortolkningen af parametrene i LPM:
er en diskret variabel
Parameteren     kan ikke fortolkes som den marginale ændring iy givet en enheds ændring i
Parameteren angiver ændringen i sandsynligheden for y=1 somfølge af, at den forklarende variabel ændres med en enhed:
LPM kan estimeres med OLS
Hvor    skal fortolkes som den predikterede sandsynlighed for y=1.
KM2: F17
14
Lineær sandsynlighedsmodel
Ulemper ved LPM:
Prediktionerne er ikke 0 eller 1, som er de tilladte værdier af denafhængige variabel
Predikterede sandsynligheder kan være negative eller overstige 1
Normalt ligger den predikterede sandsynlighed mellem 0 og 1, nårman ser på værdier af de forklarende variable der ligger omkringgennemsnittet.
Gauss-Markov antagelserne:
MLR.1-4 kan godt være opfyldt for LPM
LPM opfylder ikke antagelsen MLR.5 (Homoskedasticitet)
KM2: F17
15
Lineær sandsynlighedsmodel
 
KM2: F17
16
Lineær sandsynlighedsmodel
Egenskaber ved OLS estimatoren i LPM
OLS estimaterne er middelrette (givet MLR.1-4)
Standardfejlene af estimaterne er ikke middelrette
F og t test ikke pålidelige
Problemet med heteroskedasticitet kan løses ved at korrigerestandardfejlene og beregne robuste standardfejl: Sjældent nogetalvorligt problem.
Problemet med negative ssh. og ssh. over 1 kan kun løses ved atbenytte en anden model end LPM. Alternative modeller introduceresi Kvantitative metoder 3.
KM2: F17
17
NB’er
Interaktionsled mellem dummyvariabler og kvantitativevariabler giver mulighed for, at effekter kan varieremellem forskellige grupper
Formen for Chow-testet er det almindelige F-test
En robust udgave af testet kan beregnes på grundlagaf den samlede model med interaktionsled.
KM2: F17
18
Næste gang:
Ingen forelæsning på onsdag i denne uge.
Næste forelæsning: Onsdag den 11. april.
Kapitel 8: Heteroskedasticitet og generaliseret lineærregression: Tre forelæsningsgange.
Obligatorisk opgave 2: Ligger på hjemmesiden sidenfredag kl. 14.
Mulighed for hjælp pr. e-mail til download af data i dag
Mulighed for hjælp ved øvelsesgangen i uge 14/15
Afleveres gruppevist og online senest 16. april kl. 10.15.