Utilisateur
an element d is contained in a set N.
a set is a collection of things that are called elements
it is the argument that minimizes the function
what is affected/where we are measuring the causal effect, etc classrom level
what is the cause, etc class room size and how its affecting score, D
what is caused, etc test scores, Y
when we are able to manipulate the size of the classroom, D (treatment) is now called the coubterfactual classroom.
D är det allmänna för att beteckna treatment, d är när vi har fått en siffra på det. Y(d) är the outcome based on the value ( of d. Den visar att output depends on the treatment. Y(d) represents the hypothetical outcomes under certain assigned size of d, etc class room size.
Y(D+1) - Y(D) vilket är en before and after comparison, except that the after only happens in our experiment and nit in reality
identification problem har och göra med ceteris paribus vilket vi inte kan uppnå. Ex så kan vi inte observe en klass och sedan göra samma studie med treatment för att se treatment effect, då eleverna har nya kunskaper och går ett år högre upp. optimalt hade varit att ta en tidsmaskin och åka tillbaka och erase deras memories och applicera treatment effect, men det är omöjligt. lösningen är att man kan study ett annat classroom med 36 studenter (D+1) medan det andra är 35 (D).
D är the controlled unit och är the low treatment intensity group. D+1 kallas för treated unit för att det recieves a higher treatment intensity.
cohort size och can affext class size som påverkar testacore. socioeconomic background can påverka test score, etc neighborhood. pdindex som är precentaged disadvantaged kan användas av politiker för att påverka class size eller material till skolor som påverkar test score.
confounding variables afe in the background and systematically changes the potential outcome. confounding variables are correlated with the variable of interest (D). etc pdindex correlerar med class size.
Ceteris paribus. alla andra variabler måste hållas konstanta. detta betyder att pdindex måste ha samma värde i båda klasser som man jämför
1) some observations will have positive and som will have negative residuals (errors), but the average will be close to zero.
detta kallas för exogeneity assumption: E[u| X1=x1, X2=x2] = 0
om samplet är large enough we can by the law of large numbers say that population average ≈ sample average. we assume ekvationen ovan att vara approximately true in the population, och med ett tillräckligt stort sample kan vi även anta att average u är 0 även i samplet.
the expectation (average) of the error term u in all subsamples given that the subsamples have variable X1 with the value x1 (same for X2 and x2). we assume that X1=x1 och X2=x2 är well balanced (runt 0) so they average out to be 0. we assume this for rhe population, but by the law of large numbers we can apply this assumtion for subsamples.
Ȳ(D+1,X) - Ȳ(D, X) = Êstimated treatment effect
1) if we have a confounder it would end up in u, but we have assumed u to be 0. we would have trouble justifying the exogeneity assumption. we could add X2 into the model but that brings:
2) by adding another confounder, we would have fewer observations that have the same value for the confounder. this is a risk for the law of large numbers since we need a large sample to apply this law.
Curse of dimensionality: adding another confoubder diminishes the size of the sample that we can use.
true