Utilisateur
conditional mean function. it gices us the average value of a random variable in a subpopulation satisfying certain conditions.
m(x1,x2,x3) = E[Y| X1=x1, ..,]
genom att derive an ols estimator
expected prediction error som uppstår ifall Y skiljer sig från det värde vi have predicted. man kan antingen välja ett fixed value eller the population average that always gives the smallest presiction error. E[Y] är the average/expected of the randol variable output.
E[ (Y-E[Y])^2]
att använda expected minimizes the prediction error och det vet vi sedan tidigare att expectetion makes the best prediction/estimates values close to the true value
att m(x) som är CMF skulle ge the best prediction using information in x.
att u inte kan bli predicted by the regressors (x1,x2 osv)
det får inte vara någon correlation mellan x1 och någon av de variablers effekter som fångas upp av u, för då skulle vi kunna säga någon om u genom att kolla på x1, vilket vi inte får göra. it is fairly easy to argue that the assumption does not hold since the regressors and error term oftek correlate in some way
is called a least squares estimator
least ordinary squares estimator (ols) and can be done in stata
när man har en dummy för varje grupp, men man ska alltid ha någon grupp som representeras när dummy = 0
if we have a large sample, it will be similar to the population?? sök på google
B^ = côv(X,Y) / vâr(x) man har alltid den man regressar on i nämnaren för varians.
regress Y on X, då är x i nämnaren
vâr(û) + vâr(Ŷ) = vâr(Y)
vâr(û) / vâr(Y) + vâr(Ŷ) / vâr(Y) = 1
R^2 = vâr(Ŷ) / vâr(Y)
R2 säger ju oss hur mycket av variationen som can be explained by the model.