Modèle lpm

Long, J. S. (1997) modèles de régression pour les variables dépendantes catégorielles et limitées (1re éd.). Sage Publications, Inc. Hellevik, O. (2007) régression linéaire versus logistique lorsque la variable dépendante est une dichotomie. Qualité & quantité, 43 (1), 59 – 74. http://doi.org/10.1007/s11135-007-9077-3. Les conditions de premier ordre pour les OLS et le logit MLE impliquent une belle propriété: Si vous calculez une probabilité “non traitée” prédit pour chaque personne, en utilisant ses valeurs covariées réelles, mais en définissant le mannequin de traitement à 0, puis la moyenne “non traitée” prédiction dans le Groupe de contrôle est égal à la moyenne de contrôle brut. Dans de grands échantillons, ce sera très similaire à la prédiction moyenne “non traitée” dans l`échantillon complet (puisque la distribution des covariables dans le groupe témoin ressemblera à la distribution dans l`échantillon complet).

Ce dernier est une moyenne de contrôle ajustée par régression. Nous avons donc une moyenne de contrôle ajustée qui jouit des mêmes propriétés de consistance que la moyenne de contrôle brut. Le modèle suppose que, pour un résultat binaire (essai Bernoulli), Y {displaystyle Y}, et son vecteur associé de variables explicatives, X {displaystyle X}, [1] c`est l`un des problèmes que le modèle logistique a près de p = 0. Par ailleurs, dans cette situation, le modèle de probabilité linéaire est impartial. Grand point, et voir les mises à jour de mon lien en conséquence. R n`a pas réussi à lancer un avertissement parce que sa «tolérance de convergence positive» est effectivement satisfaite. Plus libéralement parlant, le MLE existe et est moins l`infini, qui correspond à p = 0, donc ma nouvelle approche est de simplement utiliser p = 0 dans le cas de bord. La seule autre chose cohérente que je peux penser à faire est de rejeter les pistes de la simulation où y est identique à zéro, mais qui conduirait clairement à des résultats encore plus contre la revendication initiale King & Zeng que “les probabilités d`événements estimés sont trop petits! Le modèle de probabilité linéaire est rapide par comparaison, car il peut être estimé de manière non itérative à l`aide de moindres carrés ordinaires (OLS). OLS ignore le fait que le modèle de probabilité linéaire est hétérokedastic avec la variance résiduelle p (1-p), mais l`hétérocedasticité est mineur si p est entre .20 et. 80, qui est la situation où je recommande d`utiliser le modèle de probabilité linéaire à tous. Les estimations de l`OLS peuvent être améliorées en utilisant des erreurs standard cohérentes avec l`hétérocedasticité ou des moindres carrés pondérés.

Dans mon expérience, ces améliorations font peu de différence, mais elles sont rapides et rassurantes. L`hypothèse selon laquelle l`erreur est normalement distribuée est essentielle pour effectuer des tests d`hypothèses après avoir estimé votre modèle économétrique. Vous avez été les défenseurs de l`estimation de la LPM en utilisant OLS, donc je serais très intéressé de voir vos vues sur ce sujet. De même, nous pouvons calculer une probabilité dite «traitée» pour chaque personne, et la moyenne du groupe de traitement ajusté qui en résulte jouit des mêmes propriétés de consistance que la moyenne du groupe de traitement brut. Ainsi, la différence entre le traitement ajusté et les moyens de groupe de contrôle est cohérente pour ATE. Rien de tout cela ne dépend du modèle étant correct. Cela dépend de si vous avez l`intention que vos conclusions s`appliquent à votre échantillon d`étude, ou à la population des États-Unis. Si vous êtes seulement généralisant à l`échantillon d`étude, alors la probabilité de la maladie est 50%, et — pourvu qu`il n`y ait aucune valeur covariée pour laquelle la probabilité est plus de 80% ou moins de 20% — vous pouvez utiliser en toute sécurité un modèle de probabilité linéaire.

Revenons à la situation précédente, où vous avez jeté des jeux de données si tous les ys étaient 0. Parmi les jeux de données qui restent, l`attente de Y n`est plus. 01. Il s`agit de. 0158. Si l`estimand est. 0158, et votre estimation moyenne .01, alors vous avez le biais.