Monday, 13 February 2017

Interprétation Arch Résultats Dans Stata Forex

Bienvenue à l'Institut de recherche et d'éducation numériques Stata Analyse de régression logistique de sortie annotée Cette page présente un exemple d'analyse de régression logistique par régression avec des notes de bas de page expliquant la sortie. Ces données ont été recueillies auprès de 200 élèves des écoles secondaires et obtiennent des notes sur différents tests, dont des sciences, des mathématiques, de la lecture et des études sociales (socst). La variable femelle est une variable dichotomique codée 1 si l'étudiant était une femme et 0 si masculin. Parce que nous n'avons pas une variable dichotomique appropriée à utiliser comme notre variable dépendante, nous allons créer un (qui nous appellerons honcomp pour la composition honneurs) sur la base de la variable continue écrire. Nous ne préconisons pas de faire des variables dichotomiques à partir de variables continues plutôt, nous le faisons ici uniquement aux fins de cette illustration. Log Itération a. Il s'agit d'une liste des probabilités log à chaque itération. (Rappelez-vous que la régression logistique utilise la probabilité maximale, qui est une procédure itérative.) La première itération (appelée itération 0) est la probabilité log du modèle quotnullquot ou quotemptyquot qui est un modèle sans prédicteurs. À la prochaine itération, le ou les prédicteurs sont inclus dans le modèle. À chaque itération, la probabilité de log augmente parce que l'objectif est de maximiser la probabilité logarithmique. Lorsque la différence entre les itérations successives est très faible, on dit que le modèle est quotconvergé, l'itération est arrêtée et les résultats sont affichés. Pour plus d'informations sur ce processus, voir Modèles de régression pour variables catégorielles et dépendantes limitées par J. Scott Long. Résumé du modèle b. Probabilité de consignation - C'est la probabilité logarithmique du modèle final. La valeur -80.11818 n'a pas de signification en soi mais plutôt, ce nombre peut être utilisé pour aider à comparer les modèles imbriqués. C. Nombre d'obs - C'est le nombre d'observations qui ont été utilisées dans l'analyse. Ce nombre peut être inférieur au nombre total d'observations dans votre jeu de données si vous avez des valeurs manquantes pour l'une des variables utilisées dans la régression logistique. Stata utilise une suppression par liste par défaut, ce qui signifie que s'il y a une valeur manquante pour toute variable dans la régression logistique, le cas entier sera exclu de l'analyse. ré. LR chi2 (3) - Il s'agit du test du coefficient de vraisemblance (LR) chi-carré. La statistique du test du chi-carré de vraisemblance peut être calculée à la main comme 2 (115.64441 - 80.11818) 71.05. Ceci est moins deux (c'est-à-dire -2) fois la différence entre la probabilité de début et de fin de journal. Le nombre entre parenthèses indique le nombre de degrés de liberté. Dans ce modèle, il ya trois prédicteurs, donc il ya trois degrés de liberté. E. Prob gt chi2 - Il s'agit de la probabilité d'obtenir la statistique du chi carré étant donné que l'hypothèse nulle est vraie. En d'autres termes, il s'agit de la probabilité d'obtenir cette statistique chi-carré (71.05) s'il n'y a en fait aucun effet des variables indépendantes, prises ensemble, sur la variable dépendante. Il s'agit bien entendu de la valeur p, qui est comparée à une valeur critique, peut-être 0,05 ou 0,01 pour déterminer si le modèle global est statistiquement significatif. Dans ce cas, le modèle est statistiquement significatif parce que la valeur p est inférieure à .000. F. Pseudo R2 - C'est le pseudo R-carré. La régression logistique n'a pas l'équivalent du R-carré qui se trouve dans la régression OLS cependant, beaucoup de gens ont essayé de trouver un. Il existe une grande variété de statistiques pseudo-R-carrées. Parce que cette statistique ne signifie pas ce que R-carré signifie dans la régression MCO (la proportion de variance expliquée par les prédicteurs), nous suggérons d'interpréter cette statistique avec beaucoup de prudence. Paramètres Estimations g. Honcomp - C'est la variable dépendante dans notre régression logistique. Les variables énumérées ci-dessous sont les variables indépendantes. H. Coef. - Ce sont les valeurs de l'équation de régression logistique pour prédire la variable dépendante à partir de la variable indépendante. Ils sont en unités log-odds. Similaire à la régression OLS, l'équation de prédiction est log (p1-p) b0 b1female b2read b3science où p est la probabilité d'être dans la composition des honneurs. Les équations de régression logistique (p1-p) -12.7772 1.482498female .1035361read 0947902science Ces estimations vous indiquent la relation entre les variables indépendantes et la variable dépendante, où la variable dépendante est Sur l'échelle logit. Ces estimations indiquent le montant de l'augmentation des probabilités de log prononcées de honcomp 1 qui serait prédit par une augmentation de 1 unité dans le prédicteur, en maintenant tous les autres prédicteurs constants. Note: Pour les variables indépendantes non significatives, les coefficients ne sont pas significativement différents de 0, ce qui doit être pris en compte lors de l'interprétation des coefficients. (Voir les colonnes avec les valeurs z et les valeurs p pour vérifier si les coefficients sont statistiquement significatifs). Parce que ces coefficients sont en unités log-odds, ils sont souvent difficiles à interpréter, de sorte qu'ils sont souvent convertis en odds ratios. Vous pouvez le faire manuellement en exponentiant le coefficient ou en utilisant l'option ou avec la commande logit ou en utilisant la commande logistique. Femelle - Le coefficient (ou estimation de paramètre) pour la variable femelle est 1,482498. Cela signifie que pour une augmentation d'une unité chez la femelle (c'est-à-dire allant du mâle à la femelle), on s'attend à une augmentation de 1,482498 dans les probabilités logarithmiques de la variable dépendante honcomp. En maintenant toutes les autres variables indépendantes constantes. Read - Pour chaque augmentation d'une unité dans le score de lecture (donc, pour chaque point supplémentaire sur le test de lecture), on s'attend à une augmentation de .1035361 dans les probabilités de log de honcomp. En maintenant toutes les autres variables indépendantes constantes. Science - Pour chaque augmentation d'une unité dans le score de la science, nous nous attendons à une augmentation de .0947902 dans le log-probabilités de honcomp. En maintenant toutes les autres variables indépendantes constantes. Constant - Il s'agit de la valeur attendue des probabilités log de honcomp lorsque toutes les variables prédictives sont égales à zéro. Dans la plupart des cas, ce n'est pas intéressant. De plus, souvent, zéro n'est pas une valeur réaliste pour une variable à prendre. je. Std. Se tromper. - Ce sont les erreurs-types associées aux coefficients. L'erreur standard est utilisée pour tester si le paramètre est significativement différent de 0 en divisant l'estimation du paramètre par l'erreur standard que vous obtenez une valeur z (voir la colonne avec les valeurs z et les valeurs p). Les erreurs standard peuvent également être utilisées pour former un intervalle de confiance pour le paramètre, comme indiqué dans les deux dernières colonnes de ce tableau. J. Z et Pgtz - Ces colonnes fournissent la valeur z et la valeur p à deux colonnes utilisées pour tester l'hypothèse nulle que le coefficient (paramètre) est 0. Si vous utilisez un test à 2 cols, vous comparez alors chaque valeur p À votre valeur présélectionnée de alpha. Les coefficients ayant des valeurs de p inférieures à alpha sont statistiquement significatifs. Par exemple, si vous choisissez l'alpha comme étant 0,05, les coefficients ayant une valeur de p de 0,05 ou moins seraient statistiquement significatifs (c'est-à-dire que vous pouvez rejeter l'hypothèse nulle et dire que le coefficient est significativement différent de 0). Si vous utilisez un test à 1 queue (c'est-à-dire que vous prédisez que le paramètre va dans une direction particulière), vous pouvez diviser la valeur p par 2 avant de la comparer à votre niveau alpha présélectionné. Avec un test à deux cols et un alpha de 0,05, vous pouvez rejeter l'hypothèse nulle que le coefficient de femelle est égal à 0. Le coefficient de 1,482498 est significativement supérieur à 0. Le coefficient de lecture est 0,1035361 significativement différent de 0 à l'aide d'alpha De 0,05 car sa valeur p est de 0,000, ce qui est inférieur à 0,05. Le coefficient pour la science est .0947902 significativement différent de 0 en utilisant l'alpha de 0,05 parce que sa valeur p est de 0,000, ce qui est inférieur à 0,05. K. 95 Conf. Intervalle - Indique un intervalle de confiance de 95 pour le coefficient. C'est très utile car il vous aide à comprendre à quel point la valeur réelle de la population du paramètre peut être élevée et faible. Les intervalles de confiance sont liés aux valeurs p telles que le coefficient ne sera pas statistiquement significatif si l'intervalle de confiance comprend 0. Ratios des cotes Dans cet exemple suivant, nous illustrerons l'interprétation des rapports de cotes. Nous utiliserons la commande logistique pour voir les rapports de cotes au lieu des coefficients. Dans cet exemple, nous allons simplifier notre modèle afin que nous ayons un seul prédicteur, la variable binaire femelle. Avant d'exécuter la régression logistique, nous utiliserons l'instruction tab pour obtenir un tableau croisé des deux variables. Si nous divisons le nombre d'hommes qui sont dans la composition des honneurs, 18, par le nombre de mâles qui ne sont pas dans la composition des honneurs, 73, nous obtenons les chances d'être dans la composition des honneurs pour les hommes, 1873 .24657534. Si nous faisons la même chose pour les femelles, nous obtenons 3574 .47297297. Pour obtenir le rapport de cotes, qui est le ratio des deux cotes que nous venons de calculer, nous obtenons .47297297.24657534 1.9181682. Comme nous pouvons le voir dans la sortie ci-dessous, c'est exactement le rapport de cotes que nous obtenons de la commande logistique. La chose à retenir ici est que vous voulez que le groupe codé 1 sur le groupe codé comme 0, donc honcomp1honcomp0 pour les hommes et les femmes, puis la probabilité pour femalesodds pour les hommes, car les femelles sont codées comme 1. En ce qui concerne la Nous ne voulons pas que cette valeur inclue la valeur 1. Lorsque nous considérions les coefficients, nous ne voulions pas que l'intervalle de confiance comprenne 0. Si on exponentiate 0, on obtient 1 (exp (0) 1). Il y a donc deux manières de dire la même chose. Comme vous pouvez le voir, l'intervalle de confiance 95 inclut 1, donc le rapport de cotes n'est pas statistiquement significatif. Comme la limite inférieure de l'intervalle de confiance 95 est si proche de 1, la valeur p est très proche de 0,05. Il ya quelques autres choses à noter sur la sortie ci-dessous. La première est que, bien que nous ayons une seule variable prédictive, le test du rapport de probabilité ne correspond pas au test global du modèle. Ceci est dû au fait que la statistique z est en fait le résultat d'un test Wald chi-carré, tandis que le test du modèle global est un coefficient de vraisemblance chi-carré. Bien que ces deux types de tests chi-carré soient asymptotiquement équivalents, dans de petits échantillons ils peuvent différer, comme ils le font ici. En outre, nous avons la malheureuse situation dans laquelle les résultats des deux tests donnent des conclusions différentes. Cela ne se produit pas très souvent. Dans une situation comme celle-ci, il est difficile de savoir quoi conclure. On pourrait considérer le pouvoir, ou on pourrait décider si un odds ratio de cette importance est important d'un point de vue clinique ou pratique. Le contenu de ce site Web ne doit pas être interprété comme un endossement d'un site Web particulier, un livre, ou un produit logiciel par l'Université de Californie. Bienvenue à l'Institut de recherche numérique et d'éducation Stata FAQ Comment puis-je effectuer le rapport de vraisemblance, Wald , Et test de multiplicateur de Lagrange (score) dans Stata Le test du coefficient de vraisemblance (lr), le test de Wald et le test multiplicateur de Lagrange (parfois appelé test de score) sont couramment utilisés pour évaluer la différence entre les modèles imbriqués. Un modèle est considéré comme imbriqué dans un autre si le premier modèle peut être généré en imposant des restrictions sur les paramètres de la seconde. Le plus souvent, la restriction est que le paramètre est égal à zéro. Dans un modèle de régression, la restriction des paramètres à zéro est réalisée en supprimant les variables prédictives du modèle. Par exemple, dans les modèles ci-dessous, le modèle avec les variables predictor femelle. et lis . Est imbriquée dans le modèle avec les variables prédictives femelles. lire . les maths . Et la science. Les tests multiplicateurs de lr, Wald et Lagrange posent la même question de base, c'est-à-dire, en contraignant ces paramètres à zéro (c'est-à-dire en laissant de côté ces variables de prédiction) réduisent significativement l'ajustement du modèle Pour effectuer un test de rapport de vraisemblance, Des modèles que l'on souhaite comparer. L'avantage des tests Wald et score est qu'ils se rapprochent du test lr mais exigent qu'un seul modèle soit estimé. Lorsque la puissance de calcul a été beaucoup plus limitée, et de nombreux modèles a pris beaucoup de temps à courir, ce fut un avantage assez important. Aujourd'hui, pour la plupart des modèles que les chercheurs sont susceptibles de vouloir comparer, ce n'est pas un problème, et nous recommandons généralement de faire fonctionner le test de rapport de vraisemblance dans la plupart des situations. Cela ne veut pas dire que l'on ne devrait jamais utiliser les tests Wald ou score. Par exemple, le test de Wald est couramment utilisé pour effectuer des tests de degrés de liberté multiples sur des ensembles de variables fictives utilisées pour modéliser des variables catégorielles en régression (pour plus d'informations, consultez notre site Web sur la régression avec Stata, plus précisément le chapitre 3 - régression avec prédicteurs catégoriques). Un autre exemple est les indices de quotmodification utilisés dans la modélisation d'équations structurelles, ce sont des tests de multiplicateurs de Lagrange. Comme nous l'avons mentionné plus haut, le test lr exige que deux modèles soient exécutés, dont l'un possède un ensemble de paramètres (variables), et un second modèle avec tous les paramètres du premier, plus une ou plusieurs autres variables. Le test de Wald examine un modèle avec plus de paramètres et d'évaluer si la restriction de ces paramètres (généralement à zéro, en supprimant les variables associées à partir du modèle) sérieusement nuire à l'ajustement du modèle. En revanche, le test de score examine les résultats d'un modèle plus petit et demande si l'ajout d'une ou de plusieurs variables omises améliorerait l'ajustement du modèle. En général, les trois tests devraient aboutir à la même conclusion (parce que le test de Wald et score, au moins en théorie, est approximatif du test lr). À titre d'exemple, nous allons tester une différence statistiquement significative entre deux modèles, en utilisant les trois tests. L'ensemble de données de cet exemple comprend des données démographiques, ainsi que des résultats de tests normalisés pour 200 élèves du secondaire. Nous allons comparer deux modèles. La variable dépendante pour les deux modèles est hiwrite (à imbriquer deux modèles doivent partager la même variable dépendante), qui est une variable dichotomique indiquant que l'étudiant avait un score d'écriture qui était au-dessus de la moyenne. Il existe quatre variables prédictives possibles, les femmes. Une variable factice qui indique que l'étudiant est une femme et les variables continues lues. les maths . Et la science. Qui sont les élèves normalisés des résultats des tests en lecture, en mathématiques et en sciences, respectivement. Nous testerons un modèle contenant uniquement les variables prédictives femelle et lues. Contre un modèle qui contient les variables prédictives femelle et lue. Ainsi que les variables prédictives additionnelles, mathématiques et sciences. Exemple d'un test de rapport de vraisemblance. Comme discuté ci-dessus, le test lr consiste à estimer deux modèles et à les comparer. La fixation d'un ou plusieurs paramètres à zéro, en supprimant les variables associées à ce paramètre du modèle, rendra presque toujours le modèle moins bien adapté, de sorte qu'un changement dans la probabilité de log ne signifie pas nécessairement que le modèle avec plus de variables s'adapte nettement mieux. Le test lr compare les probabilités de log des deux modèles et teste si cette différence est statistiquement significative. Si la différence est statistiquement significative, alors le modèle moins restrictif (celui avec plus de variables) correspondrait mieux aux données que le modèle plus restrictif. La statistique de test lr est calculée de la manière suivante: L (m) indique la probabilité du modèle respectif, Et ll (m) le log naturel de la probabilité des modèles. Cette statistique est distribuée au chi carré avec des degrés de liberté égaux à la différence de nombre de degrés de liberté entre les deux modèles (c'est-à-dire le nombre de variables ajoutées au modèle). Afin d'effectuer le test de rapport de vraisemblance, nous devrons exécuter les deux modèles et prendre note de leur vraisemblance logarithme finale. Nous allons exécuter les modèles à l'aide de Stata et utiliser des commandes pour stocker les probabilités log. Nous pourrions également copier les probabilités vers le bas (c'est-à-dire en les écrivant, ou en les coupant et en collant), mais en utilisant des commandes est un peu plus facile et est moins susceptible de provoquer des erreurs. La première ligne de syntaxe ci-dessous lit dans l'ensemble de données de notre site Web. La deuxième ligne de syntaxe exécute un modèle de régression logistique, prédisant hiwrite basé sur les élèves de sexe (femme), et la lecture des scores (lire). La troisième ligne de code stocke la valeur de la vraisemblance logarithmique pour le modèle, qui est stockée temporairement comme estimation renvoyée e (ll) (pour plus d'informations type help return dans la fenêtre de commande Stata), dans le scalaire nommé m1. Ci-dessous la sortie. Afin d'effectuer le test de rapport de vraisemblance, nous devrons garder une trace de la probabilité log (-102.44), la syntaxe de cet exemple (ci-dessus) le fait en stockant la valeur dans un scalaire. Puisque ce n'est pas notre première préoccupation ici, nous sauterons l'interprétation du reste du modèle de régression logistique. Notez que le stockage de l'estimation retournée ne produit aucune sortie. La première ligne de syntaxe ci-dessous exécute le second modèle, c'est-à-dire le modèle avec les quatre variables prédictives. La seconde ligne de code stocke la valeur de la probabilité log pour le modèle (-84.4), qui est stockée temporairement comme estimation renvoyée (e (ll)), dans le scalaire nommé m2. Encore une fois, nous ne disons pas grand-chose sur la production, sauf à noter que les coefficients pour les mathématiques et la science sont tous deux statistiquement significative. Nous savons donc que, individuellement, ce sont des prédicteurs statistiquement significatifs du hiwrite. Maintenant que nous avons les probabilités de log des deux modèles, nous pouvons effectuer un test de rapport de vraisemblance. La première ligne de syntaxe ci-dessous calcule la statistique de test du rapport de vraisemblance. La deuxième ligne de syntaxe ci-dessous trouve la valeur p associée à notre statistique de test avec deux degrés de liberté. En regardant ci-dessous, nous voyons que la statistique du test est 36,05 et que la valeur p associée est très faible (moins de 0,0001). Les résultats montrent que l'ajout de mathématiques et de la science comme variables prédicteurs ensemble (pas seulement individuellement) se traduit par une amélioration statistiquement significative de l'ajustement du modèle. Notez que si nous avons effectué un test de rapport de vraisemblance pour ajouter une seule variable au modèle, les résultats seraient les mêmes que le test de significativité pour le coefficient de cette variable présenté dans le tableau ci-dessus. Utiliser les commandes de posttimation Statas pour calculer un test de rapport de vraisemblance Comme vous l'avez vu, il est assez facile de calculer un test de rapport de vraisemblance quotby hand. quot Cependant, vous pouvez également utiliser Stata pour stocker les estimations et exécuter le test pour vous. Cette méthode est plus facile encore, et probablement moins sujettes aux erreurs. La première ligne de syntaxe exécute un modèle de régression logistique, prédisant hiwrite basé sur les élèves de sexe (femme), et la lecture des scores (lire). La deuxième ligne de syntaxe demande à Stata de stocker les estimations à partir du modèle que nous venons de lancer, et demande à Stata que nous voulons appeler les estimations m1. Il est nécessaire de donner un nom aux estimations, puisque Stata permet aux utilisateurs de stocker les estimations à partir de plus d'une analyse, et nous stockerons plus d'une série d'estimations. Ci-dessous la sortie. Puisque ce n'est pas notre première préoccupation ici, nous ignorerons l'interprétation du modèle de régression logistique. Notez que le stockage des estimations ne produit aucune sortie. La première ligne de syntaxe sous ce paragraphe exécute le deuxième modèle, c'est-à-dire le modèle avec les quatre variables prédictives. La seconde ligne de syntaxe enregistre les estimations à partir de ce modèle et les nomme m2. Ci-dessous la syntaxe est la sortie générée. Encore une fois, nous ne disons pas grand-chose sur la production, sauf à noter que les coefficients pour les mathématiques et la science sont tous deux statistiquement significative. Nous savons donc que, individuellement, ce sont des prédicteurs statistiquement significatifs du hiwrite. Les tests ci-dessous nous permettront de tester si l'ajout de ces deux variables au modèle améliore significativement l'ajustement du modèle, par rapport à un modèle qui contient juste féminin et de lecture. La première ligne de syntaxe ci-dessous indique à Stata que nous voulons exécuter un test lr et que nous voulons comparer les estimations que nous avons enregistrées en m1 avec celles que nous avons enregistrées en m2. La sortie nous rappelle que ce test suppose que A est imbriqué dans B, ce qu'il est. Il nous donne aussi la valeur chi-carré pour le test (36.05) ainsi que la valeur p pour un chi carré de 36.05 avec deux degrés de liberté. Notez que les degrés de liberté pour le test lr, avec les deux autres tests, sont égaux au nombre de paramètres contraints (c'est-à-dire supprimés du modèle), dans notre cas, 2. Notez que les résultats sont les mêmes que Lorsque nous avons calculé le test lr à la main ci-dessus. L'ajout de mathématiques et de sciences comme variables prédictives (et non seulement individuellement) entraîne une amélioration statistiquement significative de l'ajustement du modèle. Comme on l'a noté lorsque nous avons calculé à la main le test du rapport de vraisemblance, si nous avons effectué un test de rapport de vraisemblance pour ajouter une seule variable au modèle, les résultats seraient identiques au test de signification du coefficient pour cette variable présenté dans le tableau ci-dessus. La syntaxe entière pour un test de rapport de vraisemblance, tout en un bloc, ressemble à ceci: Exemple d'un test de Wald Comme on l'a mentionné ci-dessus, le test de Wald s'approche du test lr, mais avec l'avantage qu'il suffit d'estimer un modèle. Le test de Wald fonctionne en testant que les paramètres d'intérêt sont simultanément égaux à zéro. Si tel est le cas, cela suggère fortement que l'élimination du modèle ne réduira pas sensiblement l'ajustement de ce modèle, car un prédicteur dont le coefficient est très petit par rapport à son erreur-type ne fait généralement pas beaucoup pour aider à prédire la variable dépendante. La première étape de l'exécution d'un test Wald consiste à exécuter le modèle complet (c'est-à-dire le modèle contenant les quatre variables prédictives). La première ligne de syntaxe ci-dessous fait cela (mais utilise le préfixe silencieux de sorte que la sortie de la régression n'est pas affichée). La deuxième ligne de syntaxe ci-dessous demande à Stata d'exécuter un test de Wald afin de tester si les coefficients pour les variables mathématiques et sciences sont simultanément égaux à zéro. La sortie donne d'abord l'hypothèse nulle. Ci-dessous, on voit la valeur chi-carré générée par le test de Wald, ainsi que la valeur p associée à un chi-carré de 27,53 avec deux degrés de liberté. Sur la base de la valeur p, nous sommes en mesure de rejeter l'hypothèse nulle, en indiquant à nouveau que les coefficients mathématiques et scientifiques ne sont pas simultanément égaux à zéro, ce qui signifie que l'inclusion de ces variables crée une amélioration statistiquement significative de l'ajustement du modèle. Exemple d'un score ou d'un test de multiplicateur de Lagrange Veuillez noter que le testomit écrit par l'utilisateur n'est plus disponible dans Stata. Afin d'effectuer le test de score, vous devrez télécharger deux paquets écrits par l'utilisateur pour Stata. Ces paquets sont appelés enumopt et testomit. Si votre ordinateur est en ligne, vous pouvez taper findit enumopt dans la fenêtre de commande Stata. (Pour plus d'informations ou de l'aide, consultez notre page FAQ Comment puis-je utiliser findit pour rechercher des programmes et de l'aide supplémentaire) En supposant que les packages nécessaires sont installés, la syntaxe ci-dessous montre comment exécuter un test de score. La première ligne de syntaxe exécute le modèle avec juste le féminin et lue comme variables prédictives (rappelez-vous que le test de score utilise un modèle avec moins de variables et de tests pour les variables omises). La ligne suivante utilise la commande predict pour générer une nouvelle variable appelée test qui contient la partition pour chaque cas. Sans entrer dans trop de détails, les scores ici sont basés sur le modèle estimé et la valeur des variables dans le modèle pour chaque cas. La troisième ligne de syntaxe utilise la commande testomit pour examiner si les variables mathématiques ou sciences sont des variables qui ont été omis de manière incorrecte du modèle. Le score d'option (test) indique à Stata le nom de la variable contenant les scores, bien qu'il soit dans la section options (c'est-à-dire après la virgule), cela est requis. Veuillez noter que le testomit émis par l'utilisateur n'est plus disponible dans Stata. La première partie de la sortie donne le type de modèle exécuté, suivi d'un tableau de résultats. Les résultats du test de score sont répartis en chi-carré avec des degrés de liberté égaux au nombre de variables ajoutées au modèle. Le tableau comporte trois colonnes, la première donnant la valeur de la statistique de test, la seconde le nombre de degrés de liberté pour l'essai et la troisième donnant la valeur p associée à un chi-carré d'une valeur donnée avec un nombre donné De degrés de liberté. Les variables mathématiques et scientifiques apparaissent séparément dans leurs propres lignes, les deux premières lignes contiennent les résultats d'un test pour savoir si l'ajout de ces variables au modèle améliorerait significativement l'ajustement du modèle. La ligne inférieure, appelée test simultané, teste si l'ajout des deux variables au modèle améliorera significativement l'ajustement du modèle. Les résultats présentés dans le tableau sont cohérents avec les tests Wald et lr réalisés ci-dessus. Ils sont également cohérents avec la sortie de régression ci-dessus, dans laquelle les coefficients pour les mathématiques et les sciences étaient statistiquement significatifs. La commande testomit se comporte différemment pour différentes commandes d'estimation. Vous trouverez ci-dessous des exemples d'utilisation de testomit avec plusieurs autres commandes de régression. La plupart des commandes d'équations multiples utiliseront une syntaxe similaire à la syntaxe de mlogit. Deux exceptions sont l'ologit et l'oprobit. Et régresser. Qui sont indiquées séparément. Veuillez noter que le testomit émis par l'utilisateur n'est plus disponible dans Stata. Pour mlogit et plusieurs autres commandes d'équations multiples: Pour ologit et oprobit:


No comments:

Post a Comment