Dichotom Variablen In Stata Forex


Aufgabe 2c: Verwendung von Stata-Code zur Durchführung logistischer Regression In diesem Modul verwenden Sie einfache logistische Regression, um NHANES-Daten zu analysieren, um die Assoziation zwischen Geschlecht (riagendr) mdash die Exposition oder unabhängige Variable mdash und die Wahrscheinlichkeit einer Hypertonie (basierend auf Auf bpxsar. Bpxdar) mdash das Ergebnis oder abhängige Variable, unter den Teilnehmern 20 Jahre und älter. Sie verwenden dann mehrere logistische Regression, um die Beziehung nach der Kontrolle für ausgewählte Kovariate zu beurteilen. Die Kovariaten umfassen Alter (ridageyr), Cholesterol (lbxtc), Body Mass Index (bmxbmi) und Fasten Triglyceride (lbxtr). Es gibt mehrere Dinge, die Sie beachten sollten, während der Analyse NHANES Daten mit Stata. Bitte lesen Sie die Seite Stata-Tipps, um sie zu überprüfen, bevor Sie fortfahren. Schritt 1: Verwenden Sie svyset, um Umgebungsdesignvariablen zu definieren Beachten Sie, dass Sie den SVYSET definieren müssen, bevor Sie die SVY-Reihe von Befehlen verwenden. Das allgemeine Format dieses Befehls ist unten: svyset wweightvar, psu (psuvar) strata (stratavar) vce (linearisiert) Um die Umfrage-Designvariablen für Ihre Cholesterinanalyse zu definieren, verwenden Sie die Gewichtsvariable für Vierer von MEC-Daten (wtmec4yr) Die PSU-Variable (sdmvpsu) und die strata-Variable (sdmvstra). Die vce-Option gibt die Methode zur Berechnung der Varianz an und die Voreinstellung ist quotlinearizedquot, was die Taylor-Linearisierung ist. Hier ist der svyset Befehl für Pelzjahre von MEC Daten: svyset w wtmec4yr, psu (sdmvpsu) strata (sdmvstra) vce (linearisiert) Schritt 2: Erstellen Sie abhängige dichotomale Variable Für kontinuierliche Variablen haben Sie die Wahl, die Variable im Original zu verwenden (Kontinuierlich) oder in eine kategorische Variable (z. B. auf Basis von Standardabschnitten, Quartilen oder gängiger Praxis). Die kategorischen Variablen sollten die zugrunde liegende Verteilung der kontinuierlichen Variablen widerspiegeln und keine Kategorien erstellen, bei denen es nur wenige Beobachtungen gibt. Für die abhängige Variable erstellen Sie eine dichotome Variable, hyper. Die Menschen als mit (oder nicht mit) Hypertonie definiert. Insbesondere soll eine Person Hypertonie haben, wenn ihr systolischer Blutdruck (gemessen in der MEC) 140 übersteigt oder ihr diastolischer Blutdruck 90 übersteigt oder wenn sie Blutdruckmedikation nehmen. Denken Sie daran, für logistische Regression in Stata zu arbeiten, ist diese Variable definiert werden muss als 0 (dh Ergebnis nicht auftreten, hier Person nicht Hypertonie) oder 1 (Ergebnis auftritt, hier Person Hypertonie). Der Code dieser Variablen zu erstellen, ist unter: (.. Bpxsargt140 bpxsarlt amp bpxdargt90 amp bpxdarlt) gen hyper1 wenn bpq050a1 hyper0 ersetzen, wenn hyper 1 Ampere (bpxsar Amp bpxdar..) Schritt 3: Erstellen unabhängige kategorische Variablen Zusätzlich zu den dichotomen abhängigen Schaffung Variable, wird dieses Beispiel auch zusätzliche unabhängige kategorische Variablen (Alter, Hichol, bmigrp) aus dem Alter, Cholesterin und BMI kategorischen Variablen zur Verwendung in dieser Analyse. Code zum Generieren unabhängiger kategorialer Variablen Schritt 10: Nachschätzung Sie können wissen, ob unterschiedliche Vergleiche (außer den angegebenen Referenzklassen) signifikant sind. In diesem Fall können Sie einen Befehl nach der Einschätzung verwenden (d. H. Einen Befehl, der nur ausgeführt werden kann, nachdem Sie den Befehl Logitmodell ausgeführt haben). Dies nimmt die allgemeine Form, wenn Sie nicht die unbereinigten Wald F wollen: Test vargroup, nosvyadjust Dieses Beispiel wird mit diesem Befehl zu testen, dass die jüngste Altersgruppe eine statistisch signifikante unterschiedliche Wahrscheinlichkeit hat Hypertonie mit als die älteste Altersgruppe: test Iage1 Iage3, nosvyadjust Die Ergebnisse für dieses Beispiel sind: HINWEIS: Die IDRE Statistical Consulting Group wird die Migration der Website auf die WordPress CMS im Februar zu erleichtern Wartung und Erstellung neuer Inhalte. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, Redirects beizubehalten, damit die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen am Institut für Digitale Forschung und Bildung der Stat Consulting Group Hilfe durch ein Geschenk Stata FAQ geben Wie kann ich eine Faktorenanalyse mit kategorischen (oder kategorischen und kontinuierlichen) Variablen Standardverfahren zur Durchführung Faktoranalyse (dh diejenigen durchführen basierend auf einer Matrix aus Pearsons-Korrelationen) annehmen, dass die Variablen kontinuierlich sind und einer multivariaten Normalverteilung folgen. Wenn das Modell Variablen enthält, die dichotom oder ordinal sind, kann eine Faktorenanalyse unter Verwendung einer polychorischen Korrelationsmatrix durchgeführt werden. In Stata können wir eine Matrix polychorischer Korrelationen mit dem benutzerdefinierten Befehl polychoric erzeugen. Sie können den Befehl polychoric finden und installieren, indem Sie findit polychoric im Befehlsfenster von Stata eingeben und den Anweisungen auf dem Bildschirm folgen. Weitere Informationen zum Suchen und Installieren von benutzerdefinierten Befehlen finden Sie in unserer FAQ: Wie verwende ich findit, um nach Programmen und zusätzlicher Hilfe zu suchen. Beachten Sie, dass Variablen, die mit Polychoric verwendet werden, binär (01), ordinal oder kontinuierlich sein können, aber nicht nominal (ungeordnete Kategorien) sein können. Beachten Sie auch, dass die Korrelationen in der Matrix, die durch den polychorischen Befehl erzeugt werden, nicht alle polychorischen Korrelationen sind. Wenn beide Variablen 10 oder weniger beobachteten Werten, eine Polychorische Korrelation berechnet wird, wenn nur eine der Variablen auf 10 oder weniger Werte annimmt (dh eine Variable ist kontinuierlich und die andere kategorische) eine polyserial Korrelation berechnet wird, und wenn beide Variablen nehmen Bei mehr als 10 Werten wird eine Pearsons-Korrelation berechnet. Sobald wir eine polychorische Korrelationsmatrix haben, können wir den factormat-Befehl verwenden, um eine explorative Faktorenanalyse unter Verwendung der Matrix als Eingabe durchzuführen, anstatt rohe Variablen. Der Datensatz für dieses Beispiel enthält Daten über 1428 Studenten und ihre Lehrer. Das Beispiel Analyse umfasst dichotome Variablen, einschließlich der Fähigkeit Geschlecht (facsex) und Fakultät Nationalität (US-Bürger oder Ausländer, facnat) bestellt kategorische Variablen, einschließlich Fakultät Rang (facrank), Student Rang (studrank) und Klasse (A, B, C, Etc. Grade) und die kontinuierliche Variablen Fakultät Gehalt (Gehalt), Jahre Lehre an der University of Texas (yrsut), und die Zahl der Schüler in der Klasse (nstud) in dieser Analyse. Diese Variablen wurden ausgewählt, um einen Bereich von Typen von Variablen (d. h. dichotom, geordnet kategorisch und kontinuierlich) zu repräsentieren und nicht notwendigerweise substantiell sinnvolle Faktoren zu bilden. Darunter öffnen wir den Datensatz und erzeugen die polychorische Korrelationsmatrix für die acht Variablen in unserer Analyse. Sie können feststellen, dass der polychorische Befehl etwas langsamer läuft als Statas korrelieren und pwcorr Befehle, das ist normal. Der polychorische Befehl zeigt nicht die Anzahl der Fälle an, die verwendet werden, um die Matrix zu erzeugen, aber es speichert das n in r (sumw), so dass wir den Anzeigebefehl verwenden können, um es anzuzeigen. Dann verwenden wir den Matrixbefehl, um die polychorische Korrelationsmatrix (gespeichert in r (R) durch den polychorischen Befehl) als r zu speichern. So dass wir es mit dem factormat Befehl verwenden können. Dem Factormatbefehl folgt der Name der Matrix, die wir für die Analyse verwenden möchten (d. h. r). Die n (.) - Optionquot gibt die Stichprobengröße an und ist erforderlich. Wir haben die Faktoren (.) Option verwendet, um anzuzeigen, dass wir drei Faktoren beibehalten wollen. Die obige Faktoranalyseausgabe kann in ähnlicher Weise wie ein Standardfaktoranalysemodell interpretiert werden, einschließlich der Verwendung von Rotationsverfahren, um die Interpretierbarkeit zu erhöhen.

Comments