Friday, 10 November 2017

Quartilanalyse Im Stata Forex


HINWEIS: Die IDRE Statistical Consulting Group wird die Migration der Website auf das WordPress CMS im Februar, um die Wartung und Erstellung neuer Inhalte zu erleichtern. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, die Weiterleitungen so zu halten, dass die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen am Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group, indem Sie ein Geschenk geben Stata Annotated Output Deskriptive Statistiken mit dem Befehl summarize Diese Seite zeigt ein Beispiel für das Beschreiben von beschreibenden Statistiken mit dem Befehl summarize mit Fußnoten, die die Ausgabe erklären. Im ersten Beispiel erhalten wir die deskriptive Statistik für eine 01 (dummy) Variable mit dem Namen female. Diese Variable ist codiert 1, wenn der Schüler weiblich war, und 0 sonst. Im zweiten Beispiel erhalten wir die deskriptive Statistik für eine kontinuierliche Variable mit dem Namen write. Die die Bewertung Studenten wurden auf einem schriftlichen Test erhalten. Wir verwenden die Detail-Option, um zusätzliche Informationen, einschließlich Perzentilen, Schiefe und Kurtosis zu erhalten. Sie müssen die Detailoption nicht mit allen stetigen Variablen verwenden. ein. Variable - Diese Spalte zeigt an, welche Variable beschrieben wird. Wenn Sie mehr als eine Variable nach dem Befehl summarize auflisten, sehen Sie jede Variable in der eigenen Zeile der Ausgabe. B. Obs - Diese Spalte teilt Ihnen die Anzahl der Beobachtungen (oder Fälle) mit, die für diese Variable gültig (d. H. Nicht fehlend) waren. Wenn Sie in Ihrem Datensatz 200 Beobachtungen hatten, aber 10 fehlende Werte für die Variable weiblich hatten, wäre die Zahl in dieser Spalte 190. c. Mittel - Das ist der Mittelwert der Variablen. In diesem Fall variiert unser variables Weibchen von 0 bis 1 (die Min - und Max-Werte), so dass das Mittel tatsächlich der Anteil der Beobachtungen ist, die als 1. d. Kodiert sind. Std. Dev. - Dies ist die Standardabweichung der Variablen. Dies gibt Auskunft über die Ausbreitung der Verteilung der Variablen. D. h. 1 - Dies ist das erste Perzentil. Perzentile werden berechnet, indem man die Werte einer Variablen vom niedrigsten zum höchsten Wert sortiert und dann den Wert ermittelt, der dem Prozentsatz entspricht, an dem Sie interessiert sind, in diesem Fall 1. Daher sind 1 der Werte des variablen Schreibens gleich oder Weniger als 31. f. 25 - Dies ist das 25. Perzentil, auch bekannt als das erste Quartil. G. 50 - Dies ist das 50. Perzentil, auch als Median bekannt. Wenn Sie die Werte der Variablen von niedrigster zu höchster Stelle bestellen, wäre der Median der Wert genau in der Mitte. Mit anderen Worten, die Hälfte der Werte wäre unter dem Median, und die Hälfte wäre oben. Dies ist ein gutes Maß für die zentrale Tendenz, wenn die Variable Ausreißer hat. H. 75 - Das ist das 75. Perzentil, auch bekannt als das dritte Quartil. ich. Kleinste - Dies ist eine Liste der vier kleinsten Werte der Variablen. In diesem Beispiel sind die vier kleinsten Werte alle 31. j. Größte - Dies ist eine Liste der vier größten Werte der Variablen. In diesem Beispiel sind die vier größten Werte alle 67. b. Obs - Diese Spalte teilt Ihnen die Anzahl der Beobachtungen (oder Fälle) mit, die für diese Variable gültig (d. H. Nicht fehlend) waren. Wenn Sie 200 Beobachtungen in Ihrem Datensatz hatten, aber Sie 10 fehlende Werte für die Variable weiblich hatten, dann wäre die Zahl in dieser Spalte 190. k. Summe von Wgt. - Dies ist die Summe der Gewichte. In Stata können Sie verschiedene Arten von Gewichten auf Ihre Daten. Standardmäßig wird jedem Fall (d. h. Gegenstand) ein Gewicht von 1 gegeben. Wenn diese Vorgabe verwendet wird, ist die Summe der Gewichtungen gleich der Anzahl der Beobachtungen. C. Mittleres - Dies ist das arithmetische Mittel der Beobachtungen. Es ist das am häufigsten verwendete Maß der zentralen Tendenz. Man nennt es gewöhnlich den Durchschnitt. Der Mittelwert ist empfindlich für extrem große oder kleine Werte. D. Std. Dev. - Dies ist die Standardabweichung der Variablen. Dies gibt Auskunft über die Ausbreitung der Verteilung der Variablen. L. Varianz - Dies ist die Standardabweichung quadriert (d. h. erhöht auf die zweite Leistung). Es ist auch ein Maß für die Verbreitung der Verteilung. M. Schiefe - Schiefe misst den Grad und die Richtung der Asymmetrie. Eine symmetrische Verteilung, wie eine Normalverteilung, hat eine Schiefe von 0 und eine Verteilung, die nach links geneigt ist, z. B. Wenn der Mittelwert kleiner als der Median ist, eine negative Schiefe aufweist. N ist. Kurtosis - Kurtosis ist ein Maß für die Schwere der Schwänze einer Verteilung. Eine normale Verteilung hat eine Kurtosis von 3. Schwere Schwanzverteilungen haben Kurtosis größer als 3 und leichte Schwanzverteilungen haben Kurtosis weniger als 3. (Bitte beachten Sie, dass es mehr als eine Möglichkeit, Kurtosis zu berechnen, finden Sie in unserem FAQ Warum ich Erhalten unterschiedliche Werte von Kurtosis in SAS, Stata und SPSS Der Inhalt dieser Website sollte nicht als eine Anerkennung für eine bestimmte Website, Buch oder Softwareprodukt von der Universität von Kalifornien ausgelegt werden. Ich habe Daten über eine abhängige Variable y und Eine erklärende, x, und wollen herausfinden, ob es eine nicht-lineare Beziehung zwischen Thesen durch Ausführen von Regressionen, wo die Daten in Quartile von den niedrigsten zum höchsten Wert von x geteilt wird. So zum Beispiel, was ist die Steilheit von X, wenn x liegt in der ersten Quartile, sagen zwischen 0 und 4 im Vergleich zu, wenn in der zweiten, sagen, zwischen 4 und 10 Im verwechseln, wie dies in Stata zu erreichen. Jede Hilfe wäre sehr dankbar Dank im Voraus Dies ist ein sehr problematisch Statistische Praxis. Neben der starken Reduktion der Energie nimmt sie tatsächlich eine sehr merkwürdige Beziehung zwischen X und Y an. Man nehme an, daß X linear mit Y zusammenhängt und daß X keine gleichmäßige Verteilung hat. Der vorgeschlagene Ansatz würde mit einer nichtlinearen Beziehung aufkommen. Es ist nicht sinnvoll, dass X sich auf die Form der Randverteilung von X bezieht. Ein besserer Ansatz wäre, einen Regressionskeil in das ursprüngliche X zu platzieren. Sie gehen auch davon aus, dass Steigungsänderungen bei bestimmten Perzentilen von X auftreten Ist schwer zu glauben. Beantwortet Aug 20 11 at 19:39

No comments:

Post a Comment