So sortieren Sie Daten in R

So sortieren Sie Daten in R

. (Sie können hier Probleme mit dem Inhalt dieser Seite melden)Möchten Sie Ihre Inhalte für R-Blogger freigeben? klicken Sie hier, wenn Sie einen Blog haben, oder hier, wenn Sie dies nicht tun.

Es gibt verschiedene Methoden zum Sortieren von Daten in R. Die beste Methode hängt von der Art der Datenstruktur ab, die Sie haben. In R können Sie Daten in verschiedenen Objekttypen wie Vektoren, Datenrahmen, Matrizen und Arrays speichern. Es gibt eine Reihe anderer komplexerer Strukturen in R, aber wir werden nur Sortierfunktionen für einige der gängigeren Datentypen behandeln.,

Objektklassen

Sie können den Typ der Datenstruktur identifizieren, die mit der Funktion class() verwendet wird, die den Datentyp des Objekts zurückgibt. Im folgenden Beispiel sehen wir, dass x ein numerischer Vektor von Werten ist.

Sortiervektoren

In R ist ein Vektor eindimensionale Listen von Werten desselben Basisdatentyps, z. B. Text oder numerisch. Ein einfacher Vektor mit 4 numerischen Werten kann folgendermaßen aussehen:

Um einen Vektor in R zu sortieren, verwenden Sie die Funktion sort (). Siehe das folgende Beispiel.,

Standardmäßig sortiert R den Vektor in aufsteigender Reihenfolge. Sie können der Funktion jedoch das abnehmende Argument hinzufügen, das explizit die Sortierreihenfolge wie im obigen Beispiel angibt.

Datenrahmen sortieren

In R ist ein Datenrahmen ein Objekt mit mehreren Zeilen und mehreren Spalten. Jede Spalte in einem Datenrahmen kann einen anderen Datentyp haben. Verwenden Sie zum Sortieren von Datenrahmen die Funktion order ()., Betrachten Sie den folgenden R-Datenrahmen (df), der Daten zum Speicherort, zur Kontonummer, zur Anzahl der Mitarbeiter und zum monatlichen Umsatz enthält:

Um den Datenrahmen in absteigender Reihenfolge nach monatlichen Verkäufen zu sortieren, wenden Sie die Bestellfunktion mit der Spalte an, die nach der Funktion sortiert werden soll:

Beachten Sie, dass das negative Vorzeichen ( – ) vor des Spaltennamens (df$sales) angewendet wird, um die Sortierung in absteigender Reihenfolge auszuführen. Sie können auch das abnehmende Argument verwenden, wie in der Funktion sort ().,

Die Funktion order () kann auch auf den Spaltenindex und nicht auf den spezifischen Spaltennamen verweisen. Die gleiche Sortierung kann beispielsweise mit der folgenden Syntax erreicht werden, um auf die vierte Spalte im Datenrahmen zu verweisen:

Sie können auch nach mehreren Spalten sortieren, indem Sie mehrere Argumente in der Sortierfunktion angeben. Angenommen, wir wollten zuerst den obigen Datenrahmen nach Vertriebsmitarbeiter als primäre Sortierung in aufsteigender Reihenfolge und dann nach monatlichen Verkäufen in absteigender Reihenfolge sortieren.,

Sortiermatrizen

Eine Matrix ähnelt einem Datenrahmen, außer dass alle Spalten in einer Matrix denselben Datentyp haben müssen (numerisch, Zeichen usw.). Betrachten Sie die folgende 4×10-Matrix numerischer Werte.

Um die Matrix nach der ersten Spalte in aufsteigender Reihenfolge zu sortieren, verwenden wir dieselbe Sortierfunktion, mit der wir zuvor einen Datenrahmen sortiert haben:

Beachten Sie, dass wir auf die erste Spalte in der Sortierfunktion verweisen., Sie können auch sortieren, indem Sie der Bestellfunktion zusätzliche Spaltenreferenzen hinzufügen. Um beispielsweise die obige Matrix nach der ersten Spalte in aufsteigender Reihenfolge als primäre Sortierung und die zweite Spalte als sekundäre Sortierung zu sortieren, fügen Sie der order-Funktion eine zweite Spaltenreferenz hinzu. Beachten Sie das negative ( – ) Vorzeichen vor dem zweiten Sortierterm. Dadurch wird die zweite Spalte in absteigender Reihenfolge sortiert.

Wir hoffen, dass Sie diesen Beitrag hilfreich gefunden haben. Finden Sie heraus, wie Sie mehr in R tun können, indem Sie sich unsere Serie „How to do this in R“ ansehen!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.