er zijn verschillende methoden voor het sorteren van gegevens in R. De beste methode hangt af van het type datastructuur dat je hebt. In R kunt u gegevens opslaan in verschillende objecttypen, zoals vectoren, dataframes, matrices en arrays. Er zijn een reeks andere, meer complexe structuren in R, maar we zullen alleen sorteerfuncties behandelen voor enkele van de meest voorkomende gegevenstypen.,
objectklassen
u kunt het type gegevensstructuur identificeren dat wordt gebruikt met de class () – functie, die het gegevenstype van het object retourneert. In het voorbeeld hieronder zien we dat x een numerieke Vector van waarden is.
Sorteervectoren
In R is een vector eendimensionale lijsten van waarden van hetzelfde basistype, zoals tekst of numeriek. Een eenvoudige vector met 4 numerieke waarden kan er als volgt uitzien:
om een vector in R te sorteren, gebruik de sorteerfunctie (). Zie het volgende voorbeeld.,
standaard sorteert R de vector in oplopende volgorde. U kunt echter het afnemende argument toevoegen aan de functie, die expliciet de sorteervolgorde specificeert zoals in het voorbeeld hierboven.
gegevensframes Sorteren
in R is een gegevensframe een object met meerdere rijen en meerdere kolommen. Elke kolom in een gegevensframe kan van een ander gegevenstype zijn. Om dataframes te sorteren, gebruikt u de functie order ()., Overweeg het volgende r data frame (df) dat gegevens bevat over Winkellocatie, account rep, aantal werknemers en maandelijkse verkopen:
om het dataframe in aflopende volgorde te sorteren op maandelijkse verkopen, moet u de functie order met de kolom toepassen om te sorteren op opgegeven in de functie:
negatief teken (-) voor de kolomnaam (DF$sales) wordt toegepast om de sorteer in aflopende volgorde uit te voeren. U kunt ook het afnemend argument gebruiken, zoals in de functie sort ().,
De functie order () kan ook verwijzen naar de kolomindex in plaats van de specifieke kolomnaam. Dezelfde sortering kan bijvoorbeeld worden bereikt met de volgende syntaxis om te verwijzen naar de vierde kolom in het gegevensframe:
u kunt ook Sorteren op meerdere kolommen door meerdere argumenten op te geven in de sorteerfunctie. Stel bijvoorbeeld dat we het bovenstaande gegevenskader eerst wilden Sorteren op vertegenwoordiger als de primaire sortering in oplopende volgorde en vervolgens op maandelijkse verkopen in aflopende volgorde.,
Sorteermatrices
een matrix is vergelijkbaar met een gegevensframe, behalve dat alle kolommen in een matrix van hetzelfde gegevenstype moeten zijn (numeriek, karakter, enz.). Overweeg de volgende 4×10 matrix van numerieke waarden.
om de matrix in oplopende volgorde op de eerste kolom te sorteren, gebruiken we dezelfde sorteerfunctie die we eerder gebruikten om een gegevensframe te sorteren:
merk op dat we verwijzen naar de eerste kolom in de sorteerfunctie., U kunt ook sorteren door extra kolomverwijzingen toe te voegen aan de bestelfunctie. Als u de bovenstaande matrix bijvoorbeeld wilt sorteren op de eerste kolom in oplopende volgorde als de primaire sortering en de tweede kolom als de secundaire sortering, voegt u een tweede kolomverwijzing toe aan de functie volgorde. Let op het negatieve (-) teken voor de tweede sorteerterm. Dit sorteert de tweede kolom in aflopende volgorde.
We hopen dat u dit bericht nuttig vond. Ontdek hoe u meer kunt doen in R door onze “How to do this in R” – serie te bekijken!