|
|
|
16.07.2009 14:19
Individuelle Einträge in einer tabseparierten Datei ermitteln
Kategorie: Linux
Datenanalyse mit der shelll: Individuelle Einträge in einer tabseparierten Datei ermitteln
Der Funktionsumfang der shell-Programme eines UNIX/Linux-Systems ist äusserst beeindruckend. So lassen sich in der Shell unter anderem Operationen ausführen , die auf anderen Systemen die Verwendung von komplexeren Programmen erfordern. Ein Beispiel hierfür ist das Ermitteln der Anzahl unterschiedlicher Einträge in einer Spalte einer tabseparierten Datei. Benötigt werden hierzu die Programme cut, sort und wc. Das Programm cut wird dazu verwendet die gewünschte Spalte aus der Datei zu extrahieren. Im untenstehenden Beispiel ist dies die Spalte 2 (Die Nummerierung beginnt bei 1). Das Programm sort lässt sich nicht nur zum Sortieren sondern auch zur Auflistung unterschiedlicher Zeilen verwenden. Das dazu benötigte Flag ist -u oder --unique. Das Program wc wird anschliessend dazu verwendet die Zeilenzahl ermitteln. cut -f 2 test.tab | sort --unique | wc -l
|
|
|