tool/script zum entfernen doppelter Zeilen?

below

below

Aktives Mitglied
Thread Starter
Dabei seit
15.03.2004
Beiträge
13.565
Reaktionspunkte
1.092
Hallo,

ich suche ein Kommandozeilentool / Script zum entfernen von doppelten Zeilen. Wenn möglich sollte die Ordnung der Zeilen eingehalten werden. Ist aber auch nicht sooo schlimm wenn nicht

Danke

Alex
 
Wie genau definierst Du "doppelte Zeilen"?
Grundsätzlich ließe sich das mit einem sed-, awk oder Perlskript lösen.
 
Wie kann man denn "gleiche Zeilen" unterschiedlich definieren? Wenn strcmp dazu "0" sagt ;)

ab
ab
abc
abcd
abc

Da oben kommt "ab" und "abc" doppelt vor. Die will ich weg haben.

Alex
 
erst ein "sort" und dann "uniq"
 
below schrieb:
Wie kann man denn "gleiche Zeilen" unterschiedlich definieren?
...
z. B. indem man festlegt,
- ob damit beliebige identische Zeilen gemeint sind oder nur solche, die unmittelbar aufeinander folge
- ob leere Zeilen und solche mit nur Whitespaces als "gleich" gewertet sollen
- ob Leerzeilen überhaupt berücksichtigt werden sollen
etc.
 
maceis schrieb:
z. B. indem man festlegt,
- ob damit beliebige identische Zeilen gemeint sind oder nur solche, die unmittelbar aufeinander folge
Jede beliebige identische Zeilen

maceis schrieb:
- ob leere Zeilen und solche mit nur Whitespaces als "gleich" gewertet sollen
- ob Leerzeilen überhaupt berücksichtigt werden sollen
etc.

Mir relativ egal, leere Zeilen würde ich sowieso in einem extra schritt entfernen.

Aber ich denke mit sort und uniq ist mir schonmal geholfen ;)

Danke

Alex
 
Zurück
Oben Unten