テキストから重複行を削除する方法(オンラインツール+コード)
3 分で読了
重複行はログ、CSV、データエクスポートで無駄なスペースを占めます。削除する方法を紹介します。
コマンドライン
# ソートして重複除去
sort input.txt | uniq > output.txt
# 元の順序を保持(awk)
awk '!seen[$0]++' input.txt > output.txt
Python
lines = open('input.txt').readlines()
seen = set()
result = []
for line in lines:
if line not in seen:
seen.add(line)
result.append(line)
オンラインツール
重複行削除ツールで即座に重複を除去できます。