1. 텍스트 처리

텍스트처리 명령어

  • 문서 내용의 앞부분 출력, (옵션 생략 : 앞 10줄)

주로 쓰는 옵션

  • -c : 바이트만 출력

  • -n : 라인만 출력

$ head /etc/passwd

$ head /etc/passwd -n 15

$ head /etc/passwd -n -5

$ cat /etc/passwd | head

$ cat /etc/passwd | head -n 15

tail

  • 문서 내용의 뒷부분 출력, (옵션 생략 : 뒤에서 10줄)

주로 쓰는 옵션

  • -c : 바이트만 출력

  • -n : 라인만 출력

  • -f : 추가되는 내용 대기. 추가되는 내용은 append하여 출력 (ex, 로그 쌓이는 내용을 바로바로 출력 해줌)

  • -F : 파일이 truncate 되는 경우, re-open하여 follow 함

  • -f,-F 옵션이 모니터링, 디버깅에서 자주 사용됨

wc

  • line/word/byte 카운트 출력

주로 쓰는 옵션

  • -l : 라인수만 출력. ex) 한줄에 1개의 설정이 들어가는 경우의 파일 확인 등

nl

  • 파일을 내용을 라인넘버와 함께 출력

주로 쓰는 옵션

  • -ba : 모든 라인에 라인넘버링

  • -v N : 시작라인 넘버를 N으로 지정

sort

  • 파일 내용 정렬하여출력

주로 쓰는 옵션

위치 지정

  • -k : key에 의한 정렬 수행

  • -t : 필드 구분자 (디폴트-공백)

정렬 기준

  • -n : 숫자

  • -r : 내림차순

  • -f : 무시할 형식지정

  • -u : 중복시 하나만 출력 -> distinct 같은 개념

uniq

  • 중복된 내용 제거하고출력

  • sort 명령어와 같이 사용되는 경우가 많음

주로 쓰는 옵션

  • -d : 중복된 내용만 출력

  • -u : 중복되지 않은 내용만 출력

  • -i : 대소문자 무시하고 중복여부 체크

cut

  • 컬럼 잘라내기

주로 쓰는 옵션

  • -b : byte 단위로 선택

  • -c : character 단위로 선택

  • -f : 필드선택

  • -d : tab 대신 사용할 구분자 지정 (ex ':' 등)

tr

  • 어떤 내용을 변환(translate)한다.

  • 기본 사용법 : tr [option]... SET1 [SET2]

  • 특정 문자를 지울때 자주 쓰임 (replace 처럼)

주로 쓰는 옵션

  • -c, -C, --complement :

  • -d, --delete : 삭제

  • SET

    • CHAR1-CHAR2 : CHAR1 부터 CHAR2 까지 (ex 'a-z')

    • [:alnum:] : 문자 + 숫자

    • [:alpha:] : 문자

    • [:blank:] : 공백

    • [:space:] : 공백 + newline

    • [:digit:] / [xdigit:] : 10진수 숫자 / 16진수 숫자

    • [:lower:] / [:ipper:] : 소문자 / 대문자

sed

  • stream editor

  • 파일 내용출력 -> 그내용을 수정(editing)

주로 쓰는 옵션

  • n : 기본출력을 하지 않기

  • {RANGE}p : range 내의 라인을 출력(print)

  • {RANGE}d : range 내의 라인을 삭제(delete)

  • /SEARCHPATTERN/p : SEARCHPATTERN과 매치되는 라인을 출력

  • /SEARCHPATTERN/d : SEARCHPATTERN과 매치되는 라인을 삭제

  • s/REGEX/REPLACE/ : REGEX에 매치되는 부분을 REPLACE로 교체 (substitute)

awk

  • 텍스트처리 script language

  • syntax : awk options 'selection _criteria {action }' input-file

주로 쓰는 옵션

  • -F : 필드 seperator 지정

주요 내장 변수

  • $1, $2, $3, ... : N번째 필드

  • NR

  • NF

  • FS

  • RS

  • OFS

  • ORS

Last updated

Was this helpful?