1. 텍스트 처리
텍스트처리 명령어
head
문서 내용의 앞부분 출력, (옵션 생략 : 앞 10줄)
주로 쓰는 옵션
-c : 바이트만 출력
-n : 라인만 출력
tail
문서 내용의 뒷부분 출력, (옵션 생략 : 뒤에서 10줄)
주로 쓰는 옵션
-c : 바이트만 출력
-n : 라인만 출력
-f
: 추가되는 내용 대기. 추가되는 내용은 append하여 출력 (ex, 로그 쌓이는 내용을 바로바로 출력 해줌)-F : 파일이 truncate 되는 경우, re-open하여 follow 함
-f,-F 옵션이 모니터링, 디버깅에서 자주 사용됨
wc
line/word/byte 카운트 출력
주로 쓰는 옵션
-l : 라인수만 출력. ex) 한줄에 1개의 설정이 들어가는 경우의 파일 확인 등
nl
파일을 내용을 라인넘버와 함께 출력
주로 쓰는 옵션
-ba : 모든 라인에 라인넘버링
-v N : 시작라인 넘버를 N으로 지정
sort
파일 내용 정렬하여출력
주로 쓰는 옵션
위치 지정
-k : key에 의한 정렬 수행
-t : 필드 구분자 (디폴트-공백)
정렬 기준
-n : 숫자
-r : 내림차순
-f : 무시할 형식지정
-u : 중복시 하나만 출력 -> distinct 같은 개념
uniq
중복된 내용 제거하고출력
sort 명령어와 같이 사용되는 경우가 많음
주로 쓰는 옵션
-d : 중복된 내용만 출력
-u : 중복되지 않은 내용만 출력
-i : 대소문자 무시하고 중복여부 체크
cut
컬럼 잘라내기
주로 쓰는 옵션
-b : byte 단위로 선택
-c : character 단위로 선택
-f : 필드선택
-d : tab 대신 사용할 구분자 지정 (ex ':' 등)
tr
어떤 내용을 변환(translate)한다.
기본 사용법 :
tr [option]... SET1 [SET2]
특정 문자를 지울때 자주 쓰임 (replace 처럼)
주로 쓰는 옵션
-c, -C, --complement :
-d, --delete : 삭제
SET
CHAR1-CHAR2
: CHAR1 부터 CHAR2 까지 (ex 'a-z')[:alnum:]
: 문자 + 숫자[:alpha:]
: 문자[:blank:]
: 공백[:space:]
: 공백 + newline[:digit:]
/[xdigit:]
: 10진수 숫자 / 16진수 숫자[:lower:]
/[:ipper:]
: 소문자 / 대문자
sed
stream editor
파일 내용출력 -> 그내용을 수정(editing)
주로 쓰는 옵션
n : 기본출력을 하지 않기
{RANGE}p : range 내의 라인을 출력(print)
{RANGE}d : range 내의 라인을 삭제(delete)
/SEARCHPATTERN/p : SEARCHPATTERN과 매치되는 라인을 출력
/SEARCHPATTERN/d : SEARCHPATTERN과 매치되는 라인을 삭제
s/REGEX/REPLACE/ : REGEX에 매치되는 부분을 REPLACE로 교체 (substitute)
awk
텍스트처리 script language
syntax : awk options 'selection _criteria {action }' input-file
주로 쓰는 옵션
-F : 필드 seperator 지정
주요 내장 변수
$1, $2, $3, ... : N번째 필드
NR
NF
FS
RS
OFS
ORS
Last updated
Was this helpful?