정규표현식

위키배움터

정규표현식은 문자열의 패턴을 정의하는 메타언어이다.

준비[편집]

  • 프로그래머가 아닌 이들도 사용하기 위해 emeditor 프리버전을 기준으로 설명한다. 다운로드
  • 예제로 적당한 파일을 고른다. 길이가 어느정도 되는 텍스트라면 가능하다.

간단한 찾기[편집]

설명[편집]

  • 마침표(.)는 임의의 글자 1자를 의미한다.
  • 역슬래시(\)는 특수문자를 표시하기 위한 특수문자이다.
  • 대괄호([ ])는 문자 집합을 표시한다. 그중 하나이다.
    • 하이픈(-)은 문자구간을 표시한다.
    • A-z 패턴은 위험하다. A-Za-z으로 하자.
    • 삿갓(^)은 제외할 문자이다.

실습[편집]

sales.
.a.
.a.\.xls
[ns]a.\.xls
[ns]a[0123456789]\.xls

특수문자 이용하기[편집]

설명[편집]

  • \n 줄바꿈
  • \t 탭
  • \s 공백
  • \d 숫자 하나([0-9]와 같다)
  • \w 대소문자와 밑줄을 포함하는 모든 영숫자([a-zA-Z0-9_]와 같다)
  • .*? 모든 문자열. ?가 있으면 최단일치, ?가 없으면 최장일치. 최단일치가 정신건강에 더 좋다.
  • + 반복
  • {1,4} 1회~4회 반복
  • ^ 문장의 시작
  • $ 문장의 끝
  • \b 단어의 시작과 끝

실습[편집]

.[^\.\s]$\n 마침표나 공백이 아닌걸로 끝난 문장
\d\d 두자리 숫자
\d{2}
\d+ 여러자리의 숫자
\d{1,4} 4자리 이하의 숫자
^나는 나는으로 시작하는 문장
\s$ 문장 마지막에 공백이 남은 것
#1사과.*?#2 #1과 #2 사이에 있는 사회현상, 사회주의자 등 사회로 시작하는 모든 단어

역참조[편집]

설명[편집]

  • 역참조는 일종의 변수에 해당된다. 치환하고자 하는 대상을 붙잡아서 참조하는 것이다.
  • 에디터의 찾기 바꾸기 기능에서 동작한다.
  • 찾기창에서 찾을 대상은 (첫번째), (두번째)... 로 묶어준다.
  • 바꾸기 창에서 바꿀대상은 \1, \2...로 참조한다.