2017년 5월 7일 일요일

VIM 치환 결과 특징

6차 대선 토론회 전문의 텍스트 발생 통계. 데이터 분석은 기본적으로 데이터 개수를 세는 것.


특정 조건에서 데이터 개수를 셀 때 VIM 치환 기능을 애용하는데, 쓰다 보니 이런 특징이 있더라. 다음은 문재인 후보의 타 후보 언급 현황.


문 후보의 문장만을 남겨놓은 상태에서 심상정 후보를 몇 번 언급했는지 살펴보자.


':v/^문재인 =/d' 명령어는 '문재인 ='로 시작하지 않는 모든 줄을 삭제하며, ':%s/심상정/ㅋ&ㅋ/g' 명령어는 '심상정'이라는 텍스트를 모두 찾아서 치환한다.



'심상정'은 3개임이 확인됐다. '유승민'은 몇 개일까?



치환이 되긴 했는데, 몇 개인지 표시가 없다. 몇 번 반복해본 결과, VIM 치환 기능은 일치하는 텍스트가 3개 이상이면 치환 개수를 표시해주고, 2개 이하는 표시해주지 않는다. 한참 헤맸네.

댓글 없음:

댓글 쓰기

크리에이티브 커먼즈 라이선스