2019년 1월 29일 화요일

데이터 노가다 실수담

다음은 단골 강의 주제인 secure 로그 프로세스 발생 통계.


발생한 프로세스의 종류는 6개. 사전 분석 과정에서는 분명 7개였는데, sudo 프로세스 어디로 갔지?-_-


grok 필터에 사용된 정규표현식을 살펴봤다. login과 sshd 프로세스로만 테스트했구나. 그래도 다른 프로세스는 다 추출됐는데 왜 sudo만 빠졌을까?


검사 대상에 sudo 프로세스도 포함시켜봤다. 다른 프로세스는 이어지는 문자열과 하나의 '공백'으로 구분되는데 sudo는 둘 이상의 '공백'으로 구분됨.


둘 이상의 '공백'도 검사하도록 정규표현식 수정.


결국 결과 검증을 제대로 안해서 벌어진 일. 입만 열면 데이터 노가다가 제일 중요하다고 떠들어놓고는 정작 나는 대충 했구나. 반성합니다(..)

이게 다 데이터 노가다가 노잼이라 그럼

관련 글

댓글 없음:

댓글 쓰기

크리에이티브 커먼즈 라이선스