3만 개에 육박하는 변수 발생 내역. 같은 변수라도 달라지는 값 때문에 다양성이 증가한 결과.
변수값으로 사용된 숫자만 삭제해도 다양성을 줄여 데이터 발생 범위를 좁힐 수 있다. 내가 알고 싶은 건 전체적인 변수 변화지, 세부적인 변수값 변화가 아니기 때문. 분석 목적에 영향을 주지 않는 요소를 제거하는 차원 축소 결과.
그런데 URL 인코딩 패턴 때문에 가독성이 떨어진다. 디코딩 시도.
왜 디코딩이 안 되지?
%2F는 /를 의미하는 16진수 2F를 URL 인코딩한 결과. 그런데 변수 내역을 보니 숫자가 없다. 삭제 과정에서 URL 인코딩 패턴의 숫자까지 삭제했구나(..) 변수값으로 사용된 순수 숫자만을 삭제해야 한다.
데이터 처리 과정 전반에 관여하는 정규표현식에 대한 이해 없이는 그 좋다는 스플렁크를 제대로 사용하기 어렵다. 엑셀로 표만 그리는 수준에 머무르기 쉽다는 얘기.









댓글 없음:
댓글 쓰기