2024년 12월 29일 일요일

데이터 노가다 실수담 - 9th

스플렁크는 아파치 웹로그의 url 정보에서 경로를 제외한 파일 정보를 따로 추출해준다. 아파치만 해줌


그런데 마지막 경로 이후 정보를 무조건 추출하다보니 경로와 파일의 정확한 구분이 안 됨.


.을 포함한 정보만을 파일 조건으로 주면 되겠지. 안 된다


값이 없는 필드는 뭘까? url과 비교해보니 경로에도 .이 있네(..)


. 검사 한 번 더.


데이터가 지저분할수록 전처리 수준이 높아진다.

댓글 없음:

댓글 쓰기

크리에이티브 커먼즈 라이선스