Easy to analyze if you are really curious about data
페이지
tech
im thinking
book
etc
강의 소개
도서 예제 및 오탈자
2024년 12월 29일 일요일
데이터 노가다 실수담 - 9th
스플렁크는 아파치 웹로그의 url 정보에서 경로를 제외한 파일 정보를 따로 추출해준다.
아파치만 해줌
그런데 마지막 경로 이후 정보를 무조건 추출하다보니 경로와 파일의 정확한 구분이 안 됨.
.
을 포함한 정보만을 파일 조건으로 주면 되겠지.
안 된다
값이 없는 필드는 뭘까? url과 비교해보니 경로에도
.
이 있네
(..)
.
검사 한 번 더.
데이터가 지저분할수록 전처리 수준이 높아진다.
관련 글
데이터 노가다 실수담 - 8th
데이터 노가다 실수담
평균의 함정
데이터 분석이 쉬워지는 비법
데이터 분석에 필요한 자질은 뭘까?
댓글 없음:
댓글 쓰기
최근 게시물
이전 게시물
홈
피드 구독하기:
댓글 (Atom)
크리에이티브 커먼즈 라이선스
이 저작물은
크리에이티브 커먼즈 저작자표시-비영리-변경금지 4.0 국제 라이선스
에 따라 이용할 수 있습니다.
댓글 없음:
댓글 쓰기