2023년 10월 29일 일요일

평균의 함정 - 2nd

IP별 평균 URL 접속 추이. stats와 eventstats의 집계 결과가 다르다.



eventstats는 이벤트 단위로 집계 결과 필드를 추가하기 때문에 결과값이 집계 결과만을 보여주는 stats보다 많을 수밖에 없다.


결과적으로 최종 집계인 timechart의 모집단 범위가 달라짐. 똑같은 timechart 평균 집계 결과가 다른 이유. 


stats가 숲을 보여준다면 eventstats는 나무를 보여준다. 데이터 해상도를 바꿔서 근접 촬영을 해준다는 얘기. 평균 집계의 하향 평준화 왜곡을 막는 용도로 적절해 보인다.

관련 글

댓글 없음:

댓글 쓰기

크리에이티브 커먼즈 라이선스