2019년 10월 17일 목요일

키바나 Aggregation Size 옵션 특징

다음은 키바나로 그린 URL(확장자) 발생 분포표. 결과가 5개만 나오는 이유는 계산 그룹이나 범위를 결정하는 Buckets 메뉴의 Size 옵션값이 5이기 때문이다. Top5 데이터를 표시한 결과.


값을 1로 바꾸면 Top1 데이터만 표시됨.


그런데 시계열 차트를 그리면 결과가 이상해진다. Size값은 5인데 결과는 Top7?


값을 1로 바꿔도 Top2 데이터가 표시된다. Size값이 정확하게 반영되지 않음.


이런 문제 때문에 그동안 시계열 차트를 그릴 때는 Size값을 넉넉하게(?) 설정하는 쌈마이를 시전하고 있었는데, 어느 날 갑자기 궁금해져서 Inspect 메뉴로 시간 단위 계산 결과를 열어봤다. 그런데 시간대별 Top1이 다르다?


결과적으로 표와 시계열 차트 결과가 달라보였던 이유는 계산 조건 때문이었다. 표를 만들 때는 Terms Aggregation 조건 하나뿐이라 해당 필드 데이터의 Top5를 보여준 것이고, 시계열 차트를 그릴 때는 데이터를 계산할 때
① 시간 단위로 한 번,
② 필드 데이터 유형 단위로 한 번, 총 두 번 계산을 하기 때문에 시간대별 대상 필드의 TopN 결과가 합쳐졌던 것.

그동안 욕해서 미안해(..)


관련 글

댓글 없음:

댓글 쓰기

크리에이티브 커먼즈 라이선스