2019년 4월 25일 목요일

알고 보면 쉬운 이상징후 분석 - 2nd

'알고 보면 쉽다'의 반대말은 '모르면 어렵다'이다. 다음은 웹로그의 여러 상태 중 변수 길이의 변화 추이. 이게 중요하냐는 질문을 받은 적이 있다. 변수 조작 해킹 시연할 때 딴 생각했죠?


나는 왜 변수 길이를 이상징후 분석 지표에 포함시켰을까? 웹서비스의 특성 중 하나가 변수 변화를 통해 바뀌는 다양한 아웃풋이기 때문.

의도한 변수 입력은 의도한 출력으로 이어지고, 의도하지 않은 변수 입력은 의도하지 않은 출력으로 이어진다. 그래서 웹서버가 의도하지 않은 출력을 목적으로 하는 웹해킹은 대부분 변수를 건드린다. 그 과정에서 길이도 바뀌고.

아는 만큼 보인다

다음은 주가 및 거래량(이라는 숫자의) 변화 추이.


해당 종목을 착실히 공부했다면 차트 변화에 적절한 대응이 가능하다. 하지만 공부를 게을리했다면 주가나 거래량이 고점을 찍었을 때 대상승의 시작인지, 마지막 불꽃인지 짐작조차 할 수 없을 것이다.

물론 파동 형태나 차트 기울기 등을 따져 위기를 모면할 수도 있겠지만, 가끔 동전 던지기식 투자 수익률과 별로 차이도 안 나더라는 연구 결과를 보면 기술 분석만으로는 분명 한계가 있다.

재무제표 등 가치 분석이 뒤따라야 한다는 얘기. 해당 종목의 내재가치에 대한 이해를 바탕으로 기술 분석이 더해지면 더 정확한 분석이 가능하지 않을까? 이상징후 분석도 마찬가지.
이상징후 분석은 쉽다. 원하는 상태의 숫자만 세면 되니깐

대상에 대한 이해가 부족한 상태에서의 이상징후 분석은 당연히 실패한다. 눈 앞에 코끼리가 지나가도, 그게 코끼린지 모를테니까. 그래서 어떤 상태를 분석하고 싶은지, 해당 상태의 변화가 왜 궁금한지에 대한 고민이 반드시 필요.

다시 질문으로 돌아가서

그래서 변수 길이가 중요할까? 중요할 수도 있고, 아닐 수도 있고(..) 웹서버의 목적이나 서비스 구조, 그에 대한 이해도에 따라 중요한 지표가 될 수도 있고, 아닐 수도 있다.

설령 좀 쓸만하다 할지라도 언제 뒤통수 맞을지 모른다. 질문 주신 분은 정답을 원했겠지만 세상에 100%는 없더라.


저게 정답이었으면 이미 누군가 팔고 있겠지. 질문자도 궁금하지 않았을테고. 그러니 스스로 문제를 해결하려는 의지와 함께
자신의 연구에 대해 겸손해야 하고 자신이 찾아낸 결과와 사랑에 빠지지 말아야 한다 - 모두 거짓말을 한다 (287페이지)

섣불리 장담하지 말고, 가능성 있는 지표를 계속 찾으라는 얘기. 결국 확률 싸움. 하나보다는 둘, 둘 보다는 세 개의 지표를 결합했을 때 이상한 걸 찾아낼 확률이 높아지지 않을까?

물론 장비 위주, 아웃소싱 위주 환경에서 쉽지 않을 것이다. 상관분석, 이상징후 분석 마케팅이 사방에 넘치는데도 쓸만한 사례 찾기 힘든 이유. 그럼에도 데이터를 잘 분석하고 싶다면 방법은 빅데이터나 AI가 아닌 데이터 자체를 알아가려고 노력하는 것.
사랑하면 알게 되고 알게 되면 보이나니, 그때 보이는 것은 전과 같지 않으리라

닭살 돋지만 사실이라 어쩔 수 없음.

관련 글

댓글 없음:

댓글 쓰기

크리에이티브 커먼즈 라이선스