인공지능 주식 투자에도 다수결의 법칙 있다?

<안명호의 인공지능과 미래금융>

  • 안명호 딥넘버스 대표
  • 입력 : 2017.06.23 17:23:09   수정 : 2017-06-28 17:41:41
  • 프린트
  • 이메일
  • 페이스북
  • 트위터
  • 카카오스토리
  • 공유
미래 예측은 결코 단순한 일이 아니다. 하지만 우리는 늘 이런저런 이유로 미래를 예측하고 싶어한다.

알고리즘 트레이딩에서도 어떤 형태로든간에 미래 예측이 필수적이다. 그런데 문제는 내일 금융상품의 가격이 어떻게 될지 예측하는 것이 쉽지 않다는 점이다.
고도의 수학적 지식을 활용한 예측모델이나 머신러닝을 이용한 예측모델, 도메인 지식을 이용한 예측모델도 모두 정확성에는 한계가 있고 각 예측모델의 특성도 모두 다르다.

어떤 시기에는 수학적 예측모델이 높은 성과를 보여주지만 다른 시기에는 도메인 지식을 활용한 예측모델이 더 좋은 결과를 낳기도 한다. 예를 들어 투자에 적용한 수학적 예측모델의 대전제가 정상성(Stationarity)라면 금융데이터가 정상성을 보여주는 시기에는 당연히 다른 시기보다 좋은 예측력을 갖는 이치다.

보다 높은 투자수익을 위해서는 시기의 특성을 파악하고 그에 맞는 예측모델을 적용해야 하는데 관건은 현 시기가 갖고 있는 특성을 일정 시간이 지나야만 파악할 수 있다는 것이다. 수익극대화가 목표라면 초기에서는 파악해야 하는데 쉽지 않은 일이다. 그렇기 때문에 지금 이 시기에 어떤 예측모델이 좋을지를 선택하는 것이 어려울 뿐 아니라 수익성과도 직결되는 중차대한 문제가 된다.

알고리즘 트레이딩 시스템에서는 이런 난관을 극복하기 위해 하나가 아닌 여러 개의 예측모델을 동시에 사용해 미래예측력을 높이고 리스크를 줄인다. 이처럼 여러 예측 모델을 사용하는 것을 델파이 기법이라고 한다.

위키에 따르면 델파이 기법은 어떤 문제에 관해 전문가들의 견해를 유도하고 종합해 집단적 판단으로 정리하는 일련의 절차라고 정의할 수 있다. 추정하려는 문제에 관한 정확한 정보가 없을 때 "두 사람의 의견이 한 사람의 의견보다 정확하다"는 계량적 객관의 원리와 "다수의 판단이 소수의 판단보다 정확하다"는 민주적 의사결정 원리에 논리적 근거를 두고 있다. 또 전문가들이 직접모이지 않고 주로 우편이나 전자 메일을 통한 통신수단으로 의견을 수렴해 돌출된 의견을 내놓는다는것이 주된 특징이라 할 수 있다.

다양한 테스트와 검증을 통해 예측모델A,예측모델B,예측모델C 3개가 예측력이 있다고 확인되면 이들 중 하나의 모델을 선택해서 사용하지 않고 3개 예측모델들을 모두 활용하는 것이 핵심이다. 트레이딩 시스템에 3개 모델들을 모두 구현하고 특정 종목에 대해 3개의 예측모델들이 각각 내놓은 결과를 종합해 가장 많은 결과값을 최종 예측결과로 활용하는 방식이다.

 기사의 1번째 이미지
▶ 여기를 누르시면 크게 보실 수 있습니다
이같은 방식을 하드 보팅(Hard Voting)이라고 한다. 하드 보팅은 모든 예측모델의 능력을 동일하게 취급하는 방식이며 사용하는 예측모델의 수는 당연히 홀수로 가져간다.

또 다른 방식으로는 소프트 보팅(Soft Voting)이 있다. 소프트 보팅은 각 모델들의 확률값을 더해 최종적인 예측값을 결정한다. 아래의 표처럼 모든 예측모델의 확률을 더해 가장 높은 확률을 보여준 것을 최종 예측값으로 결정한다.

 기사의 2번째 이미지
▶ 여기를 누르시면 크게 보실 수 있습니다
경우에 따라서는 소프트 보팅과 하드 보팅 적용에 가중치를 할당해 예측능력이 우수한 모델이 결과값에 더 많은 영향력을 줄 수 있도록 조정하기도 한다. 예를 들어 예측모델A가 매우 우수하다고하면 예측모델A값에는 2를 곱해서 사용하는 방식이다.

상식적으로 생각해봐도 알고리즘 트레이딩 시스템에 하나의 예측모델을 사용하는 것보다 여러 개의 예측모델을 사용하는 것이 좀 더 나은 성능을 보여줄 수 있고 위험의 분산 차원에서도 더 우수할 것이다. 하나의 예측모델이 그릇된 결과를 가져오기보다는 여러 개의 예측모델이 모두 잘못된 판단을 할 가능성이 낮고 또 검증된 예측모델들이 틀렸다 하더라도 특수한 상황으로 볼 여지가 있기 때문이다.

그런데 델파이 기법을 알고리즘트레이딩에 적용할 때 재밌는 점은 바로 모델들간의 적합도(궁합)을 고려한다는 것이다. 선정된 예측모델들이 우수한 예측력을 가지고 있다는 것이 확인되면 다음단계로 각 모델들간의 상관관계를 계산해 상관관계가 높은 예측모델은 제외한다. 예를 들어 3개의 예측모델이 있는데 예측모델A와 예측모델B가 상관관계가 높고 예측모델 B와 예측모델 C가 상관관계가 낮다면 예측모델 B와 예측모델C를 선택해 알고리즘 트레이딩 시스템을 개발한다.

이렇게 하는 이유는 쉽게 유추되듯이 위험의 분산과 예측력의 향상이다. 모든 예측모델들이 높은 상관관계를 갖는다면 미래예측에 대해 유사한 결과를 내놓을 가능성이 매우 높아지기 때문에 애초에 델파이 기법을 적용하려는 의도가 심각하게 훼손된다.

현실에서 내가 어떻게 해야 할지 모르는 문제가 있다고 하면 주변의 사람들에게 조언을 구한다. 편향적인 결과를 방지하기 위해 되도록이면 서로 다른 배경을 가지고 있는 사람들에게 다양한 의견을 구하고 최종적인 결론을 내린다.
알고리즘 트레이딩도 마찬가지이다. 잘 모르는 미래에 대해 상관관계가 낮은 여러 개의 예측모델 결과값을 이용해 최종적인 투자결정을 한다.

알고리즘 트레이딩 시스템을 개발하다 보면 많은 것이 우리의 현실과 맞닿아 있음을 느끼곤 한다. 세상이 우리에게 균형잡힌 삶을 요구하는 것처럼 숫자에 의해 결정되는 알고리즘 트레이딩에서도 편향되지 않은 다양한 의견을 필요로 함은 금융도 우리가 살고 있는 세상의 일부이기 때문일 것이다.

[안명호 딥넘버스 대표]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]
섬네일 이미지
안명호 에덴파트너스 대표 다른기사 보기
카이스트에서 소프트웨어를 전공하고 일본 인텔 에셋 보드 멤버, 사이버르네상스 CTO 등을 역임하고 통합전산센터 기술전문위원, 과제기획위원, 평가위원으로 활동했다. EdenChain이라는 3세대 스마트 컨트랙트 블록체인 기술을 개발하고 있는 에덴파트너스의 대표로 재직중이다.