계절 테마주라는 말이 있다. 날이 더워지면 빙과·음료주, 추워지면 난방주, 4월이면 어떤 종목… 직관적으로 그럴듯하다. 그래서 직접 데이터로 검증해봤다. 결과만 먼저 말하면 "흔히 말하는 계절 강세는 우연과 구분되지 않는다."
어떻게 검증했나
-
대상: 코스피·코스닥 시총 1,000억 이상, 2010년~현재
-
종목별로 달(月)마다 수익률에서 코스피 같은 달 수익률을 뺀 '시장 초과수익'을 계산
-
평균이 아니라 적중 연수를 봤다 — "그 달에 시장을 이긴 해가 10년 중 몇 번인가". 평균은 한 해 폭등에 휘둘리기 때문이다
-
그 달 데이터 10년 이상 & 적중 8년 이상 & 적중률 80% 이상 & 중앙값·평균 초과수익 양수인 조합만 '계절 강세'로 통과시켰다
데이터 마이닝의 함정
핵심은 여기다. 종목 수천 개 × 12개월을 다 뒤지면, 아무 패턴이 없어도 순전히 운으로 "13년 중 12년 4월에 올랐다" 같은 종목이 무더기로 나온다. 동전을 1만 번 던지면 앞면이 8연속 나오는 구간이 반드시 생기는 것과 같다.
그래서 같이 계산한 게 우연 기대치다. 진짜 계절성이 있다면 실제 통과 종목 수가 우연 기대치를 크게 웃돌아야 한다.
숫자가 말하는 것
-
랜덤 종목이 한 달에 코스피를 이길 기저 확률: 44.3% (절반이 안 된다 — 소수 대박이 시장 평균을 끌어올리기 때문)
-
검정한 (종목×달) 조합: 12,192개
-
기준 통과: 83개
-
순수 우연으로 기대되는 통과 수: 약 301개
-
신호 대 노이즈 비율: 0.28
실제 통과(83)가 우연 기대치(301)보다 오히려 적다. 즉 화면을 가득 채운 "12년 중 11년 시장 초과" 종목들은, 1만 2천 개를 뒤지면 우연만으로도 그보다 더 많이 나오는 잔재였다. 통계적으로 운과 구별이 안 된다.
왜 이런 결과가 나올까
계절성이 정말 있다 해도 시장은 그걸 이미 안다. 모두가 아는 패턴은 미리 반영돼 가격이 먼저 움직이고, 막상 그 계절이 오면 효과가 사라진다. 알려진 아노말리가 공개되면 소멸하는 건 금융시장의 일반적 현상이다.
생존편향도 있다. 지금 시총 1,000억이 넘는 '살아남은' 종목만 봤으니 결과는 오히려 위로 부풀려져 있다. 그런데도 우연 수준이라는 건, 결론이 그만큼 견고하다는 뜻이다.
그래서 개미는
-
"○월엔 ○○주" 같은 계절 테마는 매매 근거로 삼을 만한 통계적 우위가 없다. 내러티브가 직관적일수록 더 의심하자
-
누군가 "과거 N년 중 M년 올랐다"고 하면, 반드시 물어야 한다 — 몇 개의 후보를 뒤져서 찾은 숫자인가? 검정 횟수를 빼놓은 적중률은 마술이 아니라 착시다
-
검증되지 않은 패턴을 따라가느니, 비용 낮은 분산투자가 대부분의 개인에게 더 낫다는 결론은 지루하지만 데이터가 반복해서 가리키는 방향이다
이 글은 특정 종목의 매수·매도 권유가 아니며, 과거 데이터 분석일 뿐 미래 수익을 보장하지 않는다. 우리는 AI 1년 투자 실험에서도 이렇게 '안 통한 것'을 안 통했다고 그대로 공개한다. 틀린 가설을 정직하게 버리는 것도 기록이다.