[피오르] 정시지원자 필독)2. 낙지를 신뢰할 수 없는 이유
게시글 주소: https://i.orbi.kr/00066160640
안녕하세요. BrainBox입니다.
글을 시작하기에 앞서, 오르비 컨설팅 팀 "피오르"로 부터 스카우트를 받아 "피오르 컨설팅"에서 컨설팅을 진행하고 있음을 밝힙니다.
저는 현재 피오르 컨설팅 으로 부터 스카우트를 받은 후, 메디컬 팀 소속으로 인서울, 메이저 의대 라인을 전담으로 컨설팅하고 있습니다.
제가 컨설팅 하는 학교들은 다음과 같습니다
서울대, 연세대, 가톨릭대, 성균관대, 울산대, 고려대, 한양대, 경희대, 중앙대, 인하대, 순천향대, 단국대
위의 학교들의 의과대학에 대해서만 컨설팅을 진행하고 있습니다.
이번에는 상담을 진행하면서 느낀, 낙지의 한계들에 대해 다뤄보려고 합니다.
이 이유가 동시에 컨설팅이나 표본 분석 등을 진행해야 하는 이유이기도 하니, 위 라인을 노리시는 분들이 아니더라도 꼭 정독하셔서, 후회 없는 원서영역 치르시기를 바랍니다.
글에서는 가독성을 높이기 위해 최대한 간결한 문체로 이어나가도록 하겠습니다.
1. 낙지도 결국 기업이다
낙지는 앞의 글에서 말한 것과 같이 "표본 분석"이라는 방법으로 정시 예측을 진행하는 플랫폼이다. 표본과, 실제 지원자 차이간의 간극을 최대한 반영하여, 주어진 표본을 가지고 실제 컷을 예측해 주는 것이 낙지가 기본적으로 작동하는 원리이다.
낙지는 "칸 수" 라는 시스템으로 학생들의 합격 확률을 직관적으로 나타낸다. 칸수가 높을 수록 학생의 합격 확률이 높다는 것이고, 낮을 수록 합격 확률을 낮아진다.
그리고 "5칸"이 합격/불합격을 결정하는 기준 칸 수이다. 즉, 5칸 이상부터 합격할 것이고, 4칸 이하부터 불합격 할 것이라고 예측한다는 것이다.
그렇다면, 낙지에서 알려주는 "칸 수"의 정확도는 어느정도 일까? 이를 확인하기 위해 낙지에서 발표한 칸 수 당 합격 확률을 살펴보자.
학교마다 상이하긴 하지만, 모든 과를 비교하는 것은 현실적으로 불가능하기에 가장 많은 학생이
지원하는 과 중 하나인 연세대학교(서울)를 기준으로 살펴보겠다.
낙지에서 발표한 칸 수 별 합격률은 다음과 같다.
낙지는 6칸 이상과 3칸 이하의 경우에서는 100프로에 달하는 적중률을 자랑하였다.
그런데, 가장 중요한 4칸과 5칸의 경우는 그 양상이 조금 다르다.
5칸의 경우부터 살펴보자.
5칸의 경우 합격률은 86.2%로, 합격할 것이라는 예측을 받은 학생들 중 13.8가 원서영역에서 고배를 마셨다. 86.2%라는 확률이 제 3자의 입장에서는 충분히 훌륭한 확률인 것은 자명한 사실이다. 그것만으로 낙지의 위상이 이렇게 높아진 과정을 충분히 설명할 수 있을 것이다.
그런데 당사자의 입장에서도 과연 같은 판단을 할 수 있을까?
13.8%라는 확률이 낮은 확률이긴 하나, 청춘의 1년 혹은 그 이상을 바친 수험생활에, 진심으로 자신을 던져 넣어 본 수험생이라면 안심하고 본인의 미래에 대한 모든 것을 맡길 만한 확률이라고는 할 수 없으리라 생각한다.
4칸의 경우는 그 정확도가 훨씬 더 낮아진다.
4칸의 경우, 불합격할 것이라는 진단을 받은 학생들 중 45.5%만이 예측과 같은 불합격 판정을 받았다.
물론 떨어질 것이라는 예측을 받았던 학생이 합격을 하는 것이 그 반대의 경우가 발생하는 것보다는 훨씬 나을 것이다.
그리고 낙지도 이를 알고 있기에, 컷을 일부러 조금 짜게잡아, 5칸 불합격의 경우보단, 4칸 합격의 경우를 늘리는 방향으로 첫을 예측하였을 것이다.
즉 낙지의 컷은, 명확한 확률을 구하는 것에 가장 집중한 컷이라기 보다는, 소비자들의 미움을 받지 않기 위해 다소 방어적인 태도로 형성된 컷이라는 것이다.
소비자들의 선택을 받아야 하는 기업의 입장에서 이러한 선택은 지극히 당연한 것이나, 이와 별개로 이러한 상황은 낙지가 제시하는 "칸 수"가 원서영역에 있어 낙지가 무한 신뢰의 대상이 될 정도로 정확하지는 않다는 것에 대한 방증이기도 하다.
2. 경향성이 없는 변수는 독립적으로 고려해야 한다.
정시 원서영역을 공부하다보면, 가장 명확히 해야하는 구분이 있다.
가/나/다 군 구분도 아니고, 대학별 반영비율 구분도 아니다. 가장 중요하면서 필수적으로 구분지어야 하는 부분은 바로 이것이다.
원서영역 = 이미 알고 있는 사실 + 경향성이 있는 것 + 경향성이 없는 것
위에 대한 구분을 명확하게 하지 않고, 정시 원서영역을 치르면 예측의 정확도가 매우 떨어지게 된다.
이중에서 가장 중요한 것은 단연 "경향성이 없는 것"에 대한 구분이다. '경향성이 없는 것' 역시 우리가 모르는 부분이기에 상당수의 사람들이 "경향성이 있는 것"과 이를 혼동한다. 심지어 낙지 마저 이 부분을 명확히 구분하지 못하는 모습을 보여준다.
둘을 혼동해서 작년과 같거나 비슷하다는 판단하에 원서영역을 치르는 것이다.
그 중 가장 대표적인 것이 바로 "수시 이월 인원" 과 "경쟁률" 이다.
"경쟁률"은 수시 이월 인원에 대해 다루다 보면 자연스레 등장하는 내용이니, "수시 이월 인원"에 대해 먼저 이야기 해 볼 예정이다.
수시 이월 인원에 대해 이어나가기 전에, 수시 이월 인원이 무엇인지 모를 입린이 들을 위해 수시 이월 인원에 대해 간단하게 설명하고 글을 이어나가도록 하겠다.
대학의 정원은 크게 수시인원+정시인원으로 구성되어 있다. 그리고 뽑는 순서는 모두가 알다시피 수시 -> 정시 의 순이다.
즉, 수시인원을 먼저 전부 선정한 후에, 정시 인원을 뽑는다.
그런데 수시전형에서, 대학이 꼭 정원을 꽉 채워서 학생들을 뽑지 않는 경우가 발생한다.
이때 수시정원에서 남는 인원이 정시 정원으로 이월되는 상황이 발생하고, 이 이월되는 사람의 수를 수시 이월 인원이라고 한다.
정시 최종 정원 = 최초 정시 정원 + 수시 이월 인원
으로 정리해 볼 수 있다.
그렇다면 수시 이월 인월을 왜 예측하면 안될까? 그 이유는 수시 이월 인원이 정원을 직접적으로 결정하는 이유이기 떄문이다.
그렇다면 왜 정원을 예측하면 안될까? 그 이유는 바로 정원이 표본들의 이동에 직접적인 영향을 미치기 때문이다.
이 말 만으로는 수시 이월 인원의 영향력을 이해하기 힘들테니, 그 영향력을 명확하게 이해할 수 있게 하기 위해 예시를 하나 들어보려고 한다.
다음은 한 대학의 2022학년도와 2023학년도의 수시 이월 인원에 따른 경쟁률의 변화이다.
개인적으로 위의 경우만큼, 수시 이월 인원과 경쟁률 간의 상관관계를 잘 드러내는 경우는 없다고 생각한다.
위의 대학에서 22년의 경우, 무려 9명의 인원이나 정시로 이월되었었다.
사람들의, 정원이 많은 학교일수록 안정적이라고 생각하는 경향과 맞물려 무려 5.38의 경쟁률을 달성해 5.38 x 24 = 129 명이나 지원을 하였고, 자리가 많으면 보다 여유로울 것이라는 예측과는 달리, 당해 가장 치열한 경쟁이 일어난 곳 중 하나게 되었다.
반면, 작년에는 0명이 이월 인원으로 결정되어 15명으로 최종 정시 정원이 결정되었다.
정원이 적을 수록, 경쟁이 치열할 것이라는 우려와 달리, 오히려 작년에는 많은 사람들이 낮은 정원에 불안해 하며, 이 학교에 지원하지 않았다.
따라서 경쟁률이 3.8에 불과해 고작 3.8 x 15 = 57명 정도밖에 지원하지 않았고, 엎친데 덮친 격으로 추합이 10명이나 돌아 사실상 25등까지 합격증을 받은 학교로 작년 입시를 마무리하였다.
낙지는 항상 수시 이월 인원을 작년도과 같다고 전제하고 예측을 진행한 후, 수시 이월 인원이 발표되면 이를 정정한다.
작년의 경우, 올해와는 약간 다르나 다음과 같은 형식으로 예측 인원을 결정하였다.
위의 부분에서 "예상 수시 이월 인원" 이라는 란이 보일 텐에, "예상" 이라고 쓰고 "작년"이라고 읽으면 된다.
예상이라는 말이 무색하게, 그저 작년의 이월인원을 그대로 붙여넣었다.
그런데 다른 것들과 달리 이월 인원은 전적으로 당 해 대학의 마음에 달려있다. 경향성이라는 것 자체가 존재하지 않는 부분인 것이다.
그런데 이것을 작년과 같다고 전제하고 분석하였으니 당연히 완전히 정원이 달라질 수 밖에 없었다.
그렇다면 정원이 달라지는 것이 무엇이 문제일까?
낙지는 전체 정원과 경쟁률을 곱해 실제 지원자 수를 예측한 후, 얼마나 표본이 유입되었는지 계산해 컷을 형성한다.
그런데 정원이 달라지면 이 핵심 알고리즘이 완전히 꼬여버리는 것이다.
예시를 들어 보다 자세하게 설명해 보도록 하겠다.
다음의 조건을 갖는 학교가 있다고 가정해보자
작년 정원: 30+ 5(이월)
작년 경쟁률: 3.5
확보한 표본 수 : 40
위의 경우, 실제로 지원할 사람의 수는 총 35 x 3.5 = 122명이라고 예측되는데, 그중 오직 40명의 표본만이 있는 상황으로 판단하게 된다.
이때 표본의 수가 매우 적으므로 30명 중 10등 정도까지만 합격할 것이라고 커트라인을 형성하게된다.
남은 25명은 유입되지 않은 표본에 포함되어 있다는 것을 반영한 결과일 것이다.
그런데 입시가 끝난 후 확인해 보니, 실제 상황이 다음과 같았다.
정원: 30 + 0(이월)
실제 경쟁률: 1.5
확보한 표본 수 40
다음과 같은 상황에서 실제로 지원한 사람의 수는 고작 30 x 1.5 = 45명에 불과했고, 그중 40명의 표본을 이미 확보했던 것이었다.
그래서 실제로 표본 40명중 28등 까지 합격할 수 있었던 것이다.
이 경우 표본 상 11등-28등에 해당하는 17명의 학생들은 합격할 수 있었는데, 합격할 수 없다는 예측 결과를 받게 되어버린 것이다.
그럼 이런 상황에서 입시에 대해 어느 정도 아는 누군가는 이런 질문을 던질 수 있다.
Q. 수시 이월 인원은 어차피 발표되니, 잘못 예측해도 정정되는 오류가 아닌가?
그런데 이는 입시를 반만 아는 자의 질문이다. 이월 인원은 정정되나, 수시 이월 인원이 영향을 미치는 경쟁률에는 정정된 수시 이월 인원이 반영되지 않기 때문이다.
앞서 말한 예시에서 확인할 수 있듯이, 수시 이월 인원은 정원을 결정하고, 정원은 실제 경쟁률에 결정적인 영향을 미친다.
그렇기에 작년 경쟁률은, 사실은 작년의 수시 이월 인원을 반영하는 변수이다.
그런데 낙지는 올해를 예측할 때 작년의 "수시 이월 인원" 만 정정할 뿐, 그것에 영향을 받은 "경쟁률"은 정정하지 않는다.
올바르게 컷을 예측하기 위해서는 "올해 수시 이월 인원에 따른 예상 경쟁률"을 구해야 하는데 낙지는 이 부분에 대해 인지하고 반영하기는 커녕, 이를 해결 하기위한 일체의 노력을 기하고 있지 않은 것으로 보인다.
이것이 실제 상황에서 어떤 일을 초래했는지 예시를 들며 이부분을 마무리 하려고 한다.
다음은 위에서 한 번 언급했던 경우이다.
낙지가 작년에 처음 예측했던 전체 지원자의 수는 다음과 같았다.
예상 정원: 15+9(22 이월자 수)=24
예상 경쟁률: 5.38(=22 경쟁률)
예상 지원자 수 : 5.38 x 24 = 129
수시 이월 인원이 발표된 후에는 다음과 같이 예측하였다.
예상정원: 15 + 0
예상 경쟁률: 5.38(=22 경쟁률)
예상 지원자 수 : 5.38 x 15 = 81
그런데 당시 들어와 있는 표본의 수는 고작 40명 정도였다. 따라서 충분한 표본이 형성되지 않았다고 판단되었고, 실제보다 높게 컷이 형성되었다.
작년에 낙지에서 불합격할 것이라는 예측을 받은 2-3명의 학생들이 실제로는 합격을 할 수 있었다는 것이다.
올해는 "예상 이월 인원"이라는 말도 안되는 항목은 없어졌으나, 경쟁률은 작년의 것을 그대로 이용하고 있는 것으로 보인다.
이 부분은 그냥 "오차"로 치부하기에는 영향력이 지대한 부분이다.
특히 이런 잘못된 경쟁률 설정으로 인한 오차는, 전체 표본수가 적은 집단일 수록 큰 영향을 받는다.
내가 전문으로 컨설팅하는 인서울 의대 라인에서는 위와 같은 변수에 따른 차이가 정말 크다.
그러므로 꼭 분석할 때에 이를 고려해 예측 결과를 도출해 내는 것의 필요성을 더욱 절감한다.
그러나 꼭 이 라인의 속한 사람이 아니더라로, 위와 같은 오차를 정정할 필요성을 분명히 존재한다.
그리고 그것이, 대부분의 사람들이 낙지만 보는 것이 아니라 컨설팅을 받고, 직접 분석을 하는 이유이리라 생각한다.
글이 너무 길어져 어떤 식으로 예측하느냐에 대한 부분은 다음에 기회가 되면 올려볼 예정입니다
낙지를 맹신하는 사람이 상담하면 종종 보여, 이 부분에 대한 경계심이 필요할 것 같아 글을 작성하였습니다.
최종 업데이트나, 이러한 표본 이동을 관찰하며 사람들이 새롭게 지원 전략을 수립하며 희망 대학을 수정하는 것을 감안해, 대형 플랫폼에 대한 절대적인 믿음을 지양하고 부수적인 노력이 투입되어야 충분한 정확도를 확보할 수 있다는 것을 주장하기 위함임을 밝힙니다.
추가로 피오르 컨설팅은 다음 링크로 들어가서 신청해 주시면 됩니다!
어떤 팀보다 정확하고 섬세하게 컨설팅 할 수 있다는 자부심이 있습니다.
감사합니다 :)
또, 저의 다른 글들은 제 개인 블로그에서 읽어보실 수 있습니다!
[입시에 도움이 되는 글 모음]
https://orbi.kr/00065216335 : 유인우 - [입결표] 20~23학년도 메디컬,문이과 주요대학 추정 입결표
https://orbi.kr/00065221190 : 유인우 - 24학년도 정시 주안점
https://orbi.kr/00065232324 : 군툰문 - 불수능과 표본분석
https://orbi.kr/00065580165 : 군툰문 - 어디서 펑크가 날 것인가
https://orbi.kr/00065277552 : Cogito - 표준점수, 누적백분위, 펑크, 폭발
https://orbi.kr/00065300256 : Cogito - 표본의 이동방향, 대체학과, 기피학과
https://orbi.kr/00065251112 : 정시기다리는 - 변환표준점수란 무엇인가?
https://orbi.kr/00065410392 : 종냥 - 2024학년도 메디컬계열 정시 지역인재 칼럼
https://orbi.kr/00064084053 : 종냥 - 메디컬 입시요강을 볼 때 확인할 4가지 포인트
https://orbi.kr/00065458030 : 종냥 - 모의지원에서의 허수 이야기
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
?
-
오르비 명예의 전당 같은거 만들어주세요 이제 좀 전설적인 거물급 옯붕이들...
-
듣기랑 30번 틀림...어이가 없음
-
연계 예측좀여 0
난 여러분 믿어요
-
화작 94 미적 60 영어 91 사문 47 생윤 50 입니다... 작수 화미물지...
-
가즈아
-
안녕하세요. 영포자 전문 영어강사, Good day Commander입니다. 수능이...
-
17번 해강에서 1:10분대 쯤에 반성유전에서 (가)에서 아버지가 우성이면 딸이...
-
지금 문학만 신청 되어있습니다 강의계획서에는 문학 과정 수강생은 따로 인강 들으라고...
-
.
-
(긴글) 재수하면 다 실패하나요.. 조언 부탁드립니다 16
현역 때 처음 각잡고 정시 공부 시작했고 작년 2학년 학평 대비 올해 6모/9모...
-
지금 2~3 왔다갔다하긴 하는데 뭔가 불안하기도 하고 최소 3만 받고 싶어서요.....
-
풀만한가요? 이제 실모 하나푸는것도 엄선해서 풀고싶은데
-
어떤편인건가요 수능 난이도 정도라고 보면 되나요??
-
신택스 2025버전을 듣고있는데 만약 2026버전이 나오면 2025버전은 바로...
-
더프 사설이던 평가원모의고사든 검사는 맨날하지만 직접 본적은 없음 내 기억상으로...
-
평소 실모 76-80쯤 나오는데 이번에 88 나와서 당황스럽네요;; 쉬웠나요?
-
솔텍에 있던 문젠데요. 해답에는 변환단층이라고 나와있는데 해양판 해양판...
-
역시나는 2
물수학이맞다 강대x같은거도 6층에살았는데 수학쉬우니까살맛나네..
-
이감 등급컷 기준으로 찍은거 합치면 80으로 턱걸이 3이고, 빼면 71로 높5인데...
-
국영 11인데 탐구 3안에만 들면 바로 성불 할수 있는데 좀 걱정.... 생지 42...
-
이퀄 수학 14번 15
y=x-1 에 대칭인걸로 못푸나요 왜 안되징
-
매체 언어 독서 (인문철학제외) 문학 인문철학 이렇게 푸는데 독서에서 자꾸...
-
아 근데 독서는 신청 못했는데 문학 맛있나요
-
1회 50 2,3,4회 44 5회 47인데 쉽다는 분들도 많길래 수능대비 난이도가...
-
화작확통생윤사문 88 93(15찍맞) 46 50
-
닥 후?
-
수능 부정행위임? 그거만 아니면 수능이후 책임은 모두 질 생각임 히터 바람오는걸...
-
수능전까지 그냥 사설모고 하나사서 벅벅하는거 또는 기존에 해온거 정리하고 감각은...
-
난이도 어땟어옆???? ㅠ 평소보다 못봐서 … 하
-
수1 수2 한권씩 하루에 다풀려면 몇시간걸리려나유 스텝23만
-
어디대학부터 옮기는게 유의미할까요?
-
에피 중경외시건동홍도 심심찮게 보임 센츄는 흔하고 ㄷㄷ…
-
내용 파악이 힘들고 상황 파악이 힘들게 글을 쓴거는 그냥 글을 못 쓴거 아닌가......
-
야댚 제본 맡길건데 4주차까지 있으면 좀 불편한데...
-
내년12월 중순부터 국어 인강을 제대로 들으려고 합니다. 지금 현재 강민철,정석민쌤...
-
왜 아무도 얘기를 안함..? 나 원래 많아봐야 3틀이었는데 8틀인데…?!
-
1컷 88 급이라고? ㅅㅂ 언미화생 84 93 2 50 47 약대 가능?
-
더프보고느낀점 0
수능때 커하 찍을 거라는 생각을 줄곧 해왔었는데 그냥 실수만 안하면 좋겠다..
-
빨간 줄 부분 해석인데 어디부터 잘못된건가요?? 수학황분들 부탁드립니다
-
왤케 언급이 없어
-
D-377 공부 10
-
국어인강 추천좀 2
고2인데 국어인강은 수국김듣다말았고 강민철이나 김동욱커리 타려고하는데 뭐가 괜찮음?...
-
그녀에게 들리게.
-
3번에 왜 4가 아니라 3이에요..? 아무리봐도 모르겠는데 진지하게 이번 독서중에...
-
6평백분위 99 10덮 100점 11이퀄 77점 매체 4개틀 ㅋㅋ
-
보통 몇분내로 풀어야 적당한가요 문제는10문제입니다
-
젤 부러운 분들.. 수능판도 미련없이 뜨실듯
최고에요!!
좋은 정보 감사합니다!
그런데 당자사의 입
당사자 아닌가여
오타 있습니다
앗 그렇군요! 감사합니다 :)
와 지렸다.... 써주신 글 전부 다 읽을게요