SemPer_ [606828] · MS 2015 · 쪽지

2020-10-12 23:05:48
조회수 1,938

70,85컷 안 중요해요

게시글 주소: https://i.orbi.kr/00032627029

정확히는 안 중요하다기보다는 개인적인 생각으로는 분해능이 떨어진다(?)라고 보는게 맞음


70컷은 합격자들중 상위 70%의 점수 혹은 누백

85컷은 합격자들중 상위 85%의 점수 혹은 누백을 의미합니다.


Outlier를 구분하기 위한 선이라고 생각하시면 됩니다.


Outlier는 일반적으로 특이한 케이스를 의미한다고 생각하시면 되는데


실제로 많은 Outlier들이 나오게 되면 해당 학과나 학교의 인식이 떨어지게 되고 이에 따라서 전체적인 입결의 하락을 초래할 수 있기 때문에


많은 학교의 입학처들이 이러한 꼬리컷을 발표하는 것 혹은 드러나는 것을 매우 싫어합니다.


또한 일반적으로 해당 개념들을 사용하는 경우에 '학교의 진짜 라인을 알 수 있다'라는 느낌으로 이야기를 하죠.


그렇다면 여기서 질문.


왜 하필이면 70%와 85%이죠?


다른 숫자들도 많은데?


그건 위에서 말했다시피 그 사람들의 판단 기준입니다.


이러한 개념들을 만든 사람들을 비판하고자 하는게 아닙니다.


Outlier에 대한 사람들의 기준이 다를 뿐입니다.


단, 이 선을 어디서 긋는지에 따라서 엄청나게 해석이 달라질 수 있다는 것이죠.



예를 들어봅시다.


Box Plot에서 들어보신분이 있으신지 모르겠습니다.


다음과 같이 생겼는데요,




일단 위의 그림을 설명하자면 x축은 서울 25개의 구, y축은 아파트의 평당 가격[만원]입니다.


보시면 직사각형에 선이 하나그어져있고, 위 아래로 선이 조금 이어져있다가 검은색 줄이 나오는걸 보실 수 있습니다.


자세히 보기 위해 강남구만을 가지고 왔습니다.


보라색 박스안에 그어진 선은 평균을 의미합니다.


보라색 박스의 윗변은 1사분위수(25%)를 의미합니다.


보라색 박스의 아랫변은 3사분위수(75%)를 의미합니다.


그리고 그 위 아래로 검은선과 그 boundary는 maximum과 minimum을 의미하며, 각각 1사분위수와 3사분위수에 1.5*(3사분위수-1사분위수)를 빼고 더해준 것을 의미합니다.


그리고 maximum과 minimum을 벗어나는 경우 Outlier로 생각합니다만....


많은 데이터사이언티스트들이 그렇지는 않습니다.


저걸 넘어가면 Outlier라는 것은 박스플롯 만든 사람의 생각이고.


예를 들어 저라면(저는 데이터사이언티스트는 아닙니다만) 지금 보시는 강남구에서 맨 위의 3개의 점을 삭제할 것 같습니다.




여기까지가 outlier에 대한 설명이었고


제가 왜 이렇게 애매하고 이거도 아니다 저거도 아니다라고 이야기하냐면


정보에 대한 비판적인 시각을 가지라는 의미입니다.


입시는 여러분들의 인생을 결정하는 가장 중요한 관문 중 하나입니다.


정말 수 많은 정보들이 있으나 모든 정보들은 메신저를 통해서 전해지며


왜곡될 위험이 있는 것은 당연합니다.


지금 제가 전하려는 정보도 마찬가지고요.



또 예를 들어봅시다.


작년 연세대학교 생활디자인학과의 경우 컷이 723.0이었던것으로 기억합니다.


다른학과들에 비해서 상당히 낮았어요.


그런데 이걸 보정하기 위해서 70%컷을 적용하면 엄청 뛰겠죠?


근데 중요한건, 723.0바로 위의 점수가 730대이면 그게 이해가 되겠는데 (2020 연생디 정시모집인원: 11명)


바로 위의 점수가 0.1점차이가 납니다.


이러면 723.1과 723.0을 outlier처리해야될까요?


근데 70%컷이면 이러한 정보들은 전혀 알지 못한채 받아들이는겁니다.



한 번 더 강조하지만 여러분들은 많은 정보들을 비판적으로 받아들이지 않으면 속고 사는 것과 다름없습니다.


특히나 대학입시판에서는 더...

rare-나무위키

0 XDK (+0)

  1. 유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.