KDI Open Access is a program of fully open access journals to facilitate the widest possible dissemination of high-quality research. All research articles published in KDI JEP are immediately, permanently and freely available online for everyone to read, download and share in terms of the Creative Commons Attribution 4.0 International License.

The Effect of Private Tutoring Expenditures on Academic Performance: Evidence from Middle School Students in South Korea

Author & Article History

Manuscript received 06 September 2011; revision received 11 October 2011; accepted 03 February 2012.

Abstract

This paper examines the effect of private tutoring expenditures on academic performance of middle school students in South Korea, using data from “Analysis of the Level of School Education and Its Actual condition: Middle School”. In the face of endogeneity of private tutoring expenditures, the paper employs an instrumental variable (IV) method and a nonparametric bounding method. Using both methods we show that the true effect of private tutoring on middle school students remains at most modest in Korea. The IV results suggest that a 10 percent increase in tutoring expenditure for Korean, English and math raises a student’s test score of the subject at the largest by 1.24, 1.28, and 0.75 percent, respectively. The bounding results also fail to show evidence that an increase in tutoring expenditure leads to economically and statistically significant improvements in test score.

Keywords

사교육, 시험점수, 비모수적 범위, Private Tutoring, Test Scores, Nonparametric Bounds

JEL Code

I20, C30

Ⅰ. 서 론

최근 국내외 교육경제학 연구에서 흔히 등장하는 하나의 주제는 학교 밖 사교육(private tutoring)이 학생의 학업성적에 미치는 인과효과의 크기를 추정하는 문제이다. 예를 들어 Dang(2007)Dang and Rogers(2008)는 베트남의 자료를 이용하여, 그리고 Ono(2007)는 일본의 자료를 이용하여 사교육의 성적 향상효과를 추정하였다. 이들의 연구 결과에 의하면, 사교육은 학생의 성적을 향상시키는 강력한 효과가 있다. 반면에, 미국 자료를 이용한 Briggs(2001), 터키의 자료를 이용한 Gurun and Millimet(2008) 및 우리나라의 ‘한국교육고용패널’을 이용한 Kang(2007)의 연구와 ‘한국교육종단연구’ 자료를 이용한 강창희⋅이삼호(2010) 등에 의하면, 사교육은 학생의 교육성과에 그다지 큰 긍정적인 영향을 미치지 못한다.

이상의 연구들은 사교육의 효과 연구를 선도했다는 측면에서 기여한 바가 크지만, 일부 연구의 실증 결과들은 사교육의 인과효과라고 결론 내리기에는 많은 한계들이 존재한다. 예를 들어 Dang(2007)은 통계모형에서 사교육의 내생성을 통제하기 위하여 학생이 거주하는 지역(commune)의 학교들에서 부과하는 튜터링 가격(tutoring fees)을 도구변수로 사용한다. 그러나 저자가 스스로 인정하듯이, 이 도구변수는 학생 거주지역의 생활수준과 연관이 있을 수 있고, 이로 인하여 사용된 도구변수가 외생적이라고 단정하기 힘들다. Ono(2007)는 일본의 로닌(ronin, 일본에서 관찰되는 대학입시 재수현상)이 진학하는 학교의 수준에 미치는 영향을 분석하였다. 그는 로닌의 도구변수로서 학생의 출신지역 내에 있는 대학들의 평균적인 수준을 사용하였다. Dang(2007)에서와 같이 이 도구변수 또한 학생 본인 및 그 가족의 관측되지 않는 특성을 통하여 학생이 진학하는 대학의 수준과 연관될 수 있으므로 외생적이라고 인정하기 어렵다. Briggs(2001)는 미국의 자료를 이용하여 코칭(coaching)이 대입시험(SAT 또는 ACT)의 성적에 미치는 영향을 추정하였다. 그는 코칭의 내생성을 통제하기 위하여 Heckman의 선택편의 교정모형을 사용하고 있으나, 효과를 식별하기 위하여 단지 함수의 비선형성에 의존할 뿐 특정한 도구변수를 사용하고 있지는 않다.

우리나라에서 사교육에 대한 연구는 다른 나라들보다도 앞서 2000년대 초반 이후 본격화되기 시작하였다. 우리나라의 학부모들이 전통적으로 높은 사교육비를 지출하여 왔음을 생각할 때 이는 그리 놀라운 일이 아니다. 우리나라에서 사교육의 효과에 관한 연구는 다름 아닌 교육학, 교육심리학 및 교육사회학 분야의 연구자들에 의해 시작되었다(한대동 외[2001]; 오영수⋅윤정식[2003]). 사교육의 인과효과를 추정하는 문제가 정책효과나 처치효과 분석의 하나의 응용분야라는 인식하에서 최근 경제학자들이 사교육의 효과 추정 연구에 참여하고 있다(Kang[2007]; 강창희⋅이삼호[2010]; 김진영[2007]; 남기곤[2008]; 최형재[2008]).

지난 10여 년 동안 교육학 및 경제학 연구자들이 우리나라에서 사교육이 성적에 어떠한 효과를 미치는지를 추정하기 위해 많은 노력을 기울여 왔지만, 아직 그 효과의 크기에 대하여 합의된 견해가 형성되어 있지는 않다. 그 이유는 무엇보다도 대부분의 기존 실증연구들에서 사교육활동이나 사교육비가 가지는 내생성(endogeneity)이 적절하게 통제되지 못했기 때문이다. 예를 들면 조혜영⋅이경상(2005)김진영(2007)의 연구에서는 학생이 받은 사교육의 양을 표시하는 변수로서 사교육시간이, 그리고 이수정⋅임현정(2009)에서는 사교육비용이 사용되었다. 사교육이 교육성과에 미치는 영향을 추정하기 위하여 이들 연구에서는 사교육변수에 대하여 단순회귀분석방법(Ordinary Least Squares: OLS)을 적용하였다. 하지만 무작위 또는 자연실험을 통하지 않은 경우 단순 회귀분석의 추정치는 인과관계(causation)가 아니라 상관관계(correlation)만을 표시한 다는 점은 이미 잘 알려진 사실이다. 일부 교육학 연구자들은 단순회귀분석법 대신에 위계선형모형(Hierarchical Linear Model: HLM)을 통계 분석에 활용한다(임천순 외[2004]; 박현정 외[2008]). 하지만 HLM 또한 우도함수를 도출하는 과정에서 사교육비에 대한 외생성을 가정하기 때문에 OLS법과 동일한 한계에 직면한다.

사교육의 효과를 추정하는 대부분의 연구들이 사교육비의 내생성을 무시하거나 제한적으로만 고려한 데 비하여, 아래의 세 연구들은 내생성을 추정과정에서 명시적으로 다룬다. 먼저 Kang(2007)에서는 사교육비 지출액의 도구변수로서 학생의 출생순위가 첫째아(first-born)인지의 여부가 사용되었다. 이는 Black et al.(2005)에서 이미 제안된 도구변수로서, 개인의 출생순위는 출생과 동시에 외생적으로 결정되지만, 첫째아는 다른 형제들에 비하여 더 많은 교육투자를 받는다는 사실에 근거한다. 위의 도구변수 추정방법을 이용하여 한국직업능력개발원의 ‘교육고용패널’ 자료를 분석한 Kang(2007)의 결과에 따르면, 사교육은 학생의 성적에 양의 영향을 미치기는 하지만 그 크기는 그리 크지 않다. 사교육비 지출이 10% 증가할 때 학생의 성적은 평균 0.4% 정도 상승한다. 둘째, 최형재(2008)는 종속변수로서 진학한 대학의 질적 수준을 사용하였다. Kang(2007)에서와 마찬가지로, 이 연구에서 사용된 사교육비의 도구변수는 학생의 출생순위이다. 그의 결과에 의하면, 10% 높은 사교육비 지출은 학생이 상위 31개 대학이나 의학과에 입학할 확률을 약 0.6~0.7% 정도 상승시킨다. 마지막으로 김지하⋅김정은(2009)에서는 내생성 통제를 위하여 성향점수 매칭법이 사용되었다. 이 연구는 내생성에 대한 인식 측면에서 과거의 연구들보다 진일보하였지만 사용된 사교육변수가 사교육비(tutoring expenditures)가 아니라 사교육 참여 여부여서 사교육의 효과를 정밀하게 탐구하는 데에는 한계가 있다. 물론 성향점수 매칭법이 인과효과의 추정에 어느 정도 효과적인지에 대한 실증방법론상의 의문도 여전히 남아 있다.

본 논문에서 우리는 사교육비의 내생성을 명시적으로 고려함과 동시에 그동안 사교육비의 효과 연구에서 사용되지 않았던 새로운 자료를 사용한다. 먼저 통계방법의 측면에서, 사교육의 내생성을 통제하는 방법으로 우리는 첫째아 여부를 사교육비 지출액의 도구변수로 활용하는 2단계 추정법을 적용한다(Kang[2007]; 최형재[2008]). 첫째아 여부는 사교육비와는 양의 연관관계를 가지고 있기는 하지만, 이 변수가 종속변수인 학업성적과 영의 상관관계를 보이는 진정한 외생변수(exogenous variable)라고는 보기 어렵다. 우리는 아래에서 첫째아 여부 도구변수는 사교육비의 효과를 과대추정(overstate)할 가능성이 있음을 지적한다.

본 논문에서 사용되는 두 번째의 통계방법은 실증경제학에서 최근 소개되기 시작한 비모수 구간추정법(nonparametric bounds methods)이다. 비모수 구간추정법은 Manski(1990)에 의해 최초로 경제학에 소개되었고, 이후 Manski(1997)Manski and Pepper(2000)에 의하여 그 방법이 보다 구체적으로 개발되었다. 이 방법이 실제로 적용된 사례로는 Blundell et al.(2007), Gerfin and Schellhorn(2006), Gonzalez(2005), Kreider and Pepper(2007), Lechner(1999), Manski and Nagin(1998), Pepper(2000)강창희 ⋅이삼호(2010) 등이 있다. 비모수 구간추정법의 기본 아이디어는 외생성보다는 완화된 가정을 적용하여 통상적인 점추정치(point estimates) 대신에 인과효과의 범위, 즉 그 하한(lower bound)과 상한(upper bound)을 구하는 방법이다. 이와 같이 추정된 인과효과의 범위가 충분히 작다면 우리는 인과효과의 실제 크기가 이 범위 내에 존재하는 것으로 해석할 수 있다.

우리는 도구변수법과 비모수 구간추정법을 한국교육개발원에서 2004년 중학교 3학년 학생 약 14,000명을 대상으로 구축한 ‘학교교육 수준 및 실태 분석 연구: 중학교’ 자료 (이하 ‘중학교 실태 연구 자료’)에 적용한다. 본 자료를 이용한 실증분석 결과에 의하면, 사교육비 지출은 학생의 학업성적에 다소 긍정적인 영향을 미치기는 하지만 그 영향이 그리 크지는 않다. 도구변수법의 결과에 의하면, 10% 높은 사교육비 지출은 국어성적을 약 1.24%, 영어성적을 약 1.28%, 수학성적을 약 0.75%, 그리고 세 과목 전체의 평균성적을 약 0.74% 정도 향상시킨다. 구간추정법의 결과에 의하면, 10% 높은 사교육비 지출은 국어, 영어, 수학 성적을 각각 최대 0.77~0.84%, 2.16~2.64%, 2.04~2.84% 정도까지 향상시킨다. 그러나 모든 과목에서 공통적으로 효과의 최솟값이 0과 다르다는 실증적인 증거가 부족하다. 이를 보수적으로 해석하면, 국어, 영어, 수학 과목에서 모두 높은 사교육비 지출이 유의미한 정도로 성적을 향상시킨다는 증거를 발견하기 어렵다. 이상의 결과는 동일한 통계방법을 고등학교 3학년의 대입수능시험 성적자료에 적용한 Kang(2007)이나, 중학교 2~3학년 학생의 학업성취도에 적용한 강창희⋅이삼호(2010)의 연구 결과와 일맥상통한다. 이는 본 논문에서 추정한 사교육비 성적 향상효과의 크기가 신뢰할 만한 수치임을 암시한다.

본 논문은 다음과 같이 구성된다. 제Ⅱ장에서는 계량분석모형이, 제Ⅲ장에서는 사용된 자료에 대한 설명이 다루어진다. 제Ⅳ장에서는 분석 결과가 기술되고, 제Ⅴ장 결론으로 본 논문은 마무리된다.

Ⅱ. 계량분석모형

횡단면 자료를 사용하는 본 논문의 실증분석에 적용되는 통계모형은 다음과 같다.1

이 식에서 yi는 사교육비의 효과 측정에 사용되는 종속변수로서 학생 i의 시험성적(개별과목 또는 복수 과목의 평균)을 표시한다. 각 과목마다 시험의 난이도나 시험에 참가하는 학생들의 구성이 조금씩 다를 수 있기 때문에 서로 다른 시험의 성적을 표준화할 필요가 있다. 이를 위하여 우리는 각 과목의 원점수를 그 과목 전체 샘플의 평균과 표준편차를 이용하여 표준화한(정규화한) Z-점수를 아래의 통계 분석에서 사용한다. si는 자료에서 측정된 월평균 사교육비 지출액(Si)의 자연 로그값을 표시하고, Xii의 개인 배경, 가정 배경 및 학교 배경을 표시하는 벡터이다. εi는 모형의 오차항이다.

사교육비의 효과에 관한 통상적인 연구들에서는 식 (1)을 단순회귀법(OLS) 또는 위계선형모형(HLM; Raudenbush and Bryk[2002]) 추정법을 이용하여 추정하였다. OLS와 HLM의 추정량이 β1에 대한 일치추정량(consistent estimates)이 되기 위해 필요한 조건은 ‘Cov(si, εi) = 0’이다. OLS나 HLM에서는 공통적으로 오차항에 대하여 ‘εid(0, σ2)’을 가정한다. 여기에서 d는 평균이 0이고 분산이 σ2인 임의의 확률분포 (예를 들어 정규분포)를 표시한다. 이때 εi의 평균 0은 식 (1) 우변의 설명변수들, 특히 si와 아무런 관련이 없는 임의의 상수이기 때문에 ‘εid(0, σ2)’ 가정은 결국 ‘Cov(si, εi) = 0’을 함축한다. 즉, 분석자료에서 ‘Cov(si, εi) = 0’의 관계가 성립한다는 가정하에서 OLS와 HLM 추정법은 사교육비 지출의 진정한 인과효과(β1)에 대한 일치추정량을 도출한다. 그러나 만약 분석자료에서 ‘Cov(si, εi) = 0’의 가정이 성립되지 않는다면 추정치 jep-34-2-139-e001.jpgβ1에 대하여 부정확한 정보를 제공한다. ‘Cov(si, εi) > 0’이 성립하는 경우 jep-34-2-139-e001.jpgβ1에 대한 과대추정치(overestimates)가 되고, ‘Cov(si, εi) < 0’이 성립하는 경우 jep-34-2-139-e001.jpgβ1의 과소추정치(underestimates)가 된다.

예를 들어 학생의 부모가 교육열이나 소득이 높으면 그 학생에 대한 사교육비 지출이 높다고 예상할 수 있다. 이 상황에서 교육열이나 소득이 높은 부모들이 그것이 낮은 부모들에 비하여 지적인 능력 또한 평균적으로 우수하다면, 우리는 ‘Cov(si, εi) > 0’의 관계가 성립한다고 추측할 수 있다. 만약 부모의 교육열 또는 부모의 지적인 능력 등과 같이 사교육비 지출과 학생의 학업성적에 동시에 영향을 미칠 가능성이 있는 변수들이 식 (1)의 우변에서 적절히 통제되지 않는 경우 OLS나 HLM을 통해 구한 jep-34-2-139-e001.jpg은 사교육비의 진정한 인과 효과를 과장할 위험이 있다.

Cov(si, εi) < 0’가 성립하는 반대의 가능성도 상상해 볼 수 있다. 예를 들어 학부모의 교육열이나 소득이 동일하더라도 학생의 사교육 이전의 성적 또는 동기부여 수준(motivation)이 낮으면 부모는 자녀의 성적 향상을 위해 많은 사교육비를 지출할 가능성이 있다. 이 경우 ‘Cov(si, εi) < 0’이 성립하고 이로 인하여 jep-34-2-139-e001.jpg는 사교육비의 진정한 효과를 과소평가할 위험이 있다. 결국 이론적인 다양한 가능성들은 ‘Cov(si, εi) = 0’이 성립할 확률보다는 그것이 성립하지 않을 확률이 더 높음을 암시한다. 결국 사교육비와 성적간의 인과관계에 관한 통계 분석의 핵심은 ‘Cov(si, εi) ≠ 0’으로부터 발생하는 si의 내생성을 어떻게 적절히 처리할 것인가 하는 문제로 귀결된다고 할 수 있다.

본 논문에서는 ‘si의 내생성’을 통제하는 방법으로서 최근 실증경제학 연구에서 관측자료(observational data) 분석에 폭넓게 활용되는 도구변수법과 비모수 구간추정법을 사용한다.

1. 도수변수법

본 논문의 첫 번째 분석방법(방법 I)은 도구변수법(instrument variables methods)이다. 도구변수법에서는 식 (1)의 중요 내생변수(si)와는 관련성이 높고, 오차항(εi)과는 무관한 도구변수(instrumental variable: IV)를 사용하여 식 (1)을 2단계 추정법에 의하여 추정한다. 본 논문에서는 Black et al.(2005, p.695)의 제안에 따라, 학생의 출생순위(birth order)가 첫째인지의 여부(Fi)를 사교육비 지출(si)에 대한 도구변수로 활용한다. 한 개인의 출생순위는 의심할 여지없이 자연에 의하여 외생적으로 정해지기 때문에 ‘Cov (Fi, εi) = 0’의 관계가 성립할 가능성이 있다. 그리고 한 시점에서 첫째 자녀(first-born child)인 학생에 대한 교육투자는 둘째 이상인 학생(later-born child)에 대한 교육투자보다 일반적으로 크게 나타나기 때문에, ‘Cov (Fi, εi) > 0’가 성립할 가능성이 높다. 도구변수가 위의 두 가지 조건을 만족하는 경우 통계학의 2단계 최소자승 추정법(two-stage least squares methods: 2SLS)을 이용하면 β2에 대한 일치추정량이 구해진다.

다음 장에서 확인되는 바와 같이, ‘Cov (Fi, εi) > 0’의 조건은 대체로 성립한다. 그리고 가구 내에서 자녀 간 교육투자의 배분을 다룬 교육학, 사회학 및 경제학의 다양한 실증연구에서도 대체로 ‘Cov (Fi, εi) > 0’의 관계가 관측된다. ‘Cov (Fi, εi) > 0’이 조건이 성립하는 경우, β1에 대한 바람직한 추정치를 얻기 위해 필요한 다른 조건은 ‘Cov (Fi, εi) = 0’이다. 위의 조건은 관측되지 않는 오차항 εi을 동반하기 때문에 자료를 이용해서 직접적으로 이 조건을 검정하는 것은 불가능하다. 단지 이론적으로만 이 가정을 정당화할 수 있을 뿐이다.

출생순위와 지능 또는 교육성과를 다룬 교육학, 사회학 및 경제학의 많은 연구들이 양자 간에는 통계적으로 유의한 관계가 존재하지 않음을 보고하고 있다(Retherford and Sewell[1991]; Rodgers et al.[2000]). 이러한 연구 결과를 토대로 우리는 ‘Cov (Fi, εi) = 0’이 성립한다고 가정할 수 있다. 그러나 본 논문에서는 ‘Cov (Fi, εi) = 0’라는 강한 가정 대신에 ‘Cov (Fi, εi) ≥ 0’라는 다소 약화된 가정을 채택한다. 그 이유는 다음과 같다.

첫째, 출생순위와 지능 또는 교육성과 간에 유의한 상관관계가 존재하지 않는다는 연구 결과들과는 대조적으로 양자 간에 유의한 관계가 존재한다는 연구 결과들이 존재한다. 후자의 연구들은 대체로 첫째 자녀의 지능이나 교육성과가 둘째 이상의 자녀보다 평균적으로 높다고 보고하고 있다(Bjerkedal et al.[2007]; Black et al.[2007]; Zajonc[1976]; Zajonc and Mullahy[1997]). 결국 출생순위와 지능에 관한 연구성과들은 대체로 ‘Cov (Fi, εi) ≥ 0’의 관계가 성립하는 것으로 요약된다. 즉, 첫째 자녀의 지능이나 교육성과는 둘째 이상의 자녀보다 평균적으로 높거나 혹은 유의하게 다르지 않다는 것이 일반적인 견해이다. 반면에, 첫째 자녀의 지능이나 교육성과가 둘째 이상의 자녀보다 평균적으로 낮다고 보고하는, 즉 ‘Cov (Fi, εi) < 0’를 지지하는 실증연구는 찾아보기가 대단히 어렵다.

둘째, 가족 내 교육자원의 배분을 다룬 실증연구들은 대체로 부모들이 둘째 이상의 자녀보다는 첫째 자녀에게 교육자원을 더 많이 투자한다고 보고한다(Behrman and Taubman[1986]; Black et al.[2005]). 본 논문의 분석에서도 첫째 자녀인 학생에 대한 평균 사교육비 지출액은 둘째 이상의 자녀인 학생에 대한 사교육비 지출액보다 크게 나타난다. 이와 같이 금전적인 측면에서 부모들이 둘째 이상의 자녀에 비하여 첫째 자녀에게 보다 많은 투자를 한다면, 교육적인 관심이나 정서적 측면과 같은 비금전적인 측면에서도 부모들은 첫째 자녀에게 상대적으로 더 많은 투자를 한다고 예상할 수 있다. 그리고 부모들의 이러한 선호는 결과적으로 ‘Cov (Fi, εi) > 0’의 관계가 성립할 가능성을 보여준다.

이상에서 설명한 바와 같이, 도구변수 Fi에 대하여 ‘Cov (Fi, εi) > 0’과 ‘Cov (Fi, εi) ≥ 0’의 조건이 성립한다면 2SLS 추정치 jep-34-2-139-e001.jpgβ1에 대한 일치추정량이거나 또는 과대추정치로서 해석된다. 하지만 jep-34-2-139-e001.jpgβ1의 과소추정량이 될 가능성은 희박하다. 그리하여 만약 jep-34-2-139-e001.jpg가 0과 유의하게 다르지 않다는 검정 결과가 나타날 때, 우리는 사교육비 지출의 성적 향상효과가 그리 크지 않다고 결론 내릴 수 있다. 그리고 만약 jep-34-2-139-e001.jpg이 0과 유의하게 다른 양수라는 검정 결과가 나오면 우리는 사교육비의 진정한 효과는 2SLS의 추정치보다도 작을 것이라고 추측한다.

2. 비모수 구간추정법

본 논문의 두 번째 통계방법(방법 Ⅱ)은 비모수 구간추정법(nonparametric bounding method)이다. OLS나 도구변수법에서는 평균 처치효과(Average Treatment Effect: ATE)의 점추정치(point estimates)를 계산한 후 그것의 표준오차를 구하여 신뢰구간을 설정하고 특정 가설에 대하여 검정한다. 비모수 구간추정법에서는 평균 처치효과의 점추정치가 아니라 그것이 위치할 가능성이 있는 구간 범위(bounds)의 최솟값과 최댓값을 몇 가지 가정을 이용하여 추정한다. 그리고 이 구간에 대하여 신뢰구간을 설정하고 이로부터 특정 가설을 검정한다. 비모수적 구간추정법을 실제 자료에 대한 분석에 활용한 사례로는 Gonzalez(2005), Manski and Pepper(2000), 강창희⋅이삼호(2010) 등이 있다. 아래에서 기술되는 비모수 구간추정법은 위 논문들에 설명된 것을 참고하여 본 논문의 목적에 맞게 수정하였다.

먼저 처치수준과 성과수준을 연결시키는 반응함수를 다음과 같이 정의하자. yi(·) : TY. 실현된 성과(realized outcome) y = y(z)는 z라는 처치수준을 실제로 받은 학생의 성과수준을 나타낸다. 그리고 잠재성과(potential outcome) y(t) (tz)는 동일한 학생이 t라는 가상적인 처치수준을 받았더라면 나타날 잠재적인 성과수준을 표시한다.

본 구간추정법에서는 이산적인 처치수준(discrete treatment levels)에 대한 인과효과를 추정하기 때문에 연속변수인 사교육비 지출(Si)을 다음과 같이 세 가지 수준의 이산변수 Ti로 변형한다.

  • Ti = 0 if Si = 0

  • Ti = 1 if 0 < SiH1

  • Ti = 2 if H1 < Si

아래의 실증분석에서 우리는 H1을 국어 사교육비를 다루는 분석에서는 3만원, 수학과 영어의 사교육비를 다루는 분석에서는 9만원, 그리고 세 과목 전체의 사교육비를 다루는 분석에서는 20만원으로 설정한다.2 이 경우 개별 학생에게는 0, 1, 2 중 하나의 처치수준(treatment level)이 적용된다.

평균 처치효과의 구간을 설정하기 위하여 먼저 E[y(t)] (t = 0, 1, 2)를 다음과 같이 분해한다.

식 (3)의 E(y|z = t), Pr(z = t) 및 Pr(zt)는 자료로부터 직접 계산이 가능하지만, 가상적 대응치(counterfactual)인 E[y(t)|zt]는 자료로부터 계산이 불가능하다. 여기에서 y가 최소 K0 , 최대 K1의 값을 취한다고 가정하자(즉. ‘y ∈ [K0, K1]’). 이 가정하에서 ‘E[y(t)|zt] ∈ [K0, K1]’이 성립하기 때문에 우리는E[y(t)]의 구간을 다음과 같이 구할 수 있다.

  • E(y|z = t), Pr(z = t) + K0 · Pr(zt)

  • E[y(t)] ≤

  • E(y|z = t), Pr(z = t) + K1 · Pr(zt)

이 구간을 우리는 E[y(t)]의 최소가정 범위(Worst Case bounds: WC)라고 부른다.

E[y(t)]의 범위를 보다 좁히기 위하여 우리는 몇 가지의 가정들을 도입하고 이를 개별적으로 혹은 결합하여 활용한다. 첫 번째 가정은 ‘단조적 반응(monotone treatment response: MTR)의 가정’으로서, 수식으로는 다음과 같이 표현된다.

t1 < tmy(tl) ≤ y(tm)

즉, 처치수준이 높으면 성과는 불변이거나 또는 증가한다는 가정이다. 이 가정은 학생에 대하여 교육자원의 지출을 늘리면 그 학생의 학업성취도가 변하지 않거나 또는 향상되고, 최소한 줄어들지는 않을 것이라는 이론적 예측으로부터 도출된다. 교육투자의 성과를 다룬 대다수의 실증연구들로부터 이 가정의 유효성이 확인된다. 교육비 지출이 학생의 학업성과에 미치는 긍정적인 영향의 정확한 크기에 대해서 많은 논쟁이 있지만 (Hanushek[1997, 2003]), 그럼에도 불구하고 교육비 지출이 학생의 학업성취도에 강한 부정적인 영향을 미친다는 실증연구는 대단히 드물기 때문이다.

구간추정법을 적용하기 위해 도입되는 두 번째 가정은 ‘단조적 선택(monotone treatment selection: MTS)의 가정’으로서 수식으로는 다음과 같이 표현된다.

tl < tmE[y(t)|z = tl] ≤ E[y(t)|z = tm]

즉, 임의의 처치수준 t에 대한 평균 잠재성과 E[y(t)]는 사교육비를 적게 지출하는 부모를 둔 학생(z = tl)에서보다도 사교육비를 많이 지출하는 부모를 둔 학생(z = tm)에서 높게 나타난다는 가정이다. 예를 들어 소득이 높은 부모들은 소득이 낮은 부모들에 비하여 자녀에게 평균적으로 높은 사교육비를 지출할 것으로 예상할 수 있다. 이때 Haveman and Wolf(1995)의 연구 결과에서와 같이, 유전적인 요인 또는 가정환경의 영향으로 소득이 높은 부모를 둔 학생들이 소득이 낮은 부모를 둔 학생들보다 평균적으로 지적인 능력이나 학업성취도가 높다면 위의 MTS 가정이 타당성을 가진다고 할 수 있다. 이 가정은 식 (1)을 OLS를 통해 추정할 때 문제가 되는 ‘Cov (si, εi) = 0’의 가정(즉, 외생성의 가정)을 ‘Cov (si, εi) ≥ 0’로 완화시키는 것으로 해석된다.

위에서 제시된 MTR과 MTS 가정을 결합하면 사교육비 평균효과의 범위가 상당히 축소된다. 두 가정을 결합함으로써 설정되는 E[y(t)]의 범위(MTR+MTS 범위)는 다음과 같이 주어진다.

아래 실증분석의 결과를 설명하는 과정에서 확인되는 바와 같이, MTR+MTS 범위는 개별적인 MTR 범위 및 MTS 범위에 비하여 상당히 좁은 범위로 줄어든다. 그런데 여기에서 E[y(t)|v = u1)] = E[y(t)|v = u2)] (u1u2)’로 표현되는 ‘평균 독립성(mean independence) 가정’을 만족하는 도구변수 v가 주어진다면 MTR+MTS 범위를 추가적으로 좁히는 것이 가능하다.

‘평균 독립성 가정’하에서는 도구변수의 값이 ‘v = u1’인 학생의 기대 학업성취도가 ‘v = u2’인 학생의 것과 동일하다. 그러나 현실적으로 이러한 특성을 만족하는 외생적인 도구변수를 찾아내는 것은 상당히 어렵다고 알려져 있다. 이 어려움을 극복하는 방법으로 ‘Manski and Pepper(2000)E[y(t)|v = u1)] ≤ E[y(t)|v = u2)] (u1 < u2)’ 로 표현되는 ‘평균 단조성(mean monotonicity) 가정’을 만족하는 단조적인 도구변수(monotone IV: MIV) v를 활용하는 방법을 제안하였다. ‘평균 단조성 가정’하에서는 도구변수의 값이 ‘v = u1’인 학생의 기대 학업성취도가 ‘v = u2’인 학생의 것과 같거나 또는 작은 특성을 만족하는 것으로 충분하다. 본 논문에서는 ‘평균 단조성 가정’을 만족하는 단조적 도구변수로서 방법 I에서 활용된 바 있는 첫째 자녀 여부의 더미변수 Fi를 사용한다. ‘Cov (Fi, εit) ≥ 0’와 밀접하게 연관되는 가정으로서, ‘평균 단조성 가정’은 임의의 사교육비 수준(t)이 주어질 때 첫째 자녀인 학생(Fi = 1)의 평균성적은 둘째 자녀 이상인 학생(Fi = 0)의 평균성적과 동일하거나 높음을 의미한다.

MIV와 MTR+MTS 가정을 결합함으로써 우리는 E[y(t)]의 MIV+MTR+MTS 범위를 다음과 같이 구할 수 있다.

여기에서 기댓값 E(y| · )는 자료로부터 계산된 표본 평균값을 사용한다. 비모수적 구간 추정법에서는 개별 가정들과 모든 조합의 결합 가정들에 대하여 E[y(t)]의 범위를 구할 수 있다. 그러나 공간 제약상 본 논문의 분석 결과는 MTR+MTS 결합 가정과 MIV+MTR+MTS 결합 가정을 사용한 경우에 대해서만 제시한다.

위에서 도입된 가정들을 이용하여 E[y(t)]의 범위를 구한 후, E[y(tm) − y(tl)] (tm > tl) 로 정의되는 ATE 범위는 E[y(tm)]의 최솟값과 최댓값 및 E[y(tl)]의 최솟값과 최댓값을 이용하여 계산한다. 즉, E[y(tm) − y(tl)]의 최솟값은 E[y(tm)]의 최솟값에서 E[y(tl)]의 최댓값을 차감함으로써, 그리고 E[y(tm) − y(tl)] 의 최댓값은 E[y(tm)]의 최댓값에서 E[y(tl)]의 최솟값을 차감함으로써 구해진다. 그리고 50개의 bootstrap 샘플을 형성하여 E[y(tm) − y(tl)] 의 최댓값에 대한 상위 5분위값과 E[y(tm) − y(tl)] 의 최솟값에 대한 하위 5분위값을 구하여 E[y(tm) − y(tl)] 의 범위에 대한 90% 신뢰구간을 설정하고 이를 가설검정에 이용한다.

Ⅲ. 분석자료: 학교교육 수준 및 실태 분석 연구

사교육비 지출의 효과를 분석하기 위하여 본고에서는 한국교육개발원이 2004년 중학교 3학년 재학생들을 대상으로 구축한 ‘학교교육 수준 및 실태 분석 연구: 중학교’의 원자료(이하 중학교 실태 연구자료)를 사용한다. ‘중학교 실태 연구자료’는 2004년 현재 우리나라 중학교 3학년에 재학 중인 14,372명의 학생들에 대하여 개인, 가정 및 학교의 배경을 조사한 횡단면 자료이다.3 본 표본자료는 전국 2,938개 중학교에 재학하는 총 1,933,543명의 중학생들을 대표할 수 있도록 지역별, 지역규모별, 학교 설립 유형별로 모집단에 비례하도록 무선 표집되었다. 좀 더 구체적으로는, 1단계로 학교 및 학생의 모집단 분포를 고려하여 전국적으로 200개의 표본 중학교가 선정된다. 각 학교에서 무작위로 2개의 학급이 선정되고 그 학급에 재학하는 학생들 모두가 표본으로 추출된다. 이와 같이 선정된 학생들을 대상으로 개인 배경, 가족 배경 및 학교 배경을 조사한다. 학생의 학교생활 및 가정생활에 대한 보다 자세한 사항을 알기 위하여 학생이 재학하는 학교의 학교장, 교무부장, 교사 전체 그리고 부모 설문지가 따로 만들어져 조사된다.

학생에 대한 배경 질문과 더불어 ‘중학교 실태 분석 연구’에서는 서울시 교육청의 중학생 학력평가 문제지를 활용하여 개별 학생의 국어, 영어, 수학 성적을 0~100점 척도로 측정한다(학업성취도 평가일은 2004년 9월 14일). 이하의 분석에서는 결과 해석의 보편성을 위하여 각 과목의 원점수를 평균과 분산이 각각 0과 1이 되도록 정규화하여 사용한다. 그리고 각 과목의 점수와 더불어 세 과목의 평균점수(또는 두 과목의 점수만 있는 경우에는 두 과목의 평균점수)를 계산하고, 이 평균점수 또한 평균과 분산이 각각 0과 1이 되도록 정규화한다.

아래의 분석에 사용되는 중요 변수인 학생의 사교육 경험 및 사교육비 지출액과 학생의 출생순위 정보는 ‘중학교 실태 분석 연구’의 학부모 설문지로부터 구성된다. 이 설문지에서는 2004년 7월 현재 국어, 영어, 수학 각 개별 과목에 대하여 지출한 월평균 사교육비 액수가 사교육 유형별(예를 들어 학원, 개인과외, 학습지 등)로 조사된다. 이하의 분석에서 우리는 사교육비 지출액을 사교육 유형별로 구분하지 않고 모두 합하여 각 과목에 대한 월평균 사교육비 총지출액을 계산하여 사용한다. 그리고 세 과목의 평균점수를 종속변수로 이용하는 분석에서는 세 과목 전체에 대한 월평균 총사교육비를 계산하여 이용한다

위에서 제시된 통계방법을 적용하기 위하여, 우리는 14,372명의 학생들에 대한 원자료를 다음의 과정을 통하여 축약하였다. 첫째, 학부모 설문에 대한 답변이 없는 2,564명의 학생들을 제외하였다. 둘째, 학부모 설문지(질문 3번)를 이용하여, 학생 가정에 아버지(또는 남성보호자)와 어머니가 동시에 부재한 총 456명의 학생을 분석에서 추가적으로 제외하였다. 왜냐하면 이러한 환경에 처한 학생의 가정환경은 정상적이라고 생각할 수 없기 때문이다. 그러나 아버지나 어머니 중 적어도 한 분과 함께 살고 있는 학생은 분석에 포함되었다. 셋째, 본고의 통계 분석에서는 외생적인 출생순위를 나타내는 변수로서 첫째아의 여부가 사교육비 지출액의 도구변수로 활용된다. 그런데 외자녀인 학생의 경우 정의상 첫째아 여부가 가정의 자녀 수가 1인 경우와 명확히 구분되지 않는다. 즉, 이들의 경우 첫째아 여부가 외생적인 출생순위와 동시에 자녀 수가 1인 경우를 동시에 표현한다. 일반적으로 자녀 수는 내생성이 있기 때문에, 첫째아 여부의 외생성을 명확하게 활용하기 위해서는 외자녀인 학생들을 분석에서 제외시킬 필요가 있다. 그리하여 총 812명의 외자녀 학생들이 분석에서 추가적으로 제외되었다. 넷째, 우리나라에서 국어, 영어 및 수학 등의 과목에 지출된 사교육비의 효과를 분석할 때 예체능 사교육을 받는 학생들을 분석에 포함시킬지의 여부가 논쟁거리이다. 예체능의 사교육을 받는 학생들은 일반적으로 고소득 가정 배경을 가진 학생들로서 다른 과목에 대한 사교육비 지출 또한 높다. 그러나 학업의 최종 목표가 예체능 계열로의 대학 진학일 가능성이 높아서 국어, 영어, 수학 등의 주요 과목 성적은 낮을 수 있다. 이러한 경향을 통계 분석에서 명시적으로 고려하지 않으면, 사교육비의 효과는 실제보다 과소추정될(understated) 가능성이 높다. 본고에서는 이러한 문제를 고려하여 예체능의 사교육을 받은 학생 모두를 분석에서 제외하였다. 총 1,354명의 학생들이 추가적으로 분석에서 제외되었다. 위의 네 가지 기준을 통하여 분석표본을 축소하고, 식 (1)의 변수에 대한 결측치를 제외시키면, 최종적으로 총 5,122명의 학생들에 대한 관측치가 남고 이 샘플이 아래의 통계 분석에서 사용된다. 사교육비의 정확한 액수에 대한 응답률이 낮기 때문에 마지막 단계에서 결측치가 많이 발생하였다.

<Table 1>에는 이 최종 분석표본에 대한 각 변수들의 기술통계량이 제시되어 있다. (1)열에는 기술통계량 계산에 사용된 관측치의 수가, 그리고 (2)열에는 최종 분석표본에 나타난 각 변수들의 평균 및 표준편차가 보고되어 있다. 전체 분석표본에 포함된 학생들을 출생순위에 따라 나누어, (3)열에는 첫째아인 학생들에 대한 기술통계량, 그리고 (4)열에는 둘째아 이상인 학생들에 대한 기술통계량을 계산하였다. 마지막으로 (5)열에는 위의 두 하위표본 간 개별 변수의 평균 차이를 계산하고 그 차이가 통계적으로 유의한지를 검정하는 T-검정통계량과 표준오차를 제시하였다. 최종 분석표본에 나타난 국어, 영어, 수학 과목 원점수의 평균(표준편차)은 각각 63.2(17.6), 65.1(24.0), 62.5(24.0)이다. 세 과목의 평균 원점수에 대한 평균과 표준편차는 각각 63.6과 19.7이다.

<Table 1>

Descriptive Statistics of the Analysis Sample

jep-34-2-139-t001.tif

Note: * p<0.05; ** p<0.01.

먼저 학생의 출생순위에 따라 과목의 성적을 비교하면, 국어, 영어, 수학 과목 모두에서 첫째아의 평균성적이 둘째아 이상의 성적보다 통계적으로 유의하게 높다. 첫째아의 국어, 영어 및 수학 성적의 평균값이 각각 65.2, 68.6, 65.1인 반면에, 둘째아 이상의 각 과목에 대한 평균값은 각각 61.4, 62.1, 60.2이다. 세 과목의 평균성적 또한 첫째아의 평균성적(66.3)이 둘째아 이상의 평균성적(61.2)보다 유의하게 높다.

학생에 대한 사교육비 지출액을 살펴보면, 첫째아인 학생에 대한 월평균 사교육비 지출액이 둘째아 이상인 학생에 대한 사교육비 지출액보다 크다. 세 과목 전체의 월평균 사교육비는 평균 154,100원 정도이다. 그런데 첫째아에 대한 사교육비 평균은 178,300원으로서 둘째아 이상에 대한 사교육비 평균 133,000원을 약 34% 정도 상회한다. 각 과목별로 사교육비 지출액을 살펴보면, 국어보다는 영어와 수학에 대한 사교육비 지출이 높음을 알 수 있다. 국어에 대한 월평균 사교육비가 약 31,970원인 데 비하여, 영어 사교육비는 약 69,820원, 수학 사교육비는 약 65,430원으로서 국어 사교육비에 비하여 2배 이상 크다. 각 과목에 대해서든 세 과목 전체에 대해서든, 부모의 사교육비 지출은 둘째아 이상인 학생보다는 첫째아인 학생에게서 높게 나타난다.4

학업성적과 사교육비 이외의 변수들을 살펴보면, 첫째아인 학생들의 직전 학기 성적이 둘째아 이상의 학생들에 비하여 통계적으로 유의하게 높다. 1점(최하위)에서 9점(최상위) 사이에서 본인이 제시한 직전 학기 성적에 의하면, 첫째아 학생의 평균은 5.634이고 둘째아 이상 학생의 평균은 5.279이다. 아울러 첫째아 학생들은 둘째아 학생들에 비하여 사교육시간을 제외한 주간 평균 자기학습시간도 국어, 영어, 수학 과목 모두에서 길게 나타난다.

위에서 설명된 변수들 이외의 다른 변수들을 살펴보더라도, 첫째아 학생들에게서는 둘째아 이상의 학생들에 비하여 높은 학업성적으로 연결되는 좋은 특성들이 발견된다. 예를 들어 첫째아 학생은 형제 수가 적어서 교육자원에 대한 경쟁이 덜하고, 첫째아 학생 부모들의 평균 교육수준도 둘째아 이상의 부모들에 비하여 높다. 첫째아 학생들과 둘째아 이상 학생들 간의 평균적인 특성의 차이에서 확인되는 바와 같이, ‘Cov (Fi, εit) = 0’은 적절한 가정이라고 생각하기 어렵다. 그러나 <Table 1>의 결과는 ‘Cov (Fi, εit) ≥ 0’의 가정과 크게 모순되지는 않는 것으로 생각된다. ‘Cov (Fi, εit) ≥ 0’이 내포하는 ‘평균 단조성(mean monotonicity) 가정’이 성립한다면, 우리는 도구변수법과 더불어 구간추정법을 통하여 사교육비의 효과에 관한 유용한 정보를 도출할 수 있을 것이다.

Ⅳ. 실증분석 결과

본 장에서는 앞에서 설명된 통계 분석방법들을 ‘중학교 실태 분석 연구’ 자료에 적용하여 추정한 사교육비의 성적 향상효과가 제시된다. 먼저 사교육비 지출의 내생성이 통제되지 않는 OLS의 추정 결과를 살펴보고, 내생성을 명시적으로 통제하는 도구변수법과 구간추정법의 추정 결과를 설명한다.

1. OLS 및 도구변수법의 추정 결과

<Table 2>에는 세 과목 평균의 Z-점수를 종속변수로 이용하는 식 (1)에 대한 OLS 및 도구변수법의 추정 결과가 보고되어 있다. <Table 3>의 패널 A, B 및 C에는 각각 국어, 영어, 수학 개별 과목의 Z-점수를 종속변수로 사용하는 경우의 추정 결과가 제시되어 있다. <Table 2>와 <Table 3>에 제시된 사교육비 로그값의 추정계수는 jep-34-2-139-e004.jpg로서 Δsi가 1단위 증가할 때, 즉 사교육비가 100% 증가할 때 종속변수 Z-점수의 기댓값이 변화하는 양을 표현한다. 해석의 편의를 위하여 우리는 이 값을 사교육비가 10% 증가할 때 변화하는 원점수 기댓값의 퍼센트 변화량인 ‘탄력성 계수’로 변환하여 사교육비 로그값 추정계수의 아래에 보고하였다. 탄력성 계수는 분석자료에서 주어진 해당 원점수의 평균값에서 계산되었다.

<Table 2>의 (1)열에 제시된 바와 같이, OLS의 추정 결과에 의하면, 사교육비 지출과 성적 간의 연관관계는 통계적으로 0을 기각하지만 그리 크게 나타나지는 않는다. 즉, 10% 높은 사교육비 지출은 평균 0.008SD(표준편차) 정도 높은 점수로 연결된다. 이를 탄력성 계수로 변환하면, 10% 높은 사교육비 지출은 평균점수를 얻는 학생의 점수를 약 0.259% 정도 높이는 효과가 있다. 앞에서 강조된 바와 같이, OLS 방법은 si의 내생성을 적절히 고려하지 못하기 때문에, 추정 결과가 사교육비의 진정한 효과라고 확신하기 어렵다. Cov(si, εi)의 방향에 따라 추정된 결과가 사교육비 지출의 진정한 효과를 과대추정할 수도 또는 과소추정할 수도 있다.

<Table 2>의 (2)열에 제시된 도구변수법의 추정 결과는 OLS 결과에 비하여 강한 사교육비의 성적 향상효과를 보여준다. 즉, 10% 높은 사교육비 지출은 평균적인 학생의 세 과목 평균점수를 약 0.744% 정도 향상시키는 효과가 있다. 그리고 이 크기는 0과는 통계적으로 유의하게 다른 수준이다.

도구변수법의 추정 결과가 일치추정량을 보여주는 두 가지 조건은 ‘Cov(Fi, εi) ≠ 0’과 ‘Cov(Fi, εi) = 0’이다. <Table 2>의 (3)열에는 si가 종속변수이고, FiXi가 설명변수인 식에 대한 1단계(first-stage) 추정 결과가 보고되어 있다. 앞 절에서 예상된 바와 같이, 첫째아 학생에 대한 사교육비 지출액은 둘째아 이상의 학생에 비하여 약 34.5% 정도 높다. 이는 0보다 통계적으로 유의하게 높은 것이며, F-검정통계량은 59.95로서 Fisi의 적절한 도구변수일 첫 번째 조건을 만족한다.

<Table 2>
OLS and IV Estimates of the Effect of Tutoring Expenditures on Performance: The Average of Three Subjects Scores
jep-34-2-139-t002.tif

Note : * p<.05; ** p<0.01. Standard errors are in parentheses.

그러나 앞 절에서 논의된 바에 따르면, Fiεi 사이에서는 ‘Cov(Fi, εi) = 0’보다는 ‘Cov(Fi, εi) > 0’ 의 관계가 성립할 가능성이 높다. 즉, 위에 제시된 사교육비의 효과에 대한 도구변수법의 추정 결과는 진정한 효과의 과대추정치일 가능성이 높다. 결국 10% 높은 사교육비 지출은 평균적인 학생의 점수를 0.744%보다는 작은 정도로 향상시키는 효과가 있다고 할 수 있다. 그러나 효과의 최소치가 어느 정도일지에 대해서 도구변수법의 결과를 통해서는 정확히 알 수 없다.5

사교육비가 세 과목의 평균성적에 미치는 효과가 그리 크지 않다는 사실은 사교육과 학업성적의 대상 과목을 국어, 영어, 수학으로 세분하는 경우에도 크게 다르지 않다. <Table 3>의 패널 A, B 및 C에는 각각 국어, 영어, 수학 개별 과목의 Z-점수를 종속변수로 사용하고 각 과목별 사교육비 지출액을 si로 설정한 모형의 추정 결과가 제시되어 있다.

<Table 3>
OLS and IV Estimates of the Effect of Tutoring Expenditures on Individual Subject Scores
jep-34-2-139-t003.tif
jep-34-2-139-t004.tif

Note : * p<0.05; ** p<0.01. Standard errors are in parentheses. School characteristics are controlled for.

먼저 OLS의 추정 결과에 의하면, 10% 높은 과목별 사교육비 지출은 평균적인 학생의 국어, 영어, 수학의 시험성적을 각각 0.08%, 0.33%, 0.40% 정도 향상시키는 효과가 있다. 그러나 si의 내생성으로 인하여 위의 결과들이 사교육비의 진정한 인과효과를 제시한다고 판단하기 어렵다. si의 내생성을 어느 정도 고려하는 도구변수법의 추정 결과에 의하면, 10% 높은 과목별 사교육비 지출은 평균적인 학생의 국어, 영어, 수학의 시험성적을 각각 1.24%, 1.28%, 0.75% 정도 향상시키는 효과가 있다. 이 정도 크기의 효과는 세 과목의 평균성적과 세 과목 전체의 사교육비 지출을 이용하는 모형에 비하여 약간 크다고 할 수 있다. 특히 국어와 영어에 대한 사교육비 지출의 효과는 세 과목 평균의 경우에 비하여 약 1.6배 정도 크게 나타난다. 그러나 도구변수법의 결과가 사교육비의 진정한 효과에 대한 과대추정치일 가능성이 있음을 감안하면 그 효과의 크기를 해석하는 데 주의할 필요가 있다. 참고로 변수 Fi는 세 과목 모두에 대하여 ‘Cov(Fi, εi) ≠ 0’의 조건을 만족하는 si의 강한 도구변수(strong IV)이다. F-검정통계량은 국어의 경우에는 16.8, 영어의 경우에는 54.3, 수학의 경우에는 43.3으로서, 세 과목 모두에서 통상적인 기준치 10을 넘어서고 있기 때문이다.

도구변수법의 추정 결과를 요약하면, 국어, 영어, 수학 개별 과목에 대해서든 혹은 세 과목의 평균에 대해서든 공통적으로, 사교육비 지출은 평균적인 학생의 성적을 약간 향상시키는 양의 효과가 존재하기는 하지만 그 효과의 정도는 그리 크지 않은 것으로 판단된다.

2. 비모수 구간추정법의 추정 결과

<Table 4>에는 사교육비의 평균효과(Average Treatment Effect: ATE)에 대한 구간 추정법의 추정 결과가 세 과목 평균점수 및 개별 과목별로 제시되어 있다. 각 패널별로 ATE에 대한 MTR+MTS 범위와 MIV+MTR+MTS 범위가 제시되어 있다. 이 추정치들에 대한 편리한 해석을 위하여 (5)열과 (6)열에는 각각 ATE 범위의 최댓값과 최댓값의 bootstrap 95분위값을 10%의 사교육비 지출 증가에 따른 성적 변화율로 변환한 탄력성 계수가 제시되어 있다.

앞에서 제시된 추정 결과들과 마찬가지로, <Table 4>의 패널 A에 나타난 세 과목 전체에 대한 구간추정법의 결과는 높은 사교육비 지출로 인하여 학생의 성적이 크게 향상되지는 않음을 암시한다. MTR+MTS 범위의 최댓값에 의하면, 10% 높은 사교육비 지출은 학생의 평균성적을 최대 1.86~2.36% 정도까지 향상시킨다. 그러나 MTR+MTS 범위의 최솟값은 사교육비 지출의 효과가 0일 가능성을 배제하지 못한다. 이는 사교육비 지출의 진정한 성적 향상효과가 그리 크지 않을 것임을 암시한다.

<Table 4>
Upper and Lower Bounds of the Effect of Private Tutoring Expenditures E[y(1) − y(0)]
jep-34-2-139-t005.tif

MTR+MTS의 결합 가정이 타당한지를 검증하기 위하여 Manski and Pepper(2000, p.1004)는 uu′(u′ ≤ u)에 대하여 E (y|z = u′) ≤ E (y|z = u)이 성립하는지의 여부를 조사하는 방법을 제안하였다. 왜냐하면 MTR+MTS라는 결합 가정하에서는 다음이 성립하기 때문이다.

  • u′ ≤ uE [y | z = u′] =

  • E[y(u′)| z = u′] ≤ MTR

  • E[y(u)| z = u′] ≤ MTS

  • = E[y(u)| z = u] = E[y(u)| z = u]

<Table 5>에는 표본평균 jep-34-2-139-e006.jpg, jep-34-2-139-e008.jpg, jep-34-2-139-e009.jpg이 각 과목별로 보고되어 있다. 표의 결과에 따르면, 세 과목의 평균점수를 사용하든 개별 과목의 점수를 사용하든 공통적으로 ‘jep-34-2-139-e010.jpg’의 관계가 대체로 성립한다. 다만, 국어 과목에서는 jep-34-2-139-e011.jpg, jep-34-2-139-e012.jpg로서 ‘jep-34-2-139-e013.jpg’의 관계가 통계적으로 유의 하게 성립하지는 않는다. 그러나 ‘jep-34-2-139-e014.jpg’의 관계가 성립한다고 단정할 수도 없으므로, 본 자료에서 MTR와 MTS의 결합 가정에 문제가 있다는 명시적인 증거는 발견되지 않는다.

<Table 5>
Average Test Scores by Treatment Levels, Ê[y(t)]
jep-34-2-139-t006.tif

<Table 4>에 제시된 세 과목 전체의 평균점수에 대한 MIV+MTR+MTS 범위의 추정 결과도 높은 사교육비 지출로 인하여 학생의 성적이 크게 향상되지는 않는다는 점을 보여준다. MIV+MTR+MTS 범위의 최댓값에 의하면, 10% 높은 사교육비 지출은 학생의 세 과목 평균성적을 최대 1.82~2.29% 정도까지 향상시킨다. 그러나 MIV+MTR+MTS 범위의 최솟값은 사교육비 지출의 효과가 0이라는 가설을 기각하지는 못한다. MIV+MTR+MTS 범위 또한 사교육비 지출의 진정한 성적 향상효과가 그리 크지 않음을 암시한다.

사교육비 지출의 그리 크지 않은 성적 향상효과는 사교육비와 성과변수를 개별 과목으로 한정하는 경우에도 비슷하게 나타난다. 국어 과목의 경우, MIV+MTR+MTS 범위의 탄력성 계수 최댓값은 약 0.77~0.84% 정도로서 사교육비 지출의 효과가 그리 크지 않음을 보여준다. 하지만 영어와 수학 과목에 대한 MIV+MTR+MTS 범위의 탄력성 계수 최댓값은 사교육비 지출이 그리 작지 않은 효과가 있을 가능성을 제기한다. 영어의 경우, 10% 높은 사교육비 지출이 영어의 평균성적을 최대 2.16~2.64% 정도까지 향상시킨다. 수학의 경우에는 최대 2.04~2.84% 정도까지 향상시킨다. 그러나 두 과목에서 공통적으로 MIV+MTR+ MTS 범위의 최솟값은 0과 다르지 않다. 결국 구간추정법의 결과를 보수적으로 해석하면, 국어, 영어, 수학 과목에서 모두 높은 사교육비 지출이 유의미한 정도의 성적 향상으로 연결된다는 확실한 증거를 발견하기는 어렵다.

사교육비 지출의 내생성을 명시적으로 고려하는 도구변수법 및 구간추정법의 추정 결과는 사교육비 지출이 학생의 학업성적에 다소 영향을 미치기는 하지만 그 영향이 그리 크지는 않은 것으로 요약된다. 도구변수법의 결과를 사교육비 지출의 평균효과에 대한 점추정치(point estimates)로 해석하면, 10% 높은 사교육비 지출은 국어성적을 약 1.24%, 영어성적을 약 1.28%, 수학성적을 약 0.75%, 그리고 세 과목 전체의 평균성적을 약 0.74% 정도 향상시킨다고 요약할 수 있다. 사용된 도구변수의 특성으로 인하여 이상의 추정치들은 실제 효과에 대한 과대추정치로 해석된다. 아울러 위의 점추정치들이 위치한 구간은 대체로 구간추정법을 통하여 추정된 ATE의 범위들 내에 위치함으로써 상 이한 추정방법들은 사교육비의 평균효과에 대하여 대체로 일관된 결과를 보여준다. 이는 본 논문에서 추정한 사교육비의 평균효과의 크기가 상당히 신뢰할 만한 수치임을 암시한다.

사교육비 지출이 성적을 향상시키는 강력한 효과가 있을 것이라는 일부의 기대와는 다르게 본 논문의 추정 결과는 그 효과가 그리 크지 않음을 보여준다. 본 논문에 제시된 사교육비 효과의 추정치를 정확히 해석하기 위해서는 먼저 실제 지출된 사교육비의 분포를 자세히 살펴볼 필요가 있다. <Table 1>에 따르면, 분석자료에서 나타난 국어의 월평균 사교육비는 약 31,970원, 영어 사교육비는 약 69,820원, 수학 사교육비는 약 65,430원, 그리고 세 과목 전체에 대한 사교육비는 약 154,100원 정도이다. 그리고 각 과목에 대한 사교육비 분포의 95 퍼센타일을 구해 보면, 국어의 경우에는 약 132,200원, 영어의 경우에는 약 283,300원, 수학의 경우에는 약 283,300원, 그리고 세 과목 전체에 대한 사교육비는 약 566,600원 정도이다. 즉, 전체 학생의 약 95%는 세 과목 전체 사교육비 기준으로 월평균 566,600원보다 작은 금액을 국어, 영어, 수학 과목 전체의 사교육에 지출한다. 본 논문에서 구한 사교육비의 효과는 주로 월평균 사교육비로 이 정도의 금액을 지출하는 학생들에 대한 평균효과로 해석된다.

일반적으로 자료들이 풍부하게 관측되는 사교육비의 평균값 근처에서 계산된 탄력성 계수는 그 정확도가 상당히 높다. 그러나 사교육비의 평균값과 큰 차이가 나는 사교육비 증가의 한계효과는 그 정확도가 떨어질 가능성이 높다. 예를 들어 월평균 사교육비를 566,600원에서 1,133,200원으로 두 배 증가시키면 성적의 변화율이 어느 정도일지에 대한 한계효과는 그 정확도가 상당히 떨어진다고 할 수 있다.

한편, 월평균 사교육비로 95 퍼센타일 이하의 금액을 지출하는 학생들이 주로 받는 사교육은 성적 향상에 크게 도움이 되지 않는다 하더라도, 95 퍼센타일 이상의 월평균 사교육비에 해당하는 고액의 사교육은 학생의 성적을 크게 향상시키는 효과가 있을 수 있다. 이는 사교육비의 효과가 지출수준에 따라 비선형의 형태를 취할 수 있음을 의미한다. 월평균 60만원 이상 고액의 사교육비를 지출하는 학생들의 비중이 약 5% 이하에 불과한 자료상의 한계를 감안할 때, 고액의 사교육이 학업성적에 미치는 영향에 관하여 본 논문에서는 정확히 알 수 없다. 이를 규명하기 위해서는 고액의 사교육 부분에 특화된 새로운 자료가 일차적으로 요구된다.

V. 결 론

본 논문에서 우리는 경제학의 실증분석방법들을 활용하여 사교육비의 성적 향상효과가 어느 정도인지를 추정하였다. 추정 결과에 의하면, 우리나라에서 사교육비 지출은 평균적인 학생의 학업성적에 다소간의 영향을 미치기는 하지만 그 영향이 그리 크지는 않은 것으로 요약된다. 도구변수법의 결과에 의하면, 평균 정도의 사교육비를 지출한 상태에서 지출을 10% 정도 높이면 국어성적은 약 1.24%, 영어성적은 약 1.28%, 수학성적은 약 0.75%, 그리고 세 과목 전체의 평균성적은 약 0.74% 정도 향상되는 것으로 추정된다.

본 논문에서 추정된 사교육비 지출의 탄력성 계수는 서구의 연구에서 보고된 바 있는 공립학교의 교육비 투자가 미치는 성적 향상효과와 크게 모순되지 않는다. 예를 들어 Guryan(2003)의 연구 결과에 의하면, 학생 일인당 교육비 지출을 10% 늘릴 때 학업성적은 약 0.77~1.15% 정도 향상된다. 그리고 Card and Krueger(1996)Grogger(1996)가 요약한 바에 따르면, 학생 일인당 교육비 지출이 10% 늘어날 때 노동시장에서의 임금으로 표시된 교육성과는 약 0.7~1.1% 정도 향상된다. 한국에서 추정된 학생 일인당 사교육비의 성적 향상효과도 이 정도 수준에 대응된다고 요약할 수 있다.

본 논문에서 계산된 사교육비의 효과가 여타의 연구들과 크게 모순되지 않는다고 하더라도 본 논문의 결과는 사교육이 만연한 우리 사회의 현실과 조화되지 않는다는 비판이 있을 수 있다. 우리는 이에 대하여 아래에서 세 가지 정도의 이론적인 가능성을 검토해 보고자 한다.

첫째, 사교육비의 진정한 효과에 관하여 부모들이 정확히 알지 못할 가능성이 있다. 사교육비의 한계수익에 대한 정확한 정보가 없기 때문에 사교육비의 한계수익과 한계 비용이 일치되는 최적의 수준에서 자녀의 사교육비 지출액이 결정되지 않을 수 있다. 그렇다면 사교육의 효과가 그리 크지 않더라도 부모는 자녀의 사교육비용을 과도하게 지출할 수 있다.

둘째, 사교육비의 진정한 효과의 크기를 알고 있다고 하더라도, 사교육비 지출 결정에 외부성이 존재하는 경우에 최적의 사교육비 지출이 일어나지 않을 수 있다. 본인의 자녀에 대한 사교육비 지출액의 결정에 타인 자녀의 사교육비 지출액(예를 들어 동료집단의 평균 사교육비 지출액)이 영향을 미친다면, 외부성으로 인하여 최적의 수준에서 본인 자녀에 대한 사교육비 지출액이 결정되지 않을 수 있다. 이 경우 사교육비의 낮은 한계수익과 높은 지출액이 공존할 수 있다.

셋째, 한 학생의 성적 결정에서 사교육과 자기학습(self-study) 간에 대체적인 관계가 존재하는 경우이다. 만약 학생이 사교육을 받는 양에 비례하여 자기학습의 강도나 시간을 줄인다면 사교육비 지출이 성적 향상에 미치는 영향이 그리 크지 않을 수 있다. 이러한 현상이 장기화될 경우 부모는 사교육과 자기공부 간의 대체관계를 인식하여 사교육비 지출을 최적화할 것이므로, 세 번째의 설명에는 첫 번째의 설명과 유사하게 사교육비의 진정한 효과에 관하여 부모들이 정확히 알지 못한다는 가정이 내포된다.

위에서 제시한 설명들은 현재로서는 풍부한 실증적인 증거로서 뒷받침되지는 못하는 이론적인 추측에 불과하다. 앞으로 보다 진전된 과학적인 연구들이 개발되어 사교육비의 효과와 사교육이 만연한 현실을 조화시킬 적절한 이론들이 제시되기를 기대한다.

Notes

[*]

본 연구를 위해 자료를 협조해 주신 한국교육개발원의 김양분 박사님께 감사드리며, 초고에 대해 유익한 논평을 해주신 익명의 검토자 두 분께도 감사드린다.

[1]

본 장에서 소개되는 실증분석방법은 강창희⋅이삼호(2010)의 한국교육개발원 연구보고서 제Ⅲ장에 보다 자세히 설명된 사교육비의 인과효과 추정방법 중 일부를 차용하여 본 논문의 목적에 맞게 약간 수정하였다.

[2]

H1에 대하여 다른 금액들을 사용할 수도 있다. 본 논문에서 명시적으로 보고하지 않았지만, H1에 대해 위에서 제시된 금액 이외의 금액들(예를 들어 국어 사교육비 4만원, 수학 및 영어 사교육비 10만원, 그리고 세과목 전체 사교육비 25만원)을 설정하여 동일한 분석을 실시하였다. 그러나 그 실증 결과들은 본 논문에 보고된 내용과 큰 차이를 보이지 않는다. H1에 대해 다른 금액을 설정한 경우의 분석 결과는 독자의 요청이 있을 경우 제공할 수 있다.

[3]

‘학교교육 수준 및 실태 분석 연구: 중학교’ 자료의 구성과 설문지의 구조는 김양분 외(2004)에 보다 자세히 기술되어 있다.

[4]

사교육비 지출액의 평균값 계산에 사용된 관측치의 숫자가 각 변수별로 다른 것은 각 과목별로 사교육비 정보의 관측치 수가 다르기 때문이다. 그리하여 개별 과목의 평균 사교육비 계산에 사용된 관측치 수는 작고, 세 과목의 평균 사교육비 계산에 사용된 관측치의 수는 크다.

[5]

<Table 2>와 <Table 3>에서 통제되는 설명변수에는 학생의 전기 성적, 자기공부시간, 성별, 나이, 부모의 연령 및 교육연수, 가구소득, 거주주택의 종류, 학교가 위치한 도시의 특성(대도시, 중소도시), 사립 여부 및 남녀공학 여부 등 학교의 특성들이 포함된다. 본 논문에 사용되는 ‘첫째아 여부’ 변수가 의문의 여지없이 외생적인 경우 사교육비의 인과효과를 추정하는 모형에서 Xi로 포괄되는 설명변수들이 추가로 통제될 필요는 없다. jep-34-2-139-e005.jpg로 표현되는 Wald 추정치에서는 추가적인 통제변수인 Xi가 전혀 고려되지 않는다. 그러나 이 경우는 도구변수가 무작위로 결정되는 지극히 예외적인 경우이다. 본 논문에서와 같이 ‘첫째아 여부’ 변수에 어느 정도의 내생성이 있는 것으로 생각되는 경우에는 추가적인 Xi 변수를 통제하여 도구변수의 내생성을 어느 정도 줄이는 노력이 필요하다. 본 논문에서는 이러한 노력의 일환으로서 si와 더불어 추가적인 설명변수들 Xi를 통제하고 있다. 세 과목 평균성적을 사용하는 경우의 Wald 추정치는 0.550(se 0.061), 국어에 대한 Wald 추정치는 0.460(se 0.064), 영어에 대한 Wald 추정치는 0.568(se 0.068), 수학에 대한 Wald 추정치는 0.441(se 0.053)로서 <Table 2>와 <Table 3>의 2SLS 추정치들에 비하여 약간 크다. 이는 ‘첫째아 여부’ 도구변수가 완전히 외생적이지는 않음을 시사한다. 그러나 Wald 추정치들과 <Table 2>와 <Table 3>에 제시된 2SLS 추정치들이 큰 차이를 보이지는 않기 때문에, 본 논문에서는 Xi를 통제하는 모형을 기초로 ‘첫째아 여부’ 변수를 도구변수로 사용하는 분석방법을 채택한다.

References

1 

강, 창희, & 이, 삼호. (2010). 사교육에 대한 경제학적 분석 및 정책 제언, 한국교육개발원 연구보고서, CR 2010-12.

2 

김, 양분, 류, 한구, 김, 미숙, & 남궁, 지영. (2004). 학교교육 수준 및 실태 분석 연구: 중학교, 한국교육개발원 연구보고서, RR 2004-3.

3 

김, 지하, & 김, 정은. (2009). Propensity Score Matching 방법을 사용한 사교육 유형별 효과 분석. 교육재정경제연구, 18(3), 63-87.

4 

김, 진영. (2007). 고3 수험생들의 시간활용과 사교육의 효과. 한국교육, 34(4), 57-78.

5 

남, 기곤. (2008). 사교육시간과 학업성적과의 관련성: PISA 자료를 이용한 국제비교 분석. 한국경제학보, 15(1), 55-90.

6 

박, 현정, 상, 경아, & 강, 주연. (2008). 사교육이 중학생의 학업성취에 미치는 효과. 교육평가연구, 21(4), 107-127.

7 

상, 경아, & 백, 순근. (2005). 고등학생의 수학 과외가 학업성취도, 태도, 자기조절학습에 미치는 영향. 교육평가연구, 18(3), 39-57.

8 

오, 영수, & 윤, 정식. (2003). 일반계 고등학생의 성적결정 요인 분석. 교육재정경제연구, 12(1), 33-56.

9 

이, 수정, & 임, 현정. (2009). 중학생의 학업성취에 대한 사교육비 효과 분석. 교육재정경제연구, 18(1), 141-166.

10 

임, 천순, 박, 소영, & 이, 광호. (2004). 사교육이 학업성취에 미치는 영향. 교육재정경제연구, 13(1), 331-356.

11 

조, 혜영, & 이, 경상. (2005). 사교육시간, 개인공부시간, 학교수업참여도의 실태 및 주관적 학업성적향상 효과. 한국교육, 32(4), 29-56.

12 

최, 형재. (2008). 사교육의 대학 진학에 대한 효과. 국제경제연구, 14(1), 73-110.

13 

최, 상근, et al. (2003). 사교육 실태 및 사교육비 규모 분석 연구, 한국교육개발원 연구보고서, CR 2003-19.

14 

한, 대동, 성, 병창, & 길, 임주. (2001). 고등학생 학업성취에 대한 학교효과와 과외효과의 비교연구. 교육사회학 연구, 11(1), 33-54.

15 

Anderson, G. M., Shughartl, W. F., & Tollison, R. (1991). Educational Achievement and the Cost of Bureaucracy. Journal of Economic Behavior & Organization, 15(1), 29-45, https://doi.org/10.1016/0167-2681(91)90003-G.

16 

Anderson, T. W., & Rubin, H. (1949). Estimation of the Parameters of a Single Equation in a Complete System of Stochastic Equations. Annals of Mathematical Statistics, 20(1), 46-63, https://doi.org/10.1214/aoms/1177730090.

17 

Bedard, K. (2003). School Quality and the Distribution of Male Earnings in Canada. Economics of Education Review, 22, 395-407, https://doi.org/10.1016/S0272-7757(02)00071-7.

18 

Behrman, J. R., & Taubman, P. (1986). Birth Order, Schooling, and Earnings. Journal of Labor Economics, 4(3), S121-S145, https://doi.org/10.1086/298124.

19 

Betts, J. R. (1995). Does School Quality Matter? Evidence from the National Longitudinal Survey of Youth. Review of Economics and Statistics, 77(2), 231-250, https://doi.org/10.2307/2109862.

20 

Betts, J. R., & Burtless, G. (Ed.). Does Money Matter? The Effect of School Resources on Student Achievement and Adult Success. Washington, DC: Brookings. pp. 141-191, Is There a Link between School Inputs and Earnings? Fresh Scrutiny of an Old Literature.

21 

Bjerkedal, T., Kristensen, P., Skjeret, G. A., & Brevik, J. I. (2007). Intelligence Test Scores and Birth Order among Young Norwegian Men (Conscripts) Analyzed within and between Families. Intelligence, 35(5), 503-514, https://doi.org/10.1016/j.intell.2007.01.004.

22 

Black, S. E., Devereux, P. J., & Salvanes, K. G. (2005). The More the Merrier? The Effect of Family Size and Birth Order on Children's Education. Quarterly Journal of Economics, 120(2), 669-700.

23 

Black, S. E., Devereux, P. J., & Salvanes, K. G. (2007). Older and Wiser? Birth Order and IQ of Young Men. NBER Working Paper 13237.

24 

Blundell, R., Gosling, A., Ichimura, H., & Meghir, C. (2007). Changes in the Distribution of Male and Female Wages Accounting for Employment Composition Using Bounds. Econometrica, 75(2), 323-363, https://doi.org/10.1111/j.1468-0262.2006.00750.x.

25 

Briggs, D. C. (2001). The Effect of Admissions Test Preparation: Evidence from NELS: 88. Chance, 14(1), 10-18, https://doi.org/10.1080/09332480.2001.10542245.

26 

Card, D., & Krueger, A. B. (1992). Does School Quality Matter? Returns to Education and the Characteristics of Public Schools in the United States. Journal of Political Economy, 100(1), 1-40, https://doi.org/10.1086/261805.

27 

Card, D., & Krueger, A. B. (1996). School Resources and Student Outcomes: An Overview of the Literature and New Evidence from North and South Carolina. Journal of Economic Perspectives, 10(4), 31-50, https://doi.org/10.1257/jep.10.4.31.

28 

Dang, H. (2007). The Determinants and Impact of Private Tutoring Classes in Vietnam. Economics of Education Review, 26(6), 683-698, https://doi.org/10.1016/j.econedurev.2007.10.003.

29 

Dang, H., & Rogers, F. H. (2008). How to Interpret the Growing Phenomenon of Private Tutoring: Human Capital Deepening, Inequality Increasing, or Waste of Resources? Policy Research Working Paper Series of The World Bank, No. 4530.

30 

Gerfin, M., & Schellhorn, M. (2006). Nonparametric Bounds on the Effect of Deductibles in Health Care Insurance on Doctor Visits-Swiss Evidence. Health Economics, 15(9), 1011-1020, https://doi.org/10.1002/hec.1113.

31 

Gonzalez, L. (2005). Nonparametric Bounds on the Returns to Language Skills. Journal of Applied Econometrics, 20(6), 771-795, https://doi.org/10.1002/jae.795.

32 

Greenwald, R., Hedges, L. V., & Laine, R. D. (1996). The Effect of School Resources on Student Achievement. Review of Educational Research, 66(3), 361-396, https://doi.org/10.3102/00346543066003361.

33 

Grogger, J. (1996). School Expenditures and Post-schooling Earnings: Evidence from High School and Beyond. Review of Economics and Statistics, 78(4), 628-637, https://doi.org/10.2307/2109950.

34 

Gurun, A., & Millimet, D. L. (2008). Does Private Tutoring Payoff. The Institute for the Study of Labor (IZA). IZA Discussion Paper, No. 3637.

35 

Guryan, J. (2003). Does Money Matter? Estimates from Education Finance Reform in Massachusetts. mimeo.

36 

Hanushek, E. A. (1997). Assessing the Effects of School Resources on Student Performance: An Update. Educational Evaluation and Policy Analysis, 19(2), 141-164, https://doi.org/10.3102/01623737019002141.

37 

Hanushek, E. A. (2003). The Failure of Input-based Schooling Policies. Economic Journal, 113(485), F64-F98, https://doi.org/10.1111/1468-0297.00099.

38 

Harris, J. R. (1995). Where Is the Child's Environment? A Group Socialization Theory of Development. Psychological Review, 102(3), 458-489, https://doi.org/10.1037/0033-295X.102.3.458.

39 

Harris, J. R. (1998). The Nurture Assumption: Why Children Turn out the Way They Do. New York, NY: Touchstone.

40 

Haveman, R., & Wolfe, B. (1995). The Determinants of Children's Attainments: A Review of Methods and Findings. Journal of Economic Literature, 33(4), 1829-1878.

41 

Hedges, L. V., Laine, R. D., & Greenwald, R. (1994). Does Money Matter? A Meta-analysis of Studies of the Effects of Differential School Inputs on Student Outcomes. Educational Researcher, 23(3), 5-14.

42 

Herrnstein, R., & Murray, C. (1994). The Bell Curve. New York: The Free Press.

43 

Hoxby, C. M. (1996). How Teachers' Unions Affect Education Production. Quarterly Journal of Economics, 111(3), 671-718, https://doi.org/10.2307/2946669.

44 

Kang, C. (2007). Does Money Matter? The Effect of Private Educational Expenditures on Academic Performance. Departmental Working Papers from National University of Singapore, Department of Economics.

45 

Kleibergen, F. (2002). Pivotal Statistics for Testing Structural Parameters in Instrumental Variables Regression. Econometrica, 70(5), 1781-1803, https://doi.org/10.1111/1468-0262.00353.

46 

Kreider, B., & Pepper, J. V. (2007). Disability and Employment: Reevaluating the Evidence in Light of Reporting Errors. Journal of the American Statistical Association, 102(478), 432-441, https://doi.org/10.1198/016214506000000997.

47 

Krueger, A. B. (1999). Experimental Estimates of Education Production Functions. Quarterly Journal of Economics, 114(2), 497-532, https://doi.org/10.1162/003355399556052.

48 

Krueger, A. B. (2003). Economic Considerations and Class Size. Economic Journal, 113(485), F34-F62, https://doi.org/10.1111/1468-0297.00098.

49 

Lechner, J. (1999). Nonparametric Bounds on Employment and Income Effects of Continuous Vocational Training in East Germany. Econometrics Journal, 2(1), 1-28, https://doi.org/10.1111/1368-423X.00018.

50 

Leuven, E., Lindahl, M., Oosterbeek, H., & Webbink, D. (2007). The Effect of Extra Funding for Disadvantaged Pupils on Achievement. Review of Economics and Statistics, 89(4), 721-736, https://doi.org/10.1162/rest.89.4.721.

51 

Manski, C. F. (1990). Nonparametric Bounds on Treatment Effects. American Economic Review, 80(2), 319-323.

52 

Manski, C. F. (1997). Monotone Treatment Response. Econometrica, 65(6), 1311-1334, https://doi.org/10.2307/2171738.

53 

Manski, C. F., & Nagin, D. S. (1998). Bounding Disagreements about Treatment Effects: A Case Study of Sentencing and Recidivism. Sociological Methodology, 28, 99-137, https://doi.org/10.1111/0081-1750.00043.

54 

Manski, C. F., & Pepper, J. V. (2000). Monotone Instrumental Variables, with an Application to the Returns to Schooling. Econometrica, 68(4), 997-1012, https://doi.org/10.1111/1468-0262.00144.

55 

Moreira, M. J. (2003). A Conditional Likelihood Ratio Test for Structural Models. Econometrica, 71(4), 1027-1048, https://doi.org/10.1111/1468-0262.00438.

56 

Ono, H. (2007). Does Examination Hell Pay Off? A Cost-benefit Analysis of ‘Ronin’ and College Education in Japan. Economics of Education Review, 26(3), 271-284, https://doi.org/10.1016/j.econedurev.2006.01.002.

57 

Pepper, J. V. (2000). The Intergenerational Transmission of Welfare Receipt: A Nonparametric Bounds Analysis. Review of Economics and Statistics, 82(3), 472-488, https://doi.org/10.1162/003465300558830.

58 

Raudenbush, S. W., & Bryk, A. S. (2002). Hierarchical Linear Models: Applications and Data Analysis Methods (2nd ed.). CA: Sage.

59 

Retherford, R. D., & Sewell, W. H. (1991). Birth Order and Intelligence: Further Tests of the Confluence Model. American Sociological Review, 56(2), 141-158, https://doi.org/10.2307/2095775.

60 

Rodgers, J. L., Cleveland, H. H., Oord, E. V. D., & Rowe, D. C. (2000). Resolving the Debate Over Birth Order, Family Size, and Intelligence. American Psychologist, 55(6), 599-612, https://doi.org/10.1037/0003-066X.55.6.599.

61 

Stock, J. H., Wright, J. H., & Yogo, M. (2002). A Survey of Weak Instruments and Weak Identification in Generalized Method of Moments. Journal of Business and Economic Statistics, 20(4), 518-529, https://doi.org/10.1198/073500102288618658.

62 

Zajonc, R. B. (1976). Family Configuration and Intelligence. Science, 192(4236), 227-236, https://doi.org/10.1126/science.192.4236.227.

63 

Zajonc, R. B., & Mullally, P. R. (1997). Birth Order Reconciling Conflicting Effects. American Psychologist, 52(7), 685-699, https://doi.org/10.1037/0003-066X.52.7.685.