한국어 문장 수준 서답형 문항 자동채점 적용 가능성 탐색|RISS 상세보기

국문 초록 (Abstract)

본 연구의 목적은 한국어 문장 수준 서답형 문항 자동채점 프로그램의 성능을 검증하여 대규모 평가에서의 적용 가능성을 탐색하기 위한 것이다. 2013년 학업성취도 평가 국어 9문항, 사회 2문항의 각 1000개 답안을 대상으로 시범 적용한 결과, 채점 정확성과 효율성을 중시하는 고부담 대규모 평가에 적정한 것으로 나타났다. 먼저, 채점 처리 과정의 간결성(simplicity) 측면에서, 1차로 답안을 군집화한 결과 답안 유형 수가 3.1%~37.5%로 감소한다. 이를 바탕으로 고빈도 답안을 채점하면 평균 55.9%의 답안이 채점되어 군집화가 답안 유형 수를 줄이고 동시에 기계학습에 필요한 충분한 수의 답안을 확보하게 함으로써 자동채점의 효율성에 기여한다. 다음으로 채점 결과의 정확성(accuracy) 분석을 위해, 기준점수와 자동채점 점수 간 상관관계와 일치도를 살펴본 결과 적정하게 우수한 것으로 나타났다. 두 점수 간의 평균제곱근편차는 0~0.55, 표준화된 평균제곱근편차는 0~0.2로나타나 자동채점 점수가 기준점수와 크게 다르지 않았다. 또한 두 점수 간 완전일치도는 91.5~100%, 카파계수는 0.8~1.00, 상관계수는 0.82~1.00으로 나타나, 대체로 모든 문항에 대한 계수가 0.8 이상으로 높은 수준의 일치도를 보여주었다.

번역하기

본 연구의 목적은 한국어 문장 수준 서답형 문항 자동채점 프로그램의 성능을 검증하여 대규모 평가에서의 적용 가능성을 탐색하기 위한 것이다. 2013년 학업성취도 평가 국어 9문항, 사회 2...

다국어 초록 (Multilingual Abstract)

The purpose of this research is to explore the possibility of using an automatic scoring system for sentence-level responses in large scale to enhance the efficiency of scoring constructed response items for large scale assessment. In order to enhance the simplicity of the scoring process, the answers were grouped based on similarity of meaning, and the grouped answers were scored with the automatic scoring program. These scored answers were used for machine-learning, to update the similarity in meaning for the next grouping of answers. This process is intended to decrease the number of grouped answers and to accumulate scoring results. Upon implementing the program using 11 social studies constructed response items in the Korean language from the NAEA 2013, the types of answers for each question diminished by 3.1%-37% for the initial grouping stage, and an average of 55.9% of the answers were scored at the first stage of grouping. Grouping answers by similarity in meaning enhanced simplicity of scoring while also contributing to improved accuracy. Next, in order to examine the program 's scoring accuracy, we calculated the exact agreement, correlation coefficients, and kappa coefficients between the criterion scores and the scores from the automatic scoring program for the sentence level, and it was revealed that the exact agreement between the two scores was 91.5-100%, the correlation coefficient was 0.82-1.00 and the Kappa coefficient was 0.8-1.00, which is fairly remarkable.

번역하기

목차 (Table of Contents)

요약
Ⅰ. 서론
Ⅱ. 한국어 문장 수준 서답형 문항 자동채점 프로그램 개발
Ⅲ. 자동채점 적용 대상 문항 및 분석 방법
Ⅳ. 자동채점 결과 분석

요약
Ⅰ. 서론
Ⅱ. 한국어 문장 수준 서답형 문항 자동채점 프로그램 개발
Ⅲ. 자동채점 적용 대상 문항 및 분석 방법
Ⅳ. 자동채점 결과 분석
Ⅴ. 결론
참고문헌

참고문헌 (Reference)

1 나동렬, "한국어 파싱에 대한 고찰" 12 (12): 33-46, 1994

2 박소영, "한국어 구문분석의 효율성을 개선하기 위한 구문제약규칙의 학습" 한국정보과학회 29 (29): 755-765, 2002

3 성태제, "학업성취도 평가 서답형 문항 컴퓨터 채점화 방안 탐색" 한국교육과정평가원 2010

4 교육과학기술부, "창의성과 인성 함양을 위한 교육내용․방법․평가체제 혁신 방안 VIP 보고" 2010

5 교육과학기술부, "창의․인성교육 강화를 위한 ｢중등학교 학사관리 선진화 방안｣ 발표 -고교 석차 9등급제 평가를 성취평가제로 전환-"

6 조우진, "의미커널과 한글 워드넷에 기반한 지능형 채점 시스템" 한림대학교 대학원 2006

7 박태준, "영어 쓰기 자동채점 프로그램 개발(Ⅲ)" 한국교육과정평가원 2014

8 이공주, "언어특성에 기반한 한국어의 확률적 구문 분석" 韓國科學技術院 1998

9 진경애, "서답형 문항 자동채점 프로그램 도입 방안 연구(Ⅲ)" 한국교육과정평가원 2008

10 진경애, "서답형 문항 자동채점 프로그램 도입 방안 연구(Ⅱ) - 영작문 채점을 중심으로" 한국교육과정평가원 2007

1 나동렬, "한국어 파싱에 대한 고찰" 12 (12): 33-46, 1994

2 박소영, "한국어 구문분석의 효율성을 개선하기 위한 구문제약규칙의 학습" 한국정보과학회 29 (29): 755-765, 2002

3 성태제, "학업성취도 평가 서답형 문항 컴퓨터 채점화 방안 탐색" 한국교육과정평가원 2010

4 교육과학기술부, "창의성과 인성 함양을 위한 교육내용․방법․평가체제 혁신 방안 VIP 보고" 2010

5 교육과학기술부, "창의․인성교육 강화를 위한 ｢중등학교 학사관리 선진화 방안｣ 발표 -고교 석차 9등급제 평가를 성취평가제로 전환-"

6 조우진, "의미커널과 한글 워드넷에 기반한 지능형 채점 시스템" 한림대학교 대학원 2006

7 박태준, "영어 쓰기 자동채점 프로그램 개발(Ⅲ)" 한국교육과정평가원 2014

8 이공주, "언어특성에 기반한 한국어의 확률적 구문 분석" 韓國科學技術院 1998

9 진경애, "서답형 문항 자동채점 프로그램 도입 방안 연구(Ⅲ)" 한국교육과정평가원 2008

10 진경애, "서답형 문항 자동채점 프로그램 도입 방안 연구(Ⅱ) - 영작문 채점을 중심으로" 한국교육과정평가원 2007

11 진경애, "서답형 문항 자동채점 프로그램 도입 방안 연구(Ⅰ)" 한국교육과정평가원 2006

12 정동경, "벡터유사도와 시소러스를 이용한 주관식 답안의 채점방법" 동국대학교 교육대학원 2002

13 노은희, "문장 수준 자동채점 프로그램 개발 현황 및 채점결과 분석" 한국교육과정평가원 2014

14 노은희, "대규모 평가를 위한 서답형 문항 자동채점 프로그램 정교화 및 시범 적용" 한국교육과정평가원 2013

15 노은희, "대규모 평가를 위한 서답형 문항 자동채점 방안 연구" 한국교육과정평가원 2012

16 시기자, "국가영어능력평가시험 쓰기 자동채점 프로그램 개발(Ⅱ)" 한국교육과정평가원 2013

17 시기자, "국가영어능력평가시험 쓰기 자동채점 프로그램 개발" 한구교육과정평가원 2012

18 박소영, "X-바 이론의 중심어 개념을 도입한 형태소 단위의 한국어 자질기반 문법." 26 (26): 1247-1259, 1999

19 Landis, J. R., "The measurement of observer agreement for categorical data" 33 (33): 159-174, 1977

20 Livingston, S. A., "R&D Connections-Constructed-responces test questions: Why we use them: how we score them" Educational Testing Service 2009

21 Sukkarieh, J. Z., "Leveraging C-Rater’s Automated Scoring Capability for Providing Instructional Feedback for Short Constructed Responses" 779-783, 2008

22 Butcher, P. G., "A comparison of human and computer marking of short free-text student responses" 55 : 489-499, 2010

23 교육과학기술부, "2011 창의․인성 교육 기본 계획"

연월일	이력구분	이력상세
2026	평가예정	재인증평가 신청대상 (재인증)
2020-01-01	평가	등재학술지 유지 (재인증)
2017-01-01	평가	등재학술지 유지 (계속평가)
2013-01-01	평가	등재학술지 유지 (등재유지)
2010-01-01	평가	등재학술지 유지 (등재유지)
2008-01-01	평가	등재학술지 유지 (등재유지)
2006-01-01	평가	등재학술지 유지 (등재유지)
2004-01-01	평가	등재학술지 유지 (등재유지)
2001-01-01	평가	등재학술지 선정 (등재후보2차)
1998-07-01	평가	등재후보학술지 선정 (신규평가)

기준연도	WOS-KCI 통합IF(2년)	KCIF(2년)	KCIF(3년)
2016	0.91	0.91	0.99
KCIF(4년)	KCIF(5년)	중심성지수(3년)	즉시성지수
1.02	1.03	1.646	0.37

상세검색

RISS 보유자료

상세검색

해외전자자료

한국어 문장 수준 서답형 문항 자동채점 적용 가능성 탐색 = Analysis of Scoring Results in Korean Constructed Response Automatic Scoring Program

부가정보

동일학술지(권/호) 다른 논문

분석정보

인용정보 인용지수 설명보기

연관 공개강의(KOCW)

이 자료와 함께 이용한 RISS 자료

나만을 위한 추천자료