본 연구의 목적은 한국어 문장 수준 서답형 문항 자동채점 프로그램의 성능을 검증하여 대규모 평가에서의 적용 가능성을 탐색하기 위한 것이다. 2013년 학업성취도 평가 국어 9문항, 사회 2...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A101823192
2015
-
370
KCI등재
학술저널
523-551(29쪽)
2
0
상세조회0
다운로드본 연구의 목적은 한국어 문장 수준 서답형 문항 자동채점 프로그램의 성능을 검증하여 대규모 평가에서의 적용 가능성을 탐색하기 위한 것이다. 2013년 학업성취도 평가 국어 9문항, 사회 2...
본 연구의 목적은 한국어 문장 수준 서답형 문항 자동채점 프로그램의 성능을 검증하여 대규모 평가에서의 적용 가능성을 탐색하기 위한 것이다. 2013년 학업성취도 평가 국어 9문항, 사회 2문항의 각 1000개 답안을 대상으로 시범 적용한 결과, 채점 정확성과 효율성을 중시하는 고부담 대규모 평가에 적정한 것으로 나타났다. 먼저, 채점 처리 과정의 간결성(simplicity) 측면에서, 1차로 답안을 군집화한 결과 답안 유형 수가 3.1%~37.5%로 감소한다. 이를 바탕으로 고빈도 답안을 채점하면 평균 55.9%의 답안이 채점되어 군집화가 답안 유형 수를 줄이고 동시에 기계학습에 필요한 충분한 수의 답안을 확보하게 함으로써 자동채점의 효율성에 기여한다. 다음으로 채점 결과의 정확성(accuracy) 분석을 위해, 기준점수와 자동채점 점수 간 상관관계와 일치도를 살펴본 결과 적정하게 우수한 것으로 나타났다. 두 점수 간의 평균제곱근편차는 0~0.55, 표준화된 평균제곱근편차는 0~0.2로나타나 자동채점 점수가 기준점수와 크게 다르지 않았다. 또한 두 점수 간 완전일치도는 91.5~100%, 카파계수는 0.8~1.00, 상관계수는 0.82~1.00으로 나타나, 대체로 모든 문항에 대한 계수가 0.8 이상으로 높은 수준의 일치도를 보여주었다.
다국어 초록 (Multilingual Abstract)
The purpose of this research is to explore the possibility of using an automatic scoring system for sentence-level responses in large scale to enhance the efficiency of scoring constructed response items for large scale assessment. In order to enhance...
The purpose of this research is to explore the possibility of using an automatic scoring system for sentence-level responses in large scale to enhance the efficiency of scoring constructed response items for large scale assessment. In order to enhance the simplicity of the scoring process, the answers were grouped based on similarity of meaning, and the grouped answers were scored with the automatic scoring program. These scored answers were used for machine-learning, to update the similarity in meaning for the next grouping of answers. This process is intended to decrease the number of grouped answers and to accumulate scoring results. Upon implementing the program using 11 social studies constructed response items in the Korean language from the NAEA 2013, the types of answers for each question diminished by 3.1%-37% for the initial grouping stage, and an average of 55.9% of the answers were scored at the first stage of grouping. Grouping answers by similarity in meaning enhanced simplicity of scoring while also contributing to improved accuracy. Next, in order to examine the program 's scoring accuracy, we calculated the exact agreement, correlation coefficients, and kappa coefficients between the criterion scores and the scores from the automatic scoring program for the sentence level, and it was revealed that the exact agreement between the two scores was 91.5-100%, the correlation coefficient was 0.82-1.00 and the Kappa coefficient was 0.8-1.00, which is fairly remarkable.
목차 (Table of Contents)
참고문헌 (Reference)
1 나동렬, "한국어 파싱에 대한 고찰" 12 (12): 33-46, 1994
2 박소영, "한국어 구문분석의 효율성을 개선하기 위한 구문제약규칙의 학습" 한국정보과학회 29 (29): 755-765, 2002
3 성태제, "학업성취도 평가 서답형 문항 컴퓨터 채점화 방안 탐색" 한국교육과정평가원 2010
4 교육과학기술부, "창의성과 인성 함양을 위한 교육내용․방법․평가체제 혁신 방안 VIP 보고" 2010
5 교육과학기술부, "창의․인성교육 강화를 위한 「중등학교 학사관리 선진화 방안」 발표 -고교 석차 9등급제 평가를 성취평가제로 전환-"
6 조우진, "의미커널과 한글 워드넷에 기반한 지능형 채점 시스템" 한림대학교 대학원 2006
7 박태준, "영어 쓰기 자동채점 프로그램 개발(Ⅲ)" 한국교육과정평가원 2014
8 이공주, "언어특성에 기반한 한국어의 확률적 구문 분석" 韓國科學技術院 1998
9 진경애, "서답형 문항 자동채점 프로그램 도입 방안 연구(Ⅲ)" 한국교육과정평가원 2008
10 진경애, "서답형 문항 자동채점 프로그램 도입 방안 연구(Ⅱ) - 영작문 채점을 중심으로" 한국교육과정평가원 2007
1 나동렬, "한국어 파싱에 대한 고찰" 12 (12): 33-46, 1994
2 박소영, "한국어 구문분석의 효율성을 개선하기 위한 구문제약규칙의 학습" 한국정보과학회 29 (29): 755-765, 2002
3 성태제, "학업성취도 평가 서답형 문항 컴퓨터 채점화 방안 탐색" 한국교육과정평가원 2010
4 교육과학기술부, "창의성과 인성 함양을 위한 교육내용․방법․평가체제 혁신 방안 VIP 보고" 2010
5 교육과학기술부, "창의․인성교육 강화를 위한 「중등학교 학사관리 선진화 방안」 발표 -고교 석차 9등급제 평가를 성취평가제로 전환-"
6 조우진, "의미커널과 한글 워드넷에 기반한 지능형 채점 시스템" 한림대학교 대학원 2006
7 박태준, "영어 쓰기 자동채점 프로그램 개발(Ⅲ)" 한국교육과정평가원 2014
8 이공주, "언어특성에 기반한 한국어의 확률적 구문 분석" 韓國科學技術院 1998
9 진경애, "서답형 문항 자동채점 프로그램 도입 방안 연구(Ⅲ)" 한국교육과정평가원 2008
10 진경애, "서답형 문항 자동채점 프로그램 도입 방안 연구(Ⅱ) - 영작문 채점을 중심으로" 한국교육과정평가원 2007
11 진경애, "서답형 문항 자동채점 프로그램 도입 방안 연구(Ⅰ)" 한국교육과정평가원 2006
12 정동경, "벡터유사도와 시소러스를 이용한 주관식 답안의 채점방법" 동국대학교 교육대학원 2002
13 노은희, "문장 수준 자동채점 프로그램 개발 현황 및 채점결과 분석" 한국교육과정평가원 2014
14 노은희, "대규모 평가를 위한 서답형 문항 자동채점 프로그램 정교화 및 시범 적용" 한국교육과정평가원 2013
15 노은희, "대규모 평가를 위한 서답형 문항 자동채점 방안 연구" 한국교육과정평가원 2012
16 시기자, "국가영어능력평가시험 쓰기 자동채점 프로그램 개발(Ⅱ)" 한국교육과정평가원 2013
17 시기자, "국가영어능력평가시험 쓰기 자동채점 프로그램 개발" 한구교육과정평가원 2012
18 박소영, "X-바 이론의 중심어 개념을 도입한 형태소 단위의 한국어 자질기반 문법." 26 (26): 1247-1259, 1999
19 Landis, J. R., "The measurement of observer agreement for categorical data" 33 (33): 159-174, 1977
20 Livingston, S. A., "R&D Connections-Constructed-responces test questions: Why we use them: how we score them" Educational Testing Service 2009
21 Sukkarieh, J. Z., "Leveraging C-Rater’s Automated Scoring Capability for Providing Instructional Feedback for Short Constructed Responses" 779-783, 2008
22 Butcher, P. G., "A comparison of human and computer marking of short free-text student responses" 55 : 489-499, 2010
23 교육과학기술부, "2011 창의․인성 교육 기본 계획"
자료에 이상점들이 존재할 때 매개효과 검정 방법들의 비교
문항배열순서와 성별이 피험자 능력추정의 정확성과 시험불안에 미치는 영향
역균형화 단일집단 설계를 사용하는 검사동등화에서 차별적 순서효과의 통계적 유의성 검정 및 검정력 분석
학술지 이력
| 연월일 | 이력구분 | 이력상세 | 등재구분 |
|---|---|---|---|
| 2026 | 평가예정 | 재인증평가 신청대상 (재인증) | |
| 2020-01-01 | 평가 | 등재학술지 유지 (재인증) | ![]() |
| 2017-01-01 | 평가 | 등재학술지 유지 (계속평가) | ![]() |
| 2013-01-01 | 평가 | 등재학술지 유지 (등재유지) | ![]() |
| 2010-01-01 | 평가 | 등재학술지 유지 (등재유지) | ![]() |
| 2008-01-01 | 평가 | 등재학술지 유지 (등재유지) | ![]() |
| 2006-01-01 | 평가 | 등재학술지 유지 (등재유지) | ![]() |
| 2004-01-01 | 평가 | 등재학술지 유지 (등재유지) | ![]() |
| 2001-01-01 | 평가 | 등재학술지 선정 (등재후보2차) | ![]() |
| 1998-07-01 | 평가 | 등재후보학술지 선정 (신규평가) | ![]() |
학술지 인용정보
| 기준연도 | WOS-KCI 통합IF(2년) | KCIF(2년) | KCIF(3년) |
|---|---|---|---|
| 2016 | 0.91 | 0.91 | 0.99 |
| KCIF(4년) | KCIF(5년) | 중심성지수(3년) | 즉시성지수 |
| 1.02 | 1.03 | 1.646 | 0.37 |