RISS 검색 - 학위논문

내보내기
내책장담기
한글로보기

정확도순

내림차순

내림차순

10개씩 출력

1
필기체 한글 인식에 적합한 Thinning algorithm 개발

우택종 忠南大學校大學院 1985 국내석사

RANK : 247631
- 원문보기
1. 서론 현대는 컴퓨터의 발달로 대량의 정보 데이타를 신속,정확히 분석 처리 해내는 정보(information)시대지만, 컴퓨터 정보를 위한 입력 처리 방법은 아직도 인간의 손으로 이루어지고 있어, 고속의 자동 입력 인식처리 장치가 절실히 요구되고 있다. 이에 대하여, T.V카메라나 Photo scan system을 이용하여 영상 Image를 Sampling, Digitizing하여 컴퓨터 처리가 용이 하도록 양자화된 테이타를 만든 후, 컴퓨터로 대량의 입력 패턴을 자동 인식하게 하는 패턴 인식에 대한 분야로 글자를 입력 패턴으로 이용하여 글자를 자동 인식하는 알고리즘(17,18,19)이 발표된 바 있고, 우리 한글을 대상으로 발표된 논문들도 다수 있으며(2,5,6,23,28), 인식의 분야인 전처리 단계의 세선화를 위한 알고리즘이 발표된 바도 있다.(1,3,7,9) 패턴 인식의 일반적인 진행 단계는 테이타 양자와 과정, 전처리 과정 특징점 추출 과정, 분루 과정, 인식 과정의 다섯 단계로 진행되는데, 대부분 오인식의 원인이 입력 과정의 잡음, 글씨의 잘못 기재로 인한 판독 불능, 유한의 폭을 가지는 입력 패턴의 세선화 후 특징점 추출의 과정에서 일어나게 되는데, 이 중에서 오인식의 대부분이 형태에 의해 크게 좌우되고, 기타 잡음등은 하드웨어이 발달로 거의 원형에 가깝게 입력되므로 문제가 되지 않는다. 그러므로, 세선화 과정을 이용하는 패턴 인식에는 세선화의 중요성이 강조되고 있다. 한편, 한글의 인식에 관한 알고리즘을 살펴보면, 세선화를 이용한 일반적인 패턴 인식 방법으로, 인쇄체 한글 인식을 위한 세선화 알고리즘이 인쇄체 한글에 적합하도록 개발된 바 있으며(1), 필기체 한글의 인쇄체 한글의 직선성, 규칙성, 직각성과는 달리, 직선.곡선성, Arc, 꺽임성, 불규칙성을 가지므로 인쇄체 세선화 알고리즘을 적용하여 필기체 한글인식에 적용하였을 경우, 세선화 형태에 의한 특징점 추출의 곤란으로 적용이 적당한 알고리즘이라고 볼 수 없었다. 특히, 세선화 알고리즘에서 정봉만의 방법은 인쇄체 한글의 특성인 직선 직각화에 중점을 두었고, 이주근의 방법은 연결성 만을 유지하며 빠른 속도로 처리 하는데 중점을 두었고, 외국인 중 Rosenfeld의 방법은 연결성 유지와 Arcelli의 영문의 곡선성에 중점을 둔 알고리즘이 발표된바 있으나, 이중 정봉만이 입력 실험한 실험 결과와 필기체 한글을 실제 입력 양자화시킨 데이타를 가지고 정봉만의 방법으로 처리한 결과, 필기체의 경우 처리 시간이 길고 원형 입력 패턴에 비해 많은 변형이 일어나서 특징점의 상이한 구성적 차이로 오인식및 미인식의 원인이 되었고, 필기체 한글의 입력 형태인 두꺼운 글자 부분과 얇은 글자 부분이 서로 복합 존재한 경우는 필기체의 특성에 알맞는 세선화가 되지 못하였다. 그러므로, 글자의 유형이 다양한 한글 필기체 인식을 위해서는 더 효과적인 세선화 방법이 요구되었다. 본 논문에서는, 필기체 한글의 구조적 특성이 인쇄체와는 달리 직선.곡선성, Arc형, 꺾임성, 직각성, 대각선 방향성과 글씨의 구성 요소인 각 선폭의 다양성등이 글씨를 쓰는 사람에 따라 불규칙적으로 변하므로 유동적인 글씨를 세선화하는 적절한 방법을 개발하고자 했다. 기존 알고리즘의 경우 불규칙적으로 두꺼운 선분으로 구성된 곳에서 변형이 많이 일어나므로, 이의 해결 방안으로 32X32 Matrix로 구성된 글자에서, 수평과 수직으로 각각 최소 선폭을 기준으로 최소 선폭만큼 입력 패턴의 원형에 손상을 주지 않는 범위에서, 넓은 선폭의 글자를 효과적으로 유한의 최소 선폭을 유지하는 유한 선폭 골격선으로 세선화한 다음, 국부 연산에 의하여 단점, 단순점 분기및 곡선 예상점등을 조건식에 의하여 처리한 결과, 원형에 필기체 입력 패턴에 변형이 없이 한글 필기체의 구조적 특성인 직선.곡선성및 자연성을 유지할 수 있는 Double Preprocessiong 방법을 소개하였다. Double preprocessing 처리로 세선화된 결과를 필기체 한글 인식에 적용할 경우 인식률이 좋을 것으로 기대된다. 2. 패턴 치리 방법과 세선화 이론 2-1. 패턴 인식 인공 지능론인 패턴 인식은 글자등의 Image pattern을 양자화(Digitization)한 후, 자동적으로 분류하여 표본 패턴과 비교하여 인식하는 방법이다. 입력 패턴이 글씨인 경우 글자 부분은 "1"로 표시하고 배결 부분은 "0 으로 표시하여 가로 32개의 Pixel과 세로의 32개의 Pixel로 구성된, 32X32 Matrix의 컴퓨터 처리가 용이한 글자 입력 패턴을 이용한다. 이에 대한 처리 방법은 보통 그림 (2-1)에서 보듯이 다섯 단계를 거치는데, 양자화 입력 처리 단계는 컴퓨터의 하드웨어의 발달로 거의 원형의 입력 패턴을 얻을 수 있고, 전처리 단계에서 세선화 작업을 거친 후에 Primitive들의 관계를 Tree grammar, Web grammar, Shape grammar등으로 표현한 후, Decision theoretic이나 Syntactic pattern recognition 방법 등으로 분석하여 표본 패턴과 비교하여 인식하는 방법으로, 인공 눈이나 인공 두뇌를 가지는 컴퓨터를 만들어 산업에 응용할 수 있는 인공 지능론 분야이다. ◁표 삽입▷(원문을 참조하세요) 그림 2-1 일반적인 패턴 인식 흐름도 (1) 패턴 이식 발표 예 패턴의 기술을 위의 이론적인 Crammar의 배경을 가지고, 발표된 알고리즘에서 Tree grammar를 이용한 논문만을 예로 든다면 다음과 같다 (a) K.S.Fu "Tree grammar system for systactic pattern recognition"(18,19)와 "A tree system approach for finger print pattern recognition"(28) (b) 김 태균 "Syntactic 법에 의한 한글의 인식"(5) (c) 이 은주 "Syntactic 법에 의한 필기체 한글 인식"(2) 그런데, 한글을 대상으로 한 패턴 인식의 알고리즘(1,2,3,5,7,9,20-24)은 대부분이 인쇄체 한글을 대상으로 하였으며 필기체를 대상으로한 알고리즘(2,28)은 드물다. (b)와 (c)의 전처리 방법은 (b)는 (a)의 방법을 (c)는 정봉만 방법을 이용하였다. (2) 패턴 인식의 방시 패턴 인식의 방식을 일반적으로 크게 off-line 인식 방법과 on-line 인식 방법으로 분류하는데 on-line 인식 방법으로는 Graphic tablet를 이용하여 한글을 인식하는 방법(28)이 발표된 바 있으며, 이는 문자가 입력되는 동안에 즉시 인식을 하는 방식이고, off-line 인식 방식은 Scanning system에 의하여 받아 들여진 영상 Image를 Digitization하여 세선화 등의 과정을 거친 후 인식을 행하는 방식으로 본 논문의 세선화 방법은 이용자에 따라 on-line 또는 off-line 방식에서 이용할 수 있다. (2-2) 패턴 인식의 각 처리단계 (1) Digitization 처리 단계 컴퓨터가 Source 입력 패턴 대상을 처리 용이하도록 하기 위해 T.V카메라나 Photo scanning system등으로 받아 들여진 영상 Analog image를 일정한 간격으로 Sampling하여 Digitization하는 것으로 문자인 경우에 글자 부분는 "1"로, 배경 부분은 "0"으로 표시한다. 기타 각각의 용도에 따라 영상 Image를 양자화 하여 Gray level 256 중 Gray level 105 이상만 글자 부분으로 처리했으며 그 이하는 배경 부분으로 처리하여 32X32 Matrix의 글자 구성 형태를 만들었다. (2) Preprocessing 단계 양자화된 데이타 32X32 Matrix를 가지고 P(I,J)=C(Character) (I<T<32, I<J<32) C="1" 문자 정보 부분 C="0" 배경 부분 으로 표시하여 사용하며, 문자의 구성이 유한의 선폭을 가지므로 그대로 인식에 이용함에는 곤란하므로, 특징점 추출이 용이하도록 골격선이 "1"인 단일 선폭의 최종 글자 패턴을 남기는 작업이다. 세선화의 처리동안 여러 조건을 주어 만족하는 경우 "1"을 남기고, 조건 만족을 못하는 지워버리는 작업을 반복하는데 어떠한 모습으로 최종 골격선을 유지하는냐에 따라 인식의 성패를 좌우한다. 오인식의 대부분이 세선화이 형태에 의해 결정되므로 세선화의 중요성이 강조된다. (3) Feature point extraction 인식의 분류 단계에서 표본 패턴과 비교 처리 인식하기 위해 각 글자의 특징이 되는 점인 특징점을 찾는 단계인데 한글의 경우를 보면 한글의 구조적 특성이 직선.곡선성, 분기성, Arc성, 교차성, 꺾임성 등이므로 4방향의 단점과 8방향 단점, 꺾이는점, 분기점 등을 특징점으로 잡는다 특징점의 예를 들면 다음과 같다. ◁그림 삽입▷(원문을 참조하세요) (4) 분류 인식 단계 한글의 특징점을 기준으로 글자의 진행 방향이 그림의 8방향으로 각 Primitive들의 관계인 Pixel과 Pixel 사이의 관계를 조사하여, 필요한 Grammar를 적용 분류하는 과정인데, 한글에 대한 적용을 보면 한글의 구조적 특징이 대부분 직선성과 분기성, 꺾임성, 곡선등의 Tree 구조를 가지고 있으므로 Tree grammar를 적용한 Syntactic 방법의 인식 알고리즘(2,5)이 있다. 즉, "Syntactic 방법"은 Automaton 이론을 응용한 것으로 K. S Fu가 1974년에 정립한 이론으로 입력 패턴을 Primary Pattern과 Subpattern으로 나누어 글자의 구조적 상호 관계를 Grammar로 서술하고 인식을 한다. 분류 인식의 단계를 좀 더 자세히 설명하기 위해 Grammar에 대해 논해 보면 다음과 같다. Grammar는 Chomsky에 의해 4가지로 구분되어 이들에 의해 표현된 Language는 각각의 Automata에 의해 인식되는데, Production form에 아무런 제약이 없는 Unrestricted Grammar, Context sensitive grammar, Context free grammar(nonterninal과 terminal의 집합처리), Regular grammar 등으로 구분되는데, Context free grammar와 Context-sensitive grammar가 많이 이용된다. 또한, Conzalez와 K. S. Fu에 의해 발표된(26) Tree grammar는 하나의 Mode에서 매우 복잡한 연결을 갖는 Pattern을 효율적으로 기술하는 데 편리하여 기본적인 식은 다음과 같다. Gt=(Vr.P.S) V=VnUVt=0 Vn: Nonterminal Vt: Terminal P: Production rule Ti->Tj(Ti와 Tj는 V의 Partial tree) r: Vt의 rank node의 offspring 수 S: Starting Symbol 이와 같이, 분류 인식은 각 Grammar를 알맞게 선택 적용하여 글자의 형태를 표시한 후 Decision theoretic approach나 Syntactic approach 등의 각 Automata에 의해 표본 패턴(Primary pattern)과 비교하여 인식을 하는 단계이다. 2-3. 세선화의 필요성 2-2절에서 인식의 각 단계를 살펴 볼때, 인식의 오류 문제에서 오인식의 원인이 입력 패턴의 글자를 쓴 사람의 의도대로 자연적인 형태 유지와 원형에 비해 변형이 없이 골격선을 유지해야 하는데, 필기체의 경우 변형이 생겨 Ambiguity의 발생이 일어 난다. 특히, 한글의 경우는 인쇄체 세선화에 적합한 알고리즘인 직선 직각화 알고리즘(1)이 개발되었으나, 필기체 한글에 적용한 실험 결과를 보면 굵은 글씨와 좁은 선분의 글씨가 복합적으로 섞여 있는 글자에서는 심한 변형이 일어 났으며, 직선 직각화에 의하여 필기체의 유연성을 살리지 못하여 Ambiguity를 방생하므로 필기체 한글에는 적합하지 않다. 그러므로, 필기체 한글에 적합한 세선화 방법이 절실히 요구되며, 세선화 형태에 의해 인식률이 크게 좌우되므로, 세서노하를 적용한 인식 방법에는 세선화의 과정이 가장 중요하다고 할 수 있다. 2-4. 세선화 이론 본 논문에서 사용한 일반적인 세선화의 용어 정의와 처리를 설명하면 다음과 같다. (1) Pixel 양자화 패턴에서 P(I,J)=C(I<I<32, I<J<32)의 32X32 Matrix에서 C=1인 P(I,J)와 C=0인 P(I,J)를 각각 Pixel이라고 한다. (2) Islated pixel(고립점) P(I,J)에 대하여 4방향성 이웃, 8방향성 이웃이 모두 "0"인 단일점을 말하며, 이는 Sencer의 잡음으로 간주하여 Smoothing에서 제거된다. ◁그림 삽입▷(원문을 참조하세요) (3) Interior pixel P(I,J)의 4방향성 이웃이 모두 "1"일때의 P(I,J)가 내부적으로 8방향성 조건과의 관계에서 제거점을 판단한다. (4) Border Pixel(경계점) P(I,J)에 대하여 4방향성 이웃이 하나 이상 3개 이하 존재할 때 P(I,J)를 경계 Pixel이라 하며 연결성을 위해 남아 있어야 한다. ◁그림 삽입▷(원문을 참조하세요) (5) Arc pixel(곡선점) 곡선의 특성을 유지하는 점으로 P(I,J)에 대해 한개의 4방향성 이웃이 존재하고, 반대편에 한 개의 8방향성 이웃이 존재할 때 P(I,J)를 Arc pixel이라 한다. ◁그림 삽입▷(원문을 참조하세요) (6) Commectivity(연결성) 그림에서 P(I,J)에 대하여 4방향성 연결성은 P(I,J-1), P(I-1,J), P(I,J+1)를 말하고, 8방향성은 P(I-1,J-1), P(I+1,J-1), P(I-1,J+1), P(I+1,J+1)을 말하는데, P(I,J)에 대하여 이웃 Pixel이 "1"이 존재할 때 Pixel사이에 연결성이 존재한다고 한다. ◁그림 삽입▷(원문을 참조하세요) (7) Neighbors(이웃) Po를 중심으로, P2, P4, P6, P8을 Directed neighbor인 4방향을 이웃이라 하고, P1, P3, P5, P7을 None directed neirhbors인 8방향 이웃이라고 한다. ◁그림 삽입▷(원문을 참조하세요) (8) Local operation(국부 연산) 임의의 주목점 그림 (7)에서 P(I,J)에 대하여 주의의 4방향성 이웃점들과 8방향성 이웃점들과의 관계를 각 조건식 (3,4절에 조건식 정리)을 적용하여 P(I,J)의 값을 결정하여 처리하는 연산 방법이다. (9) 3X3 Window (3X3 Marix) 각 조건을 처리시 3X3 Matrix를 선정하여 P(I,J)를 중심으로 P(I,J)=(P(I-1,J-1)∧P(I-1,J)∧P(I-1,J+1)∧P(I,J-1)∧P(I,J+1)∧P(I+1,J-1)∧P(I+1,J)∧P(I+1,J+1))의 관계식으로 표현할 수 있다. ◁그림 삽입▷(원문을 참조하세요) (10) Parallel processing Local operation에 의한 Pixel과 Pixel의 관계를 32X32 Matrix로 구성된 글자 패턴에서 한 레코드씩 연산을 끝낸 후에 일괄 처리하는 방법이다. 이에 대하여 Serial processing은 조건의 경우마다 연산을 진행하면서 즉시 처리하는 벙법이다. (11) Smoothing(평활화) 입력 패턴을 Photo scan system이나 기타 Scanner system에 의하여 영상 영상 입력 처리시에 발생한 잡음 등으로 인하여, 누략점 부분이 발생하거나 필요없는 잡음이 일어나기 때문에 이러한 점들을 보상해 주기 위한 방법으로 세선화 초기에 해둔다. 방법으로 P(I,J)가 "0"이고 4방향 이웃점들이 모두 P(I+1,J)*P(I-1,I)*P(I,J+1)*P(I,J-1)=1일 때 누략점 삽입으로 간주하고, P(I,J)=1이고 P(I+1,J)*P(I-1,J)*P(I,J+1)*P(I,J-1)=1이고 (P(I+1,J+1)+P(I-1,J-1)++P(I+1,J-1)+P(I-1,J+1)<1일 경우 고립점으로 간주하여 "1"->"0"으로 제거한다. 여기서 제거한다 함은 "1"을 "0"으로 바꾸어 줌을 의미한다. (12) END Point(4-meighbor or 8-neighbor) 글자가 시작되는 점과 끝나는 점을 4방향 단점 또는 8방향 단점으로 처리 했으며 특징점이 될 수 있다. 조건 처리는 2차 세선화 시에 표시했다. ◁그림 삽입▷(원문을 참조하세요) (13) Branch and curve expected point(분기와 곡선예상점) Computer point의 일정으로 분기 예상점이나 곡면성을 유지하는 점으로 조건식은 2차 처리 과정에서 설명되었으며 그림으로 보면 다음과 같다. ◁그림 삽입▷(원문을 참조하세요) (14) Deleted point Local operation에 의하여 각 조건식의 경우를 처리할 때 단점, 단순점, 분기와 곡선 예상점이 아니면 제거되는 점이다. (15) Complex point 정봉만의 알고리즘(1)에서 직선 직각화를 유지하기 위해 만들어진 조건점이다. 2-5. 최소 선폭(Minimum width) 처리 정의 (3-1)장의 Minimum width thinning processing에서 각 조건의 경우가 설명되었지만, 간략히 설명하면 양자화된 입력 패턴에서 글자 부분은 "1"로, 배경 부분은 "0"으로 하여 32X32 Matrix로 구성된 그림(2-4) 패턴에서, 1의 수평 방향으로의 최소 넓이는 3이고 2의 수평 방향에서 최소 선폭은 4이므로, 이 최소 넓이를 기준으로 각 조건식을 적용시켜 원형의 입력패턴 형태를 변형없이 최소의 선폭으로 가늘게 유한이 폭을 가지는 골격선을 유지시켜 Local operation에 의한 굵은 글씨의 변형을 피하고, 필기체 한글 본래 형태인 자연성을 유지하고자 합에 있다. ◁그림 삽입▷(원문을 참조하세요) 자연성이라 함은 손으로 써진 한글 본래의 보습이 변형되지 않고, 원형 모습에 변형이 되지 않은 골격선의 유지를 말한다. 2-6. 기존 세선화 알고리즘의 특성 비교 설명 세선화 알고리즘에 대해서는 그동안 여러 논문이 발표되었으나 대표적인 논문의 예로 5가지만 특성을 논한다. 본인의 논문이 한글 필기체에 적합한 세선화 방법이지만, 인쇄체로 아울러 인쇄체 글자 특성을 만족시ㅕ 세선화가 되어야 하므로, 인쇄체에 알맞는 세선화 알고리즘을 발표한 정봉만의 각 알고리즘 실험 겨로가를 본인이 실험하지 못한 알고리즘에 대해서 실험 결과만 인용한다면 무방하므로, 실험 결과치를 인용하였다. 단, 본 논문의 특성을 비교하기 위해 정봉만이 실험한 결과 입력 패턴인 "ㄷ", "ㄹ", "ㅂ", "ㅅ", "家", "한", "국"을 그대로 본 논문의 알고리즘을 적용하여 각 알고리즘과 비교할 수 있도록 하였으며, 실제 손으로 쓴 글씨 중 720자를 정봉만의 알고리즘과 본인이 쓴 알고리즘으로 각각 실험하여 그 장단점을 비교할 수 있도록 하였다. (1) 정봉만의 알고리즘(1) 직선 직각화를 중심적으로 처리한 알고리즘으로 직선성과 직각성이 잘 유지되었고, 인쇄체 입력 패턴의 원형을 유지하여 인쇄한 한글 인식에는 적합한 알고리즘으로 간주하나, 필기체 한글을 직접 실험한 결과를 비교해 보면, 글씨의 선폭이 비교적 넓은 곳의 경우 직선성과 곡선성을 유지해야 함에도 직선성이 아닌 불필요점이 수시로 발생하였고, 곡선성을 직선성으로 유지하려고 하여, 원형 패턴의 변형이 발생했다. 이 알고리즘은 일정한 선폭을 가지는 인쇄체 한글에 적용함이 좋고, 필기체 한글에는 적합하다고 볼 수 없다. (2) Rosenfeld 알고리즘(10) 영문 인쇄체에 알맞는 알고리즘으로 대체적으로 연결성은 유지되었으나 8방향성 세선화 부분은 찌그러짐으로 볼 수 있는 불필요점이 남고, 직각으로 구부러진 부분에도 원형 패텬의 자연성을 유지하지 못하고 찌그러져 한글의 특징점 추출이 곤란함을 알 수 있다. (3) 산본(山本) 알고리즘(17) 그림에서 보듯이 원형의 입력 패턴에 비해 많은 변형이 일어났고 "ㅗ"가 "ㅡ"로 세선화 되어 Ambiguity가 발새했다. (4) Arcelli 알고리즈(25) 영문과 같은 곡선성의 문자에 중점을 둔 것으로 너무 곡선을 강조하여 직선성이 곡선으로 바뀌었음을 그림에서 볼 수 있다. 원형 패턴의 많은 변형이 일어나서 글자의 특징점을 잡기가 곤란하며 특히 "ㅁ"이 "ㅇ"으로 되는 경향이 있으므로 한글 필기체에는 적합치 못하다. (5) 이주근, 김만영 알고리즘(9,7) 그림에서 결과를 보면 원형 패턴에 비해 글자 부분의 손실이 많아 원형 패턴에 비해 많은 변형이 일어났고, 알고리즘 처리 결과와 비슷한 결과가 발생했다. 이와 같이, 각각의 특성을 살펴 볼 때 위의 알고리즘들은 한글 필기체 인식에는 적당하다고 볼 수 없어 필기체의 인식을 위한 적당한 세선화 방법이 필요하게 되었고, 본 논문이 필기체에 적당한 세선화 알고리즘임을 실험 결과를 통해서 알 수 있으며, 실험 결과에서 정봉만 알고리즘의 결과와 일일이 비교 설명하였다. 6. 각 세선화 알고리즘 실험 결과치 *Input patterns(source) ◁그림 삽입▷(원문을 참조하세요) 1) Jung's method. ◁그림 삽입▷(원문을 참조하세요) 2) Rosenfeld method. ◁그림 삽입▷(원문을 참조하세요) 3) Arcelli method. ◁그림 삽입▷(원문을 참조하세요) 4) Yamamoto method. ◁그림 삽입▷(원문을 참조하세요) 5) Lee Ju-Kweun method. ◁그림 삽입▷(원문을 참조하세요) 3. 필기체 한글 인식에 적합한 세선화 개발 내용 기존의 전처리는 일반적으로 글자의 선폭의 굵기가 굵은 선폭등 복합적으로 구성된 입력 패턴을 선폭의 상이점을 무시한 채 Local operation에 의해 처음부터 각 방향으로 반복적인 제거 작업으로 세선화를 시도하여, 필기체 한글의 입력 패턴의 자연적인 특성을 유지하지 못하는 단점이 있었으마, 본 알고리즘의 특성은 최소 선폭을 기준으로 글자 전체의 글자 구성 선폭이 불규칙하게 넓고 좁다 하더라도 일반적으로 원형의 패턴 변형없이 중간 형태의 유한의 선폭을 가지는 골격선으로 빠른 시간에 처리 유지한 후, 최소의 선폭만이 남은 패턴을 가지고 Local operation에 의한 조건 처리로 원형의 입력 패턴을 그대로 변형없이 유지한 체, 단일 선폭을 가지는 골격선(Skeleton line)을 얻을 수 있었으며, Branch and curve expected point(분기및 곡선 예상점)을 적용하여, 직선 직각화 대신에 곡선성을 유지할 수 있도록 하였다. 이와 같은 방법을 Double preprocessing이라 명명하였는데, 이는 Complex processing으로 1차적 처리로 The thinning processing for minimum width characters의 처리 방법을 적용한 후, 2차적으로 The thinning processing for unitary skeleton 처리 방법을 복합 적용한 2차원적인 처리 방법을 이용했기 때문에 Double 전처리라 하였다. 3-1. The thinning processing by minimum width method 제1차적인 세선화 과정으로 최소 선폭을 기준으로 굵은 선분 요소를 가지고 있는 글자 부분을 효과적으로 최소의 유한의 선폭으로, 글자 패턴의 변형 없이 골격선을 유지하는 방법인데, 필기체 한글 특성인 곡선 성분을 유지해 주고, 직선 직각화도 아울러 유지해주는 방법으로 했으며, 곡선성에 치우치지 않고 필기체의 자연성인 입력 패턴의 원형을 그대로 유지할 수 있도록 한 것이 본 논문의 장점이다. 이 방법은, 수평적인 처리 방법과 수직 처리 방법으로 되었으며, 각각 그 처리 방법은 다음과 같다. (1) Horizontal processing 32X32 Matrix로 구성된 필기체 한글 입력 패턴을 수평적으로 Scanning하면서 "1"로 연결된 글자 부분의 연결 길이를 조사하여 최소 단위로 연결된 길이를 찾아서 수평적으로 최소 선폭에 의한 기준 조건을 적용하여 불필요점을 제거한다. Scanning의 방법은 J방향으로는 32개 전부, I방향으로는 짝수 칸을 먼저 조사한 후, 홀수 칸을 조사하여 최소 넓이를 찾아 낸다. ◁그림 삽입▷(원문을 참조하세요) 가. 최소 넓이를 찾는 방법 (1) 수평으로 각 줄단위 최소 선폭 찾는 방법 Scanning을 수평적으로 줄단위로 한줄씩 I방향으로는 2칸씩 교대로, J방향은 한줄씩 순차적으로 조사하여, 다음 공식을 적용해 I방향의 각 줄에서 최소 선폭을 구하는데, 각 공식은 HP3000-II 컴퓨터의 Function을 이용했다. 공식(1): Ws(K)=Mino(MM.W) (K=1,2,3,-15) MM=100(최소 W에 대응하여 최대값 임의로 줌) W: 컴퓨터 검색하면서 "1"인 곳의 글자 구성 선폭을 계산 변수 이때 Ws=o 이면 최대값 Ws(K)=200으로 하여 이웃의 글자 구성 선폭이 비교될 수 있도록 함. (2) 각 줄 중에서 최소 넓이 구하는 방법 각 줄 단위로 공식 (1)에서 구한 값을 이용 각 줄의 최소 선폭을 공식(1)과 같은 방법으로 구한다. 각 줄의 최소 선폭 값은 계산이 끝날때까지만 컴퓨터가 일시 기억한다. 공식(2): Ds(C)=Mino(MM,Ws(1),Ws(2),,,Ws(15) MM=100 Ws(K): (1)에서 구한 각 글자 구성 요소 선폭들 Ds(C)=0 이면 Ds(C)=300으로 최대 처리로 최소 선폭에서 제외함. (3) 글자 구성의 전체에서 최소 넓이 찾는 방법 위 공식(2)식에서 구해진 각 줄마다의 최소 넓이 값을 이용 전체 중 최소 넓이를 구한다. 공식(3): Rs(SS)=Mino(MM. DS(1),Ds(2),,,Ds(15)) SS=1,2 (짝수 번째, 홀수 번째 Scan의 방법) Ds(C): 2번에서 조사된 각 줄들의 최소 넓이들 (4) 최소 넓이 보상 방법 글자 구성 단위 중 어떤 잡음에 의하여 "1"로 된 곳을 피하고 단점의 경우로 인하여 최소 넓이가 "1"로 됨을 방지하여 Rs(1), Rs(2)중 더 큰 값으로 처리됨을 방지하고자 합니다. 공식(4): Rs(1)>2 AND Rs(2)>2 일 때 Ts1=Mino (Rs(1),Rs(2)) 위의 조건이 아니면 Ts1=MAXO(Rs(1),Rs(2)) (4) 단계에서 최소 넓이를 찾는 절차는 끝났다. 그림으로 각 단계를 보면 다음과 같다. ◁그림 삽입▷(원문을 참조하세요) 나. 수평으로 조사된 최소 넓이에 의한 처리 방법. (1) 최소 넓이가 홀수일 때 처리 조건식) L=TS1/2-1을 사용하여 처리 이동 범위 결정후 F(I,J)=F(I,J)*F(I,J+L)*F(I,J-L)로써 두꺼운 곳이 일시에 삭제된다. TS1=최소 넓이 값 (2) 최소 넓이가 짝수일 때 처리 조건식) M=TS1/2, N=TS1/2-1의 식을 이용하여 (a)(F(I,J)+F(I,J+1)+F(I,J-1))>2 (b)(F(I,J)+F(I+1,J)+F(I-1,J))>2를 동시에 만족하면 F(I,J)=F(I,J)*F(I,J+M)*F(I,J-N)*F(I+M,J)*F(I-N,J)의 식을 적용해 최소 넓이를 기준으로 골격선을 최소선폭으로 유지한다. (3) 최소 넓이가 1일때 처리 곡선 성분을 살리기 위해 다음 조건이 만족되면 처리한다. 조건식 (3-a) IS1=F(I,J)*F(I,J+1)*F(I-1,J)*F(I+1,J)=1 IS2=F(I+1,J-1)+F(I-1,J-1)>1 IS3=F(I+2,J-1)*F(I-2,J-1)=1 F(I,J)=0 조건식 (3-b) IS4=F(I,J)*F(I+1,J)*F(I-1,J)*F(I+1,J)=1 IS5=F(I+2,J+1)+F(I-2,J+1)>1 IS6=F(I+1,J+1)*F(I-1,J+1)=1 위의 각 조건식에서 (3-a)를 만족할 경우는 F(I,J)=F(I,J)*F(I,J-1) (3-b)를 만족할 경우는 F(I,J)=F(I,J)8F(I,J+1) 위의 두 조건을 만족하지 못할 때는 F(I,J)=F(I,J)로 처리하여 다음 2차 세선화시에 처리하도록 한다. (2) Vertical processing Horizontal processing의 방법을 90도 회전 적용하면 가능토록 되어 있는 것으로 이미 수정 처리에서 수평적으로 가늘어 진 중간 골격선으로, 가늘어진 부부에 손상을 주지 않고 처리하도록 한다. (1) 수직적으로 구성된 글자의 최소 선폭 추출 방법 ◁그림 삽입▷(원문을 참조하세요) 위의 그림은 32X32 Matrix로 구성된 글자의 입력 패턴으로 수직으로 구성된 글자의 Minimum width는 I방향으로는 32개의 Pixel을 하나 하나 모두 조사하고 J방향은 두 칸 또는 세 칸씩 건너 뛰면서 표본 색출한다. 이것은 빠른 시간에 처리하도록 함이다. 이 때, 최소 선폭 추출 계산 방법은 수평 처리에서 설명했지만 수직 최종 최소 선폭식을 본다면 LS(SS)=MINO(MM,DS(1),DS(2),,,,DS(15)) SS=1,2; 22=1일 때는 짝수칸의 값이고 SS=2일 때는 홀수 칸의 최소 선폭 값이다. 최소 선폭 기준으로 1차 처리할 경우 주의할 점으로 최소 선폭 값이 LS(1)=2, LS(2)=3일 경우 최소 선폭이 3인 것으로 처리하면 2인 곳은 손실을 초래하므로 다음의 조건에 의하여 실제 처리시 최종 최소 선폭값을 결정하여야 한다. (2) 보상 처리를 위한 최종 최소 선폭 결정 조건식 LS(1)>2, LS(2)>2 일 때 조건이 아니면 한쪽이 최소 선폭이 1인 경우 TS2=MAXO(LS(1), LS(2))으로 최소 선폭을 결정한다. (3) 최종 최소 넓이가 홀수 값일때 처리 방법 L=(TS2-1)/2 : 선폭의 처리 범위식 조건(3-a) (a) F(I,J)*F(I-L,J)*F(I,J-L)*F(I,J+L)=1 (b) F(I+L,J+L)+F(I+L,J+L)>1 (c) F(I+L,J-2*L)+F(I+L,J+2*L)>1 (d) F(I-L,J-L)*F(I+L,J+L)=1 (e) F(I,J+L)=0 조건 (3-a)를 전부 만족시에 다음 조건을 적용한다. F(I,J)=F(I,J)*F(I+1,J) 조건 (3-b) (a) F(I,J)*F(I,J-L)*F(I-L,J)*F(I+L,J)=1 (b) F(I-L,J+L)+F(I+L,J+L)>1 (c) F(I-2*L,J+L)+F(I+2*L,J+L)>1 (d) F(I-L,J-L)*F(I+L,J-L)=1 (e) F(I,J+L)=0 조건을 전부 만족시에 곡선 성분을 살리기 위해 F(I,J)=F(I,J)*F(I,J+L) 위 조건을 만족하지 못할 때는 다음 방법을 적용한다. F(I,J)=F(I,J)*F(I+L,J)*F(I-L,J) (4) 최소 선폭이 짝수일 때 처리 방법 2,4,6,8등의 짝수 넓이일 때 선폭 이동 넓이 공식 M=TS2/2,N=TS2/2-1을 적용하여 다음 조건식을 만족시에 처리한다 조건(4-a) (a) F(I,J)*F(J-M,J)*F(I,J-N)*F(I,J+N)=1 (b) F(I+M,J-m)+F(I+M,J+M)>1 (c) F(I+M,J-2*N)+F(I+M,J+2*N)=1 (d) F(I-N,J-M)*F(I-N,J+M)=1 (e) F(I-M,J)=0 조건 (4-a)를 전부 만족하면 곡선 성분을 살리기 위해 다음 식을 적용한다. F(I,J)=F(I,J)*F(I+M,J) 조건(4-b) (a) F(I,J)*F(I,J-M)*F(I-N,J)*F(I+N,J)=1 (b) F(I-M,J+N)+F(I+M,J+N)>1 (c) F(I-2*N,J+M)+F(I+2*N,J+M)=1 (d) F(I-M,J-N)*F(I+M,J-N)=1 (e) F(I,J-M)=1 위의 조건을 만족하면 곡선 성분을 살리기 위해 다음을 적용한다. F(I,J)=F(I,J)*F(I-M,J) 위의 두 조건을 만족하지 못할 때는 직선 성분으로 간주하여 다음식을 적용한다. F(I,J)=F(I,J)*F(I+M,J)*F(I-N,J)*F(I,J+M)*F(I,J-N)*F(I-N,J-N) (5) 최소 선폭이 1일 때 처리 방법 곡선 성분을 유지하기 위해 처리하는 방법으로 1이상의 선폭을 유지하는 곳만 처리한다. 조건 (5-a) IZ1=F(I,J)*F(I-1,J)*F(I,J-1)*F(I,J+1) IZ2=F(I+1,J-1)+F(I+1,J+1) IZ3=F(I+1,J-2)*F(I+1,J+2) 조건 (5-b) IZ4=F(I,J)*F(I+1,J)*F(I,J-1)*F(I,J+1) IZ5=F(I-1,J-1)+F(I-1,J-1) IZ6=F(I-1,J-2)+F(I-1,J-2) IZ1=1, IZ2>1, IZ3>1인 조건 (5-a)를 모두 만족시키고, 다음의 두 조건을 만족시킬 때 F(I+1,J)=0 F(I-1,J-1)*F(I-1,J+1)=1 다음의 방법을 적용한다. F(I,J)=F(I,J)*F(I+1,J) 조건 (5-b)에서 IZ4=1, IZ5>1, IZ6>1을 만족시키고 F(I-1,J)=O F(I+1,J-1)*F(I+1,J+1)=1을 만족시키면 곡선 성분을 유지하기 위해 다음을 적용한다. F(I,J)=F(I,J)*F(I-1,J) 위의 두 조건을 만족시키지 못하면 F(I,J)=F(I,J)로 되어 제거되지 않는다. (3) 수평 수직의 최소 선폭 처리에 의한 세선 효과 세선화 알고리즘의 대부분이 입력 패턴의 선폭이 불규칙한 필기체임을 고려하지 않고 Local operation에 의한 방법으로 반복적으로 골격선 주변을 제거하는 방법으로, 글자의 굵기가 불규칙적인 한글 필기체의 경우는 불필요점을 많이 생기고, 원형 패턴에 비해 많은 변형이 일어나게 되었다. 이러한 원인을 제거하기 위하여 본 논문에서는 수평과 수직으로 Minimum width에 의한 조건 처리로 굵은 선폭을 효율적으로 빠른 시간에 줄여서, 2차 세선화시에 불필요점이 발새되는 원인을 제거했고 곡선 성분은 필기체의 자연적인 형태를 유지하도록 했으며, 직선이 곡선화되는 경향은 피했다. 결과적으로, 최소 선폭을 기준으로 처리한 중간 결과인 유한의 최소 선폭을 유지하는 골격선은 최종 Unitary skeleton의 형태를 결정지어 주므로, 본 논문의 세선화 진행 결과에서 보듯이 중요한 세선화 부분으로 볼 수 있으며, 필기체 한글의 특성을 유지해 주는 중요한 세선 효과를 만들었다. 처리 시간도 Local operation에만 의존한 것보다 1/5정도 빨리 처리할 수 있었다. 3-2. Thining processing for unitary skeleton 이 부분은 2차 처리라고 할 수 있는데, 1차 처리 결과인중간 패턴을 가지고 On-line 방식으로 직접 복합 처리하므로 처리 시간에는 아무런 지장이 없다. 최소의 선폭만 남은 중간 패턴을 Local operation 방법으로 Parallel과 Sequential processing을 복합적으로 적용하여 반복적인 제거 작업으로 필기체 특성의 한글 형태를 유지하는 세선화를 하였다. 이 부분의 특성은, 곡선 성분을 우지하기 위해 Branch and curve expected point의 방법을 시도하여 곡선성을 유지할 수 있었다. 그런, 필기체 한글이 직선 직각화일 때는 항상 유지하도록 했으며 곡선이 아닌 곳을 곡선화되게 하는 경향은 피했으므로 필기체 한글의 입력 패턴에 대한 자연성을 그대로 유지할 수 있었다. (1) 세선화의 조건과 처리 방법 의도적인 직선 직각화는 피하는 처리 조건으로 했다. (가) Thinning의 기본 조건들 (a) 연결점은 항상 보존되어야 한다. (b) 곡선성은 유지되어야 한다. (c) 문자 부분의 Pixel group은 존재하여야 한다. (d) 직선 성분, 직각 성분은 보존되어야 한다. (나) 단순점 처리 방법 앞 2절 용어 정의에서 단순점에 대해서 설명했듯이 다음의 조건을 단순점으로 처리하였다. 조건 (나-a) (a) F(I,J)=1 (b) F(I-1,J)=O (c) F(I+1,J)=0 (d) F(I-1,J-1)+F(I-1,J+1)=0 (e) F(I-1,J-1)*F(I,J-1)+F(I-1,J+1)*F(I,J+1)=0의 조건 전부 만족할 때 단순점으로 연결성을 위해 처리함. ◁그림 삽입▷(원문을 참조하세요) (다) Branch and expected point 처리 방법 이 부분은 곡선성과 분기 예상점을 유지하기 위해 처리하는 방법으로, 아울러 직선성과 직각성도 유지해주는 특성이 있다. 조건, 수직 방향으로 처리 조건 (↓,↑,←,→ 방향 순서로 처리) L1=F(I+1,J)+F(I-1,J) LS=F(I+2,J)+F(I-1,J) M1=F(I+1,J-1)+F(I-1,J-1)에서 L1>2, (L1-M1)>1, L2>1의 조건을 만족하면 F(I,J)=F(I,J)+1로 만든 후에 최종적으로 1로 바꾸어 처리했고 조건 만족이 아니면 제거했다. ◁그림 삽입▷(원문을 참조하세요) (라) 4방향, 8방향 단점 조건 처리 방법 글자 구성의 시작점과 끝점인데, 특징점으로 이용할 수 있다. 조건) L1=F(I,J+1)+F(IJ-1) M1=F(I+1,J+1)+F(I+1,J-1)에서 L1+M1=0일 때 F(I,J)=F(I,J)+2로 변환시켜 다시 최종 처리시에 "2"로 변화시켜 처리 후 특징점으로 잡는다. ◁그림 삽입▷(원문을 참조하세요) (마) 제거점의 조건과 처리 (가),(나),(다),(라)의 조건들이 아닐 경우 제거 대상이 되며, Top, Down, Right, Left 방향으로 조건을 적용하면서 제거해 나간다. 제거점이 모두 제거되면 최종 골격선만 남고, 글자 입력 패턴의 원형에 변형이 없이 남아 있어 인식에 이용할 수 있다. 4. 실험 방법및 결과 (1) 실험 방법 실험은 실제로 학생들이 펜으로 백지위에 조심스럽게 쓴 한글을 Photo Scan System P-100을 이용하여 256 Gray level로 Digitization한 것을 Gray level "105" 이상만 글씨 부분으로 간주하여 "1"로 표시했고, 그 이하는 "0"으로 처리하여 글자당 32X32 Matrix를 구성하였다. 실험 글자 수는 720글자로 했으며 적용 프로그램은 HP 3000-II Computer System을 이용하여 Fortran-IV Langurage로 적용하였다. (2) 실험 진행 좋은 결과를 얻기 위해 알고리즘을 계속 수정 적용하면서 반본적인 실험을 하였다. (3) 실험 결과 선폭이 굵고 가늘게 혼합 구성된 한글 필기체의 경우도 효과적으로 임력 패턴의 변형없이 세선화가 되었으며 불필요점이 없이 한글 필기체 입력 패턴의 자연성을 유지하고 직선과 직각인 글자 부분은 물로 곡선이 곳도 그 특성에 맞게 유지될 수 있었다. (4) 기존 알고리즘 적용 결과와 본 알고리즘 결과 비교 적용 결과의 각 그림의 차이점은 다음과 같다. 입력 대상 패턴 그림 (6-1)에 1,2,3,4,5를 정봉만 알고리즘 처리 결과와 비교해 보면 다음과 같다. 가. 그림 (6-1) Source data의 결과인 그림 (6-2) 결과 비교 1. a 부분은 필기체 특성이 Curve적인 특성이 있으므로 W-1과 같이 되어야 하고, J-1은 직각화의 이론 처리 결과이다. b 부분은 직선적이어야 하는데 J-1은 옆으로 불필요점이 존재한다. 2. 의 그림은 a 부분에서 J-2의 경우는 불필요점이 생겨 났고 b, c 부분도 변형이 일어 났다. 3. a, b, c, d, e 결과처럼 J-3에서 불필요 단점이 일어 났다. 4. a 부분에서 J-4는 불필요점이 일어나 특징점 선택이 곤란하게 되었다. 5. a 부분에서 J-5는 훨씬 더 찌그러 짐을 볼 수 있다. 이상의 결과를 비교하여 볼 때 정봉만의 방법은 인쇄체에서 일정한 선폭을 가진 글자 패턴에 알맞는 방법이고 본 논문의 방법은 필기체에 효과적임을 알 수 있다. 나. 그림 (6-3) 처리 비교 설명 1. W-1,,,W-4는 본 논문의 처리 진행 결과인데 W-1 : Source data W-2 : 수평 최소 선폭이 3이므로 이의 홀수 조건 처리후 골격 주위점이 제거된 결과 W-3 : 수평 조건 처리후 수직 최소 선폭이 2인 조건을 적용하여 처리한 결과 W-4 : 완전히 새선화된 결과 2. J-1,,,J-4는 정봉만의 진행 결과임 J-1 : W-1과 같은 Source data임 J-2 : Smoothing 조건 처리 결과 J-3 : 특징점이 잡히지 않은 세선화 결과 J-4 : 특징점이 추출된 세선화 결과 3. 두 진행 결과인 W-4, J-4를 비교해 보면 W-4는 원형 패턴의 변형없이 불필요점이 낳지 않고 세선화가 되었으며 J-4는 불필요점이 발생했으며 결고적으로 원형 패턴의 심한 변형을 초래했다. 다. 그림 (6-4) 처리 비교 설명 (나)와 같은 진행 처리로 W-4는 글자의 원형 패턴을 유지한 세선화이나, J-4 는 원호 속으로 변형을 초래한 불필요점이 발생했다. 라. 그림 (6-5)의 처리 비교 설명 정봉만이 인쇄체 글씨를 대상으로 입력한 Source data를 가지고 본 논문의 알고리즘으로 적용한 결과, 인쇄체의 특성인 직선 직각화를 유지할 수 있었으며 알고리즘 (1)보다 원호 부분은 개선되었음을 볼 수 있다 마. 비교 결과 정리 가,나,다,라에서처리 결과그림을 비교 설명했듯이, 본 논문의 처리 결과는 인쇄체는 물론 필기체 한글 세선화에도 좋은 효과를 보였다. 그러므로 본 논문의 알고리즘을 필기체 한글 인식을 위해 적합한 세선화라 할 수 있다. 5. 실험 고찰및 결론 실제의 필기체 한글을 대상으로 실험한 결과를 기존 알고리즘(1)으로 처리한 것과 비교하여 본 겨로가, 인쇄체의 경우도 변형이 없이 세선화가 되었으며 필기체의 경우는 기존 알고리즘이 불필요점과 변형을 남겨, 패턴의 특징을 잡기가 곤란하나 본 논문의 경우는 필기체의 자연성을 그대로 유지한 채 불필요점이 없이 곡선성을 유지하였고, 변형이 없었으므로 필기체에는 좋은 세선 결과를 보였다. 그러므로, 필기체 한글의 경우 직선성, 곡선성등을 곡선성에 너무 치우치지 않고 복하벅으로 처리 유지할 수 있어서, 필기체의 자연성을 그대로 변형없이 유지하여 난해하기 쓰지 않은 조심스러운 한글 필기체이라면 인식에 어려움이 없으리라 기대된다. 본 논문의 알고리즘은 어러한 결과로 보아서 필기체 인식에 적합한 세선화 알고리즘이라고 할 수 있으며, 산업 분야의 인공 두뇌, 인공 눈등에 응용 할 수도 있다. 6. 실험 결과 그림 그림 (6-1)은 Source 입력 데이타이고 (6-2)는 W-1, W-2, W-3, W-4, W-5는 본 논문의 알고리즘 처리 결과며, J-1, J-2, J-3, J-4, J-5는 정봉만 방법의 적용 결과이다. 그림 (6-3)은 세선화 진행마다 나타난 결과를 순서적으로 보인 것이며, 그림 (6-4)도 마찬가지의 진행 결과이다. 즉, W-1은 Source data, W-2는 수평 최소 선폭 적용 처리 결과, W-3은 수직 최소 선폭 적용 처리 결과, W-4는 세선 최종 결과임. 그림 (6-5)는 정봉만 입력 실험 데이타를 인쇄체의 경우를 보기 위해 본 논문 알고리즘으로 처리된 결과임. ◁그림 삽입▷(원문을 참조하세요) 그림(6-1) 32X32 Matrix 로 구성된 입력 Source Pattern ◁그림 삽입▷(원문을 참조하세요) 그림(6-2) J-1,J-2,J-3,J-4,J-5는 정 봉만 방법 적용결과 W-1,W-2,W-3,W-4,W-5는 본논문 적용결과 입력패턴은 그림(6-1)의 니,폐,체,바,다,이다 ◁그림 삽입▷(원문을 참조하세요) 그림(6-3) 본논문 방법과 정봉만 방법 적용 진행결과 ◁그림 삽입▷(원문을 참조하세요) 그림(6-4) 세선화 진행단계의 각 결과를 보여줌 ◁그림 삽입▷(원문을 참조하세요) 그림(6-4-1) 세선화 진행단계의 각 결과를 보여줌 ◁그림 삽입▷(원문을 참조하세요) 그림(6-5) 정봉만 입력패턴에 본 알고리즘 적용 결과 7. 부록(본논문의 흐름도와 프로그램) ◁그림 삽입▷(원문을 참조하세요) 7-1 부록 본 논문의 실험 입력패턴을 가지고 Rosenfeld,Yamamoto,Arceli,이 주 근의 알고리즘을 각각 적용하여 세선화된 결과를 그림으로 보였다. ◁그림 삽입▷(원문을 참조하세요) 8. 참고문헌 1. 정 봉 만 : 충남대 석사 1982.12 "Micro computer를 이용한 한글 패턴의 세선화에 관한 연구" 2. 이 은 주 : 충남대 석사 1983.12 "Syntactic 법에 의한 필기체 한글의 인식" 3. 이 상 현 : 한양대 석사 1982.12 "SHIFT 연산에 의하여 수정된 Thinning algorithm" 4. THEO PAVLIDIS : Bell Laboratories,Murry Hill,new, Jersey 1981 "An Asynchoronous Thinning Algorithm" 5. 김 태 균 : 동경 공업 대학 수사 1978.2 "Syntactic 법에 의한 한글 인식" 6. 이 정 현 : 인하대 석사 1982 "An algorithm for automatic pattern recognition of printed korean characters" 7. 이 주 근.김 만 영 : 인하대 석사 1982 "논리 연산에 의한 In this paper, the double preprocessing is defined for the complex processing of the thinning processing for minimum width and thinning processing for unitary skeleton. In the result of experiment, the main merits of applying the combind operation to handwritten Korean characters ane In the : (1) Straightness, Curve. Arc. etc. can be preserved. (2) Algorithm can be reserved source data image format after thinning processing. (3) Handwritten korean characteristic can be preserved. (4) Characteristic points can be easily obtained by simple point processing and end point. This algorithm can be used effectively on handwritten korean characters recogition and the more data entering in the computer by high speed, line image thinning, industry computer sysytem. etc.

내보내기
내책장담기
한글로보기

정확도순

내림차순

내림차순

10개씩 출력

맨처음 페이지로 1 맨끝 페이지로

상세검색

RISS 보유자료

상세검색

해외전자자료

연관 검색어 추천