http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
노태길(Tae-Gil Noh),이상조(Sang-Jo Lee) 한국정보과학회 2000 한국정보과학회 학술발표논문집 Vol.27 No.2Ⅱ
고유명사를 추출하고 그 범주를 파악할 수 있다면, 이는 정보 추출이나 정보 검색, 문서 요약과 같은 분야에 도움을 줄 수 있다. 본 논문에서는 고유명사를 추출하고 그 범주를 찾는 방법을 제시한다. 고유명사가 태깅된 코퍼스로부터, 고유명사의 내부와 주변에 반복적으로 나타나는 실마리들을 규칙 기반으로 학습한다. 이를 통하여 고유명사를 찾고 그 범주를 정한다. 구현한 시스템은 경제기사 코퍼스에서 4가지 범주로 고유명사를 추출하고 분류함에 있어 79.8%의 재현율과 92.9%의 정확률, 그리고 F 평가치에서 85.8의 성능을 보인다.
길태형 ( Gil Tae Hyung ),박진우 ( Park Jin Woo ),노태길 ( Noh Tae Kil ),최욱 ( Choi Wook ) 한국구조물진단유지관리공학회 2017 한국구조물진단유지관리공학회 학술발표대회 논문집 Vol.21 No.1
The condition assessment of the road tunnel is based on the judgment of the responsible engineer about the expansion joint. The evaluation result is divided into the span unit or the sheet unit when calculating the evaluation result. Therefore, it was divided into span units and sheet units and the actual difference was compared.
노윤석(Yunseok Noh),손정우(Jeong-Woo Son),노태길(Tae-Gil Noh),박성배(Seong-Bae Park),박세영(Se-Young Park),이상조(Sang-Jo Lee) 한국정보과학회 2012 정보과학회논문지 : 소프트웨어 및 응용 Vol.39 No.5
스마트폰의 대중화와 함께 그에 내장된 GPS를 활용하여 컨텐츠를 제공하는 서비스들이 점차 늘어나고 있다. 그러나 이런 컨텐츠를 단지 위도, 경도 좌표 정보만을 기초로 구성하게 되면 실제 그 위치가 가지는 의미적 특성을 제대로 반영하지 못하게 된다. 사용자의 위치를 기반으로 그에 맞는 서비스를 제공하기 위해서는 장소의 토픽을 고려해야한다. 본 논문은 사용자가 위치한 장소의 지명 키워드로부터 검색 엔진 및 토픽 모델을 통해 장소에 내재된 토픽을 파악하고, 이를 기반으로 관련된 기사를 추천하는 방법을 제안한다. 본 논문이 제안하는 방법을 29곳의 장소에 대해서 두 가지 베이스라인과 함께 비교하였다. 일반적인 질의 확장에 기반한 베이스라인 방법보다 제안한 방법이 NDCG 평가 기준에서 약 18% 이상 높은 성능을 보였다. 또한 제안하는 방법은, 명시적으로 장소와 유관한 토픽을 어휘로 제시할 수 있으며, 이들에 대한 정성적인 분석은 이렇게 제시된 토픽이 해당 장소를 잘 반영하고 있음을 볼 수 있었다. With the popularity of smart phones, services that provide contents using GPS have been increasing. However if these contents would consist only of geographical information like latitude, longitude coordinates, it couldn't catch the meanings of places. To provide the service based on and properly utilizing user location, topics of the places should be considered. This paper studies the problem of recommending articles based on latent topics of a place, which topics are found out from the name of the place where a user is located by a search engine and topic modeling. We compared our proposed method and another two baselines over 29 different places. Our proposed method outperforms the baseline using a well-known query expansion method about 18% in NDCG evaluation measure. In addition, the proposed method is able to show topics associated with a place to words explicitly. And we have shown by qualitative analysis that a discovered topic reflects the true latent place topic well.
손기준(Ki-Jun Son),노태길(Tae-Gil Noh),이상조(Sang-Jo Lee) 한국정보과학회 2002 한국정보과학회 학술발표논문집 Vol.29 No.1B
본 논문에서는 필터링 문제를 이진 문서 분류 문제로 보고 신문기사 필터링에 베이지안 분류자를 사용한다. 신문 기사 필터링 문제에서 베이지안 분류자를 사용할 경우 학습 문서가 고정되어 있지 않기 때문에 여러 가지 파라미터를 사용하여 실험을 하였다. 실험 결과 베이지안 이진 분류기는 제한된 학습 문서에서 더 나은 성능을 보였고, 해당 문서 집합에서 10%이상 비율의 문서를 사용자가 선택해야 함을 알 수 있었다.
원상훈(Sang-Hoon Won),노태길(Tae-Gil Noh),손기준(Ki-Jun Son),박정희(Jung-Hee Park),이상조(Sang-Jo Lee) 한국정보과학회 2003 한국정보과학회 학술발표논문집 Vol.30 No.1B
본 논문은 특허 문서에 맞게 벡터스페이스 모델을 적용하여 특허정보 검색기를 구현한다. 기존의 상용 특허 검색 시스템의 문제점을 제시하고, 특허 문헌의 특징을 분석하여, 이를 반영한 특허 문헌 검색용의 벡터 스페이스 모델을 제시한다. 하나의 특허 문서는 서로 상이한 특성을 지닌 텍스트와 데이터의 조합으로 이루어져 있다. 따라서 이를 하나의 벡터로 표현하는 것이 용이하지 않다. 이에 대해 본 연구에서는 내용 필드들을 특성에 따라 둘 이상의 벡터로 표현하고, 수치 및 고유명 필드는 불린검색형태로 처리되는 혼합형 벡터 모델을 제안한다. 각 필드의 특징에 맞게 색인어를 추출하며, 텍스트 필드의 색인어를 벡터로 표현하는 과정에서는 잘 알려진 TF-IDF 가중치를 사용하되, 특허 문서가 IPC 특허 분류 기준에 따라 완전 분류되어 있는 문서라는 특징을 이용, 보다 정확한 가중치를 부여한다. 실험과 성능평가를 통하여 제안한 특허 모델의 유용성을 보인다.
서연경(Youn-Kyoung Seo),노태길(Tae-Gil Noh),이상조(Sang-Jo Lee) 한국정보과학회 2001 한국정보과학회 학술발표논문집 Vol.28 No.1B
사건, 사고 관련 기사의 요약은 단순히 원문이 무엇을 말하는 가를 지시하는 것보다 가능한 요지를 판독하면서 필요한 정보를 누락시키지 않고 표현할 수 있는 것이 바람직하다. 이를 위하여 본 논문에서는 사건, 사고 관련 기사의 자동 요약문 생성을 위한 중간 개념 표현 방법을 제안한다. 단락 자동 구분을 통한 중요 문장 추출을 거쳐 각 단락의 중심문장을 파악하고, 단락내의 정보들을 의미 파악된 중심 문장에 추가, 병합하여 단락의 내용을 대표하는 Paragraph Representation Structure(PRS)를 생성한다. 이들은 통합과정을 거쳐 하나의 Unified Representation Structure(URS)로 만들어지며, 이것은 중간 개념 표현으로 다국어 자동 요약문 생성을 위한 기반이 될 수 있다. 본 연구에 이용한 코퍼스는 비행기, 선박, 차량, 열차 사고와 화재 폭발 및 사건 관련 신문 기사를 대상으로 한다.
송현제(Hyun-Je Song),노태길(Tae-Gil Noh),박성배(Seong-Bae Park),박세영(Se-Young Park) 한국정보과학회 2009 정보과학회 컴퓨팅의 실제 논문지 Vol.15 No.12
질의 처리는 사용자가 입력한 질의를 분석하여 시스템이 이해할 수 있는 질의로 변환하는 작업으로, 온톨로지 및 시맨틱 웹 검색을 위한 질의 처리가 최근 주목을 받고 있다. 시맨틱 웹에서 사용하는 형식 질의 언어는 찾는 대상을 정확히 표현할 수 있지만, 키워드 기반과 달리 온톨로지의 구조 파악이 선행되어야 한다. 본 논문에서는 일반 사용자에게 익숙한 키워드로 작성된 질의문을 시맨틱 웹 환경에서 적합한 형식 질의문으로 변환하기 위한 키워드 기반 질의 변환 시스템을 제안한다. 제안한 방법은 온톨로지 구조 지식을 활용하여 개별 키워드가 어떤 제약 조건 또는 제약 대상과 결합하는지를 명시함으로써, 질의 키워드로부터 등가의 조건에 해당하는 형식 질의문을 생성할 수 있다. This paper proposes a keyword-based query translation system for the semantic web. With the relationship between keywords and ontology structure information, the system converts keyword based queries into queries written by formal query language which is appropriate for the semantic web. As a result, casual web users could not only express queries easily but also obtain the better result.
태깅 오류 간 중요도 차별화에 기반한 비용 의존 품사 태깅
손정우(Jeong-Woo Son),노태길(Tae-Gil Noh),박성배(Seong-Bae Park),고준호(Junho Go) 한국정보과학회 2011 한국정보과학회 학술발표논문집 Vol.38 No.1C
품사 태깅에서 오류는 같은 가중치를 가지는 것으로 간주되어 왔다. 하지만 품사 태깅의 결과를 활용하는 다른 자연어 처리 기술에 태깅 오류가 얼마나 영향을 미칠 수 있는가에 따라 품사 태깅 시 발생하는 오류가 가지는 가중치를 다르게 보아야 한다. 심각한 오류는 이를 활용하는 자연어 처리 기술의 성능 저하를 크게 야기하지만, 사소한 오류는 성능의 저하를 야기하지 않거나 그 영향이 미미하다. 본 논문에서는 품사 태깅 시, 전체적인 성능을 유지하면서 심각한 오류를 줄이는 것을 목표로 한다. 이를 위해 두 가지 점진적 손실 함수(gradient loss function)를 제안한다. 제안한 손실 함수는 심각한 오류에 사소한 오류보다 더 큰 가중치를 줌으로써 품사 태깅 모델이 심각한 오류에 더 집중하여 성능을 최적화하도록 한다. 실험에서 제안한 손실 함수를 활용한 태깅 모델은 기존의 방법에 비해 심각한 오류를 효과적으로 줄일 뿐만 아니라 전체적으로 더 높은 정확도를 보였다.
김상수(Sang-Soo Kim),김계성(Kye-Sung Kim),노태길(Tae-Gil Noh),이상조(Sang-Jo Lee) 한국정보과학회 2002 한국정보과학회 학술발표논문집 Vol.29 No.2Ⅱ
한 문서에서 동일한 개체(Entity)를 지칭하는 고유명사가 다른 형태로 출현하는 현상은 문서요약의 품질을 떨어지게 만드는 요소이다. 이런 문제를 해결하기 위해서는 각각의 고유명사 및 지칭어를 인식하고 이들간의 상관 관계를 밝혀야 한다. 본 논문에서는 이런 문제를 개체명 조응 대용 관계로 정의하고 출현 특성에 따라 분류한 후 특성에 맡는 처리 방법을 보인다. 이를 위하여 고유명사의 조응 출현 양상에 따른 휴리스틱을 만들고, 고유명사를 지칭하는 명사들의 시소러스를 구축한 후 이들을 처리하는 방법을 제안한다.