구문의미분석를 이용한 유사문서 판별기

Title
구문의미분석를 이용한 유사문서 판별기
Other Titles
Discriminator of Similar Documents Using Syntactic and Semantic Analysis
Author(s)
황도삼강원석[강원석]Jung H Kim[Jung H Kim]
Keywords
Similar Document Detection; Natural Language Processing; 유사문서 판별; 자연어 처리
Issue Date
201403
Publisher
한국콘텐츠학회
Citation
한국콘텐츠학회 논문지, v.14, no.3, pp.40 - 51
Abstract
문서 저작권에 대한 관심과 중요성이 높아짐에 따라 문서 복제나 표절의 검출에 대한 필요성이 증대되고 있다. 이와 같은 이유로 많은 연구가 이루어지고 있으나 자연어 처리기술의 한계가 있어 문서의 심층적 표절 검출에 어려움이 있다. 본 논문은 자연어 분석의 기술을 적용한 유사문서 판별기를 설계, 구현한다. 이 시스템은 형태소 분석의 기술과 함께 구문의미 분석의 기술, 저빈도 및 관용표현 가중치을 이용하여 유사문서를 판별한다. 본 시스템의 성능을 실험하기 위하여 휴먼 판별과 기존 시스템, 그리고 휴먼 판별과 제안한 시스템의 판별과의 상관계수를 분석하였다. 실험결과, 구문의미 분석을 활용한 시스템의 개선점을 발견할 수 있었다. 앞으로 문서 유형을 정의하고 각 유형에 맞는 판별 기법을 개발할 필요가 있다.
URI
http://hdl.handle.net/YU.REPOSITORY/32693http://dx.doi.org/10.5392/JKCA.2014.14.03.040
ISSN
1598-4877
Appears in Collections:
공과대학 > 컴퓨터공학과 > Articles
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE