Search Engine/IR Papers2008. 1. 10. 03:05

★ 시맨틱 웹과 온톨로지
시맨틱 웹은 일종의 차세대 웹을 위한 비전으로 정보의 의미를 컴퓨터 프로그램이 해석할수 있도록 해주는 것을 목표로 하고 있다. 사람과 전산 시스템간, 그리고 상이한 전산 시스템간의 웹과 같은 분산적 환경에서 커퓨티케이션을 효과적으로 이루어질 수 있도록 해준다. 시맨틱 웹은 기계 스스로 개념화 과정(conceptualization 과 추론과정(inference process)을 통해 사람이 원하는 정보를 찾아주는 환경이다

온톨로지는 시맨틱 웹을 구현하기 위해 실세계의 지식을 기계가 처리 가능한 형태로 표현하는 것이라 할수 있다. 온톨로지는 용어사이의 관계를 정의하고 있는 일종의 사전 같은 것이라 할 수 있다.

시맨틱 웹을 실현하기 위한 첫 단계는 웹온톨로지 제작이다. 온톨로지는 에이젼트간의 커뮤니케이션의 전제가 되고 실제 내용이 되는 용어들을 개념적(혹은 의미적 수준에서 처리할 수 있도록 표현한 고차원의 데이터베이스라 할 수 있다.


★ 온톨로지를 표현한 언어
RDF(Resource Description Framework)
RDF는 W3C에서 발표한 메타데이터의 기술과 교환을 위한 표준이다. RDF는 다양한 메타데이터간의 상호운용을 위해 의미(semantics), 구조(structure) 및 구문(syntax)에 대한 공통적인 규칙을 제공한다.
"RDF는 왜 필요한 것인가?", "어떻게 사용할 수 있을까?"

웹의 폭발적인 성장으로 양적증가도 불러 일으켰다. 이런 환경에서의 데이터 공유를 위한 노력의 일환으로 메타데이터라고 할수 있다.

메타데이터(metadata)는 자원의 내용을 일정한 규칙에 따라(표준화된 방법으로) 기술할 수 있는 틀이 될수 있다. 메타데이터 구문과 스키마 정의 언어가 달라 상호운용성을 보장할수 없었다.
RDF는 이러한 문제를 해결하는데 주된 목적을 갖고 있다. RDF는 데이터 모형을 이용해 메타데이터 스키마를 일관된 방법으로 표현한다. 다시 말해 다양한 특성을 갖는 메타데이터 스키마가 있을때, RDF는 이것들을 표현할 수 있는 추상적 모형을 제공하고, 컴퓨터가 처리 가능하도록 XML을 이용하여 구현한다.


★ RDF 데이터
RDF는 자원을 기술하기 위한 모형을 제공한다. RDF 모형은 기술하는 자원의 속성과 자원간의 관계를 표현한다.
데이터 모형에 기술되는 내용들은 문법적으로 다를 수 있지만, RDF 파서(parser)에 의해 동일한 의미로 처리된다.  즉 문법에 중립적이다. RDF 데이터 모형은 자원(resource), 속성타입(property type), 진술문(statements)으로 구성된다.

- 자원(resource) :  URI(Universal Resource Identifier)로 기술되는 모든 객체를 말한다. URI는 어떤 객체를 인식하기 위한 수단인데, 대상이 웹에 한정되지 않는다. URI는 웹의 자원일 수도 있지만, 오프라인에 있는 책상이 될 수도 있다. 우리가 알고 있는  URL(Uniform Resource Location)은 URI의 부분집합이라고 할수 있다.
다시 말해 자원의 범위는 웹 자원(URL로 표현되는)에 한정되지 않는다. 실 세계에 존재하는 모든 객체는 자원으로 표현할 수 있다. 하나의 자원은 여러개의 속성 유형과 속성값을 포함할 수 있다.
예컨데 http://www.ontology.or.kr/default.html 은 URL 로 표현된 자원이라 할 수 있다.

- 속성유형(Property type) : 자원의 속성명을 의미한다. '저자명' 또는 '파일형식' 등과 같이 특정자원의 속성에 대해 적절한 이름을 부여하는 것이다. RDF에서 기술(description)은 동일한 자원을 참조하는 속성들의 집합을 말한다. 속성값은 다른 자원 혹은 문자열이나 숫자와 같은 원자형(atomic)일 수 있다.

- 진술문(statements) : 특정 자원을 기술 하기 위해 지정된 속성과 속성값을 의미한다. 이 진술문은 주어(subject),  서술어(predicate), 목적어(object) 로 구성된다.  진술문의 목적어는 어떤 자원이나 리터럴이 되기도 한다.

RDF 데이터 모형은  트리플(triples), 그래프, XML을 이용하여 표현할 수 있다. 이들 표현 방식은 대등한 의미를 갖는다.

 자원(http://www.ontology.or.kr)의 작성자는 홍길동이다.

위 진술문은 다음과 같은 요소로 구성된다.


주어(subject) : [http://www.ontology.or.kr]
서술어(predicate) : 작성자
목적어(object) :  홍길동

사용자 삽입 이미지

★ OWL(Web Ontology Language)는 웹에서 정보를 표현하고 애플리케이션이 직접 내용을 처리할 수 있도록 설계된 언어이다.  OWL은 기계 또는 에이전트가 처리할 수 있는 풍부한 어휘(vocabulary)와 형식적 의미 (formal semantics)를 제공한다. 따라서 어떤 용어의 의미와 용어사이의 관계를 명시적으로 표현할 수 있다.
OWL은 XML, RDF, RDF 스키마보다 풍부한 의미표현이 가능하기 때문에 웹에서 컨텐츠를 해석하기가 용이하다.
OWL은 RDF와 DAML, OIL의 영향을 받았으며 DAML+OIL로 부터 파생되었다.

 웹 온톨로지 언어의 정식 명칭은 WOL이 될 수 있었으나, 개발에 참여한 사람들에 의해
 OWL(아울)로 표기하기로 결정하였음.

- OWL의 종류

OWL은 표현력이 서로 다른 세개의 하위 언어로 구성된다.

OWL Lite는 클래스의 계층과 간단한 제약 사항만을 제공하고 있다. 따라서 다른 언어보다 표현력의 제한이 많다. 예컨대 관계차수 제약이 가능하지만 차수의 값은 0 또는 1만 사용할 수 있다. OWL Lite는 이론적 복잡도가 낮기 때문에 다른 분류체계나 시소러스를 빠르게 OWL로 변화하는데 적합하다.


OWL DL은 기술논리(Description Logic)에 기반한 언어이다.
기술논리는 OWL의 형식적 기반이 된 논리학의 한 분야이다.  OWL DL은 계산적 완전성과 결정 가능성을 유지하면서 최대의 표현력을 제공한다. 계산적 완전성은 모든 결론이 계산될 수 있다는 특성이고, 결정 가능성은 모든 계산이 유한한 시간내에 끝난다는 것을 말한다.  OWL DL은 OWL에서 정의한 모든 어휘를 포함하고 있다. 그러나 어휘를 사용할 때 정해진 제약 사항에 따라야 한다. 예컨대 클래스 다른 클래스의 하위클래스로 선언할 수 있지만, 다른 클래스의 인스턴스로 선언할 수 없다.

OWL FULL
RDF의 모든 문법을 사용할 수 있으며 최대의 표현력을 제공한다. 단 계산적 보장은 하지 않는다. OWL Full은 DL과 Lite의 모든 기능을 포함하는 관계이며 유효성과 호환성은 하위 언어중에 가장 완벽하다. 그러나 OWL Full을 지원하는 추론엔진을 개발하는 것은 쉽지 않다.

사용자 삽입 이미지




Posted by BAGE