CFG를 이용해서 글을 적을 수 있다는 것을 알겠다.
하지만 의미를 파악하지 않고 그냥 문장 구조를 NP, VP로 나타내므로
NP나 VP뒤에 적힐 수 있는 가지수가 너무 많게 된다.
한 번에 사용자에게 보여주어야 하는 가지 수를 줄여서 실제로 사용할 수 있게 해야한다.
그러기 위해서 Lexical Dependency 개념이 들어간
Context Free Grammar Lexical Dependency 을 사용해서
만들어 보았던게 기존 연구실 논문이다.
지금 보면 SNOMED-CT에 1155개의 attribute가 있다.
is a가 포함되는 일종의 연결어(한국어로 하자면 조사정도) 같은 것이라고 할 수 있다.
그렇다면 The specimen 이라고 사용자가 치면 1155개의 attribute가 나오는 말도 안되는
상황이 벌어진다.
그걸 Lexical Dependency로 줄이고 그에 맞는 Ontology를 가상으로 만들어서 사용해본듯 하다.
SNOMED-CT에 그렇다면 의미에 관련된 정보가 기계가 이해할 수 있게 있는지 어떻게 하면 접목시킬 수 있을지를
고민 해보아야 한다.
그게 이 논문의 핵심이다.