I. 문법 관련
1. CFG로 직접 문장을 작성할 수 있도록 할 것.
2. Attmpto 로 문장을 작성?
II. 어휘 관련
3. SNOMED-CT를 분석.
4. 자연어에서 SNOMED-CT로의 매칭 논문 분석.
III. 논문 다시 보기
IV. 방법적 아이디어 구상
I. 문법 관련
1. CFG로 직접 문장을 작성할 수 있도록 할 것.
2. Attmpto 로 문장을 작성?
II. 어휘 관련
3. SNOMED-CT를 분석.
4. 자연어에서 SNOMED-CT로의 매칭 논문 분석.
III. 논문 다시 보기
IV. 방법적 아이디어 구상
실제 사용자료 는 노트북에서.
모든 작업, 업무는 불가피한 상황을 제외하곤 노트북 사용!!
(만약 다른 곳에서 작업하면 FTP의 temp 폴더에 넣어두고 바로노트북으로 옮긴다.)
사용하지 않게된 자료는 FTP에 올리고 노트북에서 점차적으로 삭제.
Main : 영구 보존자료, 서버 사용 지양.
BiKE : FTP, MySQL
노트북 : 웹서버, SVN, 개인자료 FTP
*웹서버 MySQL 자료는 수시로 Main Computer로 백업해야하니 해당 모듈 개발 필요.
ㅋㅋ LCD는 꺼뒀었나;;
기억이 가물가물.. 밧데리는 있으나 마나 이니 담에가면 그냥 빼버릴까;
FTP, SVN, Tomcat의 역할을 수행하니 끄면 업무에까지 큰지장이생기고만다;;
어떻게든 적은 전기세로 이런 걸 해내야지 ㅋ 게다가 이건 무선 wifi 서버이니 ㅋㅋ
뭔가 이정도 속도로 돌아가고 있는것 자체로 신기하다는 ㅋ
CFG를 이용해서 글을 적을 수 있다는 것을 알겠다.
하지만 의미를 파악하지 않고 그냥 문장 구조를 NP, VP로 나타내므로
NP나 VP뒤에 적힐 수 있는 가지수가 너무 많게 된다.
한 번에 사용자에게 보여주어야 하는 가지 수를 줄여서 실제로 사용할 수 있게 해야한다.
그러기 위해서 Lexical Dependency 개념이 들어간
Context Free Grammar Lexical Dependency 을 사용해서
만들어 보았던게 기존 연구실 논문이다.
지금 보면 SNOMED-CT에 1155개의 attribute가 있다.
is a가 포함되는 일종의 연결어(한국어로 하자면 조사정도) 같은 것이라고 할 수 있다.
그렇다면 The specimen 이라고 사용자가 치면 1155개의 attribute가 나오는 말도 안되는
상황이 벌어진다.
그걸 Lexical Dependency로 줄이고 그에 맞는 Ontology를 가상으로 만들어서 사용해본듯 하다.
SNOMED-CT에 그렇다면 의미에 관련된 정보가 기계가 이해할 수 있게 있는지 어떻게 하면 접목시킬 수 있을지를
고민 해보아야 한다.
그게 이 논문의 핵심이다.