Nutch
2011-05-20 16:41:43
연구실
생각해보니 딱히.. $NUTCH_HOME에서 하지 않아도 될듯 .
▼ more
생각해보니 딱히.. $NUTCH_HOME에서 하지 않아도 될듯 .
$NUTCH_HOME 에서는
1. 일단 crawl이라는 폴더를 지워야 할듯
2. urls의 siteList.txt를 바꾸고, conf의 nutch-site.xml의 name, description, url, email을 그냥 막 바꿔도 되는 것같다. 이게 뭔지도 모르고 바꿈;;
4. conf의 crawl-urlfilter.txt를 바꾼다.
5. bin/nutch crawl urls -dir crawl -depth 3 -topN 50 전설의 크롤명령 ㅋ수행ㅋ
6. bin/nutch org.apache.nutch.searcher.NutchBean 검색어 를 쳐서 검사해보는 센스
$CATALINA_HOME에서는
1. webapps/nutch/WEB-INF/classes로 가서 nutch-site의 searcher.dir 의 value를 $NUTCH_HOME/crawl 아까 명령에쓴 crawl에 저장되니까 이렇게 하지만 절대경로로~~ 음
2. 그다음 catalina.sh start 시원하게 하고 나서 html manager에서 리로드 ㅋㅋ
그럼 내가 원하는 사이트로 바껴 있을듯
일을 미리 처리한다. ex) 수업, 과제프로젝트
약속을 철저하게 지킨다. ex) 대학원 초창기
일을 확실하고 꼼꼼하게 마무리한다. ex) 조교, 프로그래밍
단점
리트윗(다른 사람의 글을 자신의 트위터에 게재하는 것)