내일 오자마자
2011-05-23 16:10:17
연구실
1. 국제협력 문서를 내달 15일까지 마무리 해야하므로 준비할 것.
2. Hadoop 설치를 마무리 할 것.
3. 툴바 마무리..
▼ more
1. 국제협력 문서를 내달 15일까지 마무리 해야하므로 준비할 것.
2. Hadoop 설치를 마무리 할 것.
3. 툴바 마무리..
이번주 시험 준비
1. 1회들으며 정리.. 전체적인 흐름보다는 페이지에 있는 상세 정보가 중요!!
2. PPT의 글씨만 모아서 PPT 만듦.
3. 수치 정보 암기.
생각해보니 딱히.. $NUTCH_HOME에서 하지 않아도 될듯 .
$NUTCH_HOME 에서는
1. 일단 crawl이라는 폴더를 지워야 할듯
2. urls의 siteList.txt를 바꾸고, conf의 nutch-site.xml의 name, description, url, email을 그냥 막 바꿔도 되는 것같다. 이게 뭔지도 모르고 바꿈;;
4. conf의 crawl-urlfilter.txt를 바꾼다.
5. bin/nutch crawl urls -dir crawl -depth 3 -topN 50 전설의 크롤명령 ㅋ수행ㅋ
6. bin/nutch org.apache.nutch.searcher.NutchBean 검색어 를 쳐서 검사해보는 센스
$CATALINA_HOME에서는
1. webapps/nutch/WEB-INF/classes로 가서 nutch-site의 searcher.dir 의 value를 $NUTCH_HOME/crawl 아까 명령에쓴 crawl에 저장되니까 이렇게 하지만 절대경로로~~ 음
2. 그다음 catalina.sh start 시원하게 하고 나서 html manager에서 리로드 ㅋㅋ
그럼 내가 원하는 사이트로 바껴 있을듯