2011年3月2日水曜日

レンタルサーバ(ホストモンスター)になまず namazu

全文検索なまず捕獲作戦
コマンドラインで動けば、webからはphpで execすればいい!?
最小限のものだけインストール。
nkf インストール
nkf webでダウンロードして ftpした。
  1. []#tar zxvf nkf-2.1.1.tar.gz  
  2. []#cd nkf-2.1.1  
  3. []#make  
  4. []#mv nkf /home3/xxxxxx/bin  
  5. []#nkf -v  
  6. Network Kanji Filter Version 2.1.1 (2010-08-08)  
  7. Copyright (C) 1987, FUJITSU LTD. (I.Ichikawa).  
  8. Copyright (C) 1996-2010, The nkf Project.  
  9. //でうごいたっぽい  

kakasiインストール
  1. []#wget http://kakasi.namazu.org/stable/kakasi-2.3.4.tar.gz  
  2. []#tar zxvf kakasi-2.3.4.tar.gz  
  3. []#./configure --prefix=/home3/xxxxxx/kakasi  
  4. []#make  
  5. []#make install  
  6. []#/home3/xxxxxx/kakasi/bin/kakasi -v  
  7. KAKASI - Kanji Kana Simple Inverter  Version 2.3.4  
  8. Copyright (C) 1992-1999 Hironobu Takahashi. All rights reserved.  
いけたっぽい

いよいよ、とりあえずなまず
  1. []#wget http://www.namazu.org/stable/namazu-2.0.20.tar.gz  
  2. []#tar zxvf namazu-2.0.20.tar.gz  
  3. []#cd namazu-2.0.20  
  4. []#cd File-MMagic  
  5. []#perl Makefile.PL LIB=/home3/xxxxxx/lib INSTALLMAN3DIR=/home3/xxxxxx/lib  
  6. //ほかのサイトでは↑だったけど失敗。  
  7. //namazuのエラーメッセージに↓のように書いてた。  
  8. []#perl Makefile.PL LIB=/home3/xxxxxx/lib INSTALLSITEMAN3DIR=/home3/xxxxxx/man  
  9. //Then, run configure again with --with-pmdir=DIR option.  
  10. []#make  
  11. []#make install  
  12. //namazu  
  13. []#./configure --prefix=/home3/xxxxxx/namazu --with-kakasi=/home3/xxxxxx/kakasi/bin/kakasi --with-pmdir=/home3/xxxxxx/lib  
  14. []#make  
  15. []#make install  
  16. []#/home3/xxxxxx/namazu/bin/namazu -v  
  17. namazu of Namazu 2.0.20  
  18. Copyright (C) 1997-1999 Satoru Takabayashi All rights reserved.  
とりあえず、一応動いた感。
indexを作ってみる
  1. //dir作成  
  2. []#mkdir nmzidx  
  3. []#cd nmzidx  
  4. []#mknmz /home3/xxxxxx/public_html/svnwork/trunk/  
  5. //mknmz は無いとおこられた。  
  6. []# /home3/xxxxxx/namazu/bin/mknmz --indexing-lang=ja_JP.UTF-8 -k /home3/xxxxxx/public_html/svnwork/trunk/  
  7.   
  8. Date:                Wed Mar  2 04:49:47 2011  
  9. Added Documents:     5  
  10. Size (bytes):        96,825  
  11. Total Documents:     5  
  12. Added Keywords:      1,258  
  13. Total Keywords:      1,258  
  14. Time (sec):          1  
  15. File/Sec:            5.00  
  16. System:              linux  
  17. Perl:                5.008008  
  18. Namazu:              2.0.20  
できたっぽい
検索すると・・・ダメダメ 
indexのNMZ.wを確認するもバケバケ 単語分割もうまくない。

mknmzrcを編集
# KAKASI 2.x or later
# Text::Kakasi 1.05 or later
#
$KAKASI = "/home3/xxxxxx/kakasi/bin/kakasi -ieuc -oeuc -w";
#
# Default Japanese processer: KAKASI or ChaSen or MeCab.
#
$WAKATI = $KAKASI;

  1. []#/home3/xxxxxx/namazu/bin/mknmz --indexing-lang=ja_JP.UTF-8 -k /home3/xxxxxx/public_html/svnwork/trunk/  
  2. //NMZ.wが結構きれいにできていた。  
  3. //検索してみる  
  4. []#/home3/xxxxxx/namazu/bin/namazu "yahoo"  /home3/xxxxxx/svn_nmzidx -o result.txt -h  
  5.   
  6. 1. Bookmarks (スコア: 11)  
  7. 著者: 不明  
  8. 日付: Wed, 02 Mar 2011 06:52:12 -0700  
  9. Bookmarks POVRay SQLServer インストール問題 TEL LITHIUS 生産性 たたた みゃー プログラミング メールサーバー リンク 一時ブックマーク 英語 <!--DOCTYPE--> POVRay MSXML コア サービス 6.0 Service Pack 2 がイン  
  10. /home3/xxxxxx/public_html/svnwork/trunk/・㏍モャ凪"坂"・"・・銀ク痕bookmark.htm (48,198 bytes)  
中身は EUCに変換され、ファイル名はそのまま出力される(この場合フォルダ名はもともとUTF-8)
--indexing-lang=ja_JP.UTF-8
が、何か影響してるんだかしてないんだか?
いらないかも・・・。


excel word関連
http://www.marronkun.net/linux/web/namazu_000096.html

0 件のコメント:

コメントを投稿