2011年3月2日水曜日

レンタルサーバ(ホストモンスター)になまず namazu

全文検索なまず捕獲作戦
コマンドラインで動けば、webからはphpで execすればいい!?
最小限のものだけインストール。
nkf インストール
nkf webでダウンロードして ftpした。
[]#tar zxvf nkf-2.1.1.tar.gz
[]#cd nkf-2.1.1
[]#make
[]#mv nkf /home3/xxxxxx/bin
[]#nkf -v
Network Kanji Filter Version 2.1.1 (2010-08-08)
Copyright (C) 1987, FUJITSU LTD. (I.Ichikawa).
Copyright (C) 1996-2010, The nkf Project.
//でうごいたっぽい

kakasiインストール
[]#wget http://kakasi.namazu.org/stable/kakasi-2.3.4.tar.gz
[]#tar zxvf kakasi-2.3.4.tar.gz
[]#./configure --prefix=/home3/xxxxxx/kakasi
[]#make
[]#make install
[]#/home3/xxxxxx/kakasi/bin/kakasi -v
KAKASI - Kanji Kana Simple Inverter  Version 2.3.4
Copyright (C) 1992-1999 Hironobu Takahashi. All rights reserved.
いけたっぽい

いよいよ、とりあえずなまず
[]#wget http://www.namazu.org/stable/namazu-2.0.20.tar.gz
[]#tar zxvf namazu-2.0.20.tar.gz
[]#cd namazu-2.0.20
[]#cd File-MMagic
[]#perl Makefile.PL LIB=/home3/xxxxxx/lib INSTALLMAN3DIR=/home3/xxxxxx/lib
//ほかのサイトでは↑だったけど失敗。
//namazuのエラーメッセージに↓のように書いてた。
[]#perl Makefile.PL LIB=/home3/xxxxxx/lib INSTALLSITEMAN3DIR=/home3/xxxxxx/man
//Then, run configure again with --with-pmdir=DIR option.
[]#make
[]#make install
//namazu
[]#./configure --prefix=/home3/xxxxxx/namazu --with-kakasi=/home3/xxxxxx/kakasi/bin/kakasi --with-pmdir=/home3/xxxxxx/lib
[]#make
[]#make install
[]#/home3/xxxxxx/namazu/bin/namazu -v
namazu of Namazu 2.0.20
Copyright (C) 1997-1999 Satoru Takabayashi All rights reserved.
とりあえず、一応動いた感。
indexを作ってみる
//dir作成
[]#mkdir nmzidx
[]#cd nmzidx
[]#mknmz /home3/xxxxxx/public_html/svnwork/trunk/
//mknmz は無いとおこられた。
[]# /home3/xxxxxx/namazu/bin/mknmz --indexing-lang=ja_JP.UTF-8 -k /home3/xxxxxx/public_html/svnwork/trunk/

Date:                Wed Mar  2 04:49:47 2011
Added Documents:     5
Size (bytes):        96,825
Total Documents:     5
Added Keywords:      1,258
Total Keywords:      1,258
Time (sec):          1
File/Sec:            5.00
System:              linux
Perl:                5.008008
Namazu:              2.0.20
できたっぽい
検索すると・・・ダメダメ 
indexのNMZ.wを確認するもバケバケ 単語分割もうまくない。

mknmzrcを編集
# KAKASI 2.x or later
# Text::Kakasi 1.05 or later
#
$KAKASI = "/home3/xxxxxx/kakasi/bin/kakasi -ieuc -oeuc -w";
#
# Default Japanese processer: KAKASI or ChaSen or MeCab.
#
$WAKATI = $KAKASI;

[]#/home3/xxxxxx/namazu/bin/mknmz --indexing-lang=ja_JP.UTF-8 -k /home3/xxxxxx/public_html/svnwork/trunk/
//NMZ.wが結構きれいにできていた。
//検索してみる
[]#/home3/xxxxxx/namazu/bin/namazu "yahoo"  /home3/xxxxxx/svn_nmzidx -o result.txt -h

1. Bookmarks (スコア: 11)
著者: 不明
日付: Wed, 02 Mar 2011 06:52:12 -0700
Bookmarks POVRay SQLServer インストール問題 TEL LITHIUS 生産性 たたた みゃー プログラミング メールサーバー リンク 一時ブックマーク 英語  POVRay MSXML コア サービス 6.0 Service Pack 2 がイン
/home3/xxxxxx/public_html/svnwork/trunk/・㏍モャ凪"坂"・"・・銀ク痕bookmark.htm (48,198 bytes)

中身は EUCに変換され、ファイル名はそのまま出力される(この場合フォルダ名はもともとUTF-8)
--indexing-lang=ja_JP.UTF-8
が、何か影響してるんだかしてないんだか?
いらないかも・・・。


excel word関連
http://www.marronkun.net/linux/web/namazu_000096.html

0 件のコメント:

コメントを投稿