namazuの使い方

更新日 2002.11.17



以下は未編集のメモです。悪しからず

Windows版 Kakasi,namazu-for-win32のインストール
1.Kakasiをインストールする(OSのドライブのルート直下へkakasiフォルダをコピーするのみ)
実際に必要なのはKakasiの辞書だけ
2.namazu for win32をインストールする、インストール用のバッチファイルを使ってインストール
(kakasiのパス等もまとめて設定される、使用するのはインデックス作成ソフト"mknmz.exe")
3.PDFを検索できるようにpdftotext.exeをダウンロードしてインストールする
(ただし、日本語対応にconfigしてコンパイルした物であること xpdf-0.92-win32-ms)
次いでC:\namazu\share\namazu\filterにあるpdf.plを編集します。pdftotextのオプションの使い方が少し変更されたためです。filterディレクトリにあるplという拡張子のファイルはすべてperl(パール)というプログラミング言語で書かれていますが、中身はテキストファイルです。テキストエディタで簡単に編集できます。73行目あたりにある
system("$pdfconvpath -q -eucjp -raw $tmpfile $tmpfile2");
を次のように変更します。
system("$pdfconvpath -q -enc EUC-JP -raw $tmpfile $tmpfile2");
設定が完了したらMS-DOSプロンプトでmknmz -Cを実行してみます。対応メディアタイプにapplication/pdfが加わっているのを確認します。これでPDFファイルが検索対象に加わったはずです。適当なファイルで実際にインデックスが生成できるか確かめてみましょう。

4.namazurcの設定
続いてNamazuの設定ファイルnamazurcの設定をします。namazurcはC:\namazu\etc\namazu\namazurcにあるnamazurc-sample.win32をnamazurcにリネームして内容を書き換えます。namazurcはデフォルトでは以下のような記述になっています(必要な部分のみ引用)。
Index C:\namazu\var\namazu\index
#Template C:\namazu\share\namazu\template
#Replace /home/foo/public_html/ http://www.foo.bar.jp/~foo/
#Logging off
Lang ja_JP.SJIS
#Scoring tfidf
#EmphasisTags "<strong class=\"keyword\">" "</strong>"

Cドライブのhomepageというフォルダをインデックスの対象にした場合、以下のような記述になります。
Index C:\namazu\var\namazu\index
Template C:\namazu\share\namazu\template
#Replace /C\|/homepage/ http://www.foo.bar.jp/~foo/
#Logging off
Lang ja_JP.SJIS
#Scoring tfidf
EmphasisTags "<strong class=\"keyword\">" "</strong>"
ローカルで使う場合は上記の設定でいいと思います。

namazurcをWeb上で動く設定に変更する

リプレース機能を使って、インデックスを作った環境と、実際のWebページの場所を整合させる設定をする。
Replace /g\|/download/web/hogeweb1.ne.jp/ http://hogeweb1.ne.jp/
Replace /g\|/download/web/hogeweb2.com/ http://hogeweb2.com/
Replace /g\|/download/web/hogeweb3.com/ http://hogeweb3.com/
Replace /g\|/download/web/hogeweb4.ne.jp/ http://hogeweb4.ne.jp/

Template の行はコメントにしておく


mknmz 実行ディレクトリの template\NMZ.head.ja を編集する
<link rev=made href="mailto:myname@myweb.ne.jp">
"Search!" を "検索スタート"に
複数のインデックスを検索する場合は"検索の方法"のリンクが無くなるので、
42行を
<a href="http://myweb.ne.jp/users/myweb/service/hogehoge.html#kensaku">[検索方法]</a>
とする

mknmz 実行ディレクトリの template/NMZ.foot.jaの編集
サポートのメールアドレス

mknmz 実行ディレクトリのshare\namazu\pl\conf.plの編集
$ADDRESS = 'webmaster@foo.bar.jp';を
$ADDRESS = 'myname@myweb.ne.jp';に変更

インデックス作成時に作られるheader,footerを使用せず、固定のtemplateを使用する場合は
Web転送ページのshare/namazu/template/NMZ.head.jaの編集
<!-- LINK-REV-MADE -->
<link rev=made href="mailto:myname@myweb.ne.jp">
Web転送ページの share/namazu/template/NMZ.foot.jaの編集
サポートのメールアドレス
ただし、固定されたテンプレートなので、インデックスの情報は0になってしまう。



上記が設定できたら、インデックス作成用のバッチファイルを作成してインデックスを作る
バッチファイル内容(4つのホームページのインデックスを作成する)
perl C:\namazu\bin\mknmz --html-split -O D:\web\myweb\homepage\cgi-bin\namazu\var\namazu\index\hogeweb1 G:\download\web\hogeweb1.ne.jp\
perl C:\namazu\bin\mknmz --html-split -O D:\web\myweb\homepage\cgi-bin\namazu\var\namazu\index\hogeweb2 G:\download\web\hogeweb2.com\
perl C:\namazu\bin\mknmz --html-split -O D:\web\myweb\homepage\cgi-bin\namazu\var\namazu\index\hogeweb3 G:\download\web\hogeweb3.com\
perl C:\namazu\bin\mknmz --html-split -O D:\web\myweb\homepage\cgi-bin\namazu\var\namazu\index\hogeweb4 G:\download\web\hogeweb4.ne.jp\