Namazu 2.0.16 設定の覚え書き

ちょっと機会があり、初めて全文検索システムの [Namazu](http://www.namazu.org/) 2.0.16 を設置してみたので設定のメモを書いておきます。

## UTF-8 で書かれたページから Namazu 2.0.16 を使うと検索語が文字化けする

UTF-8 で書かれたページのフォームから検索すると、検索結果ページで検索キーが文字化けしてしまい、正常にヒットしない問題が発生。 試しに、Shift_JIS で書いた検索フォームから検索すると、検索キーの文字化けは発生せず、正常にヒットする。

検索結果ページの文字コードは Shift_JIS みたいなので、UTF-8 ページからの検索語がうまく渡せていないのかな?と思って Google 検索すると次のページが見つかりました。

– [namazu で UTF-8 を利用する PHP を作ってみました。|webnote](http://a-cot.jp/webnote/2007/07/namazu_utf8_php.html)
– [Diary–/*isaji*/MIDI Lab. | Namazu の検索フォームを UTF-8 のページに設置](http://isaji.jp/diary/log/eid81.html)

PHP を間に挟んで文字コードを変更しているみたい。なるほど。上記ページの方法で試してみるとうまくいきました。情報ありがとうございます。

PHP が使えない時は、[こちらの記事](http://sakaguch.com/utf1.html#kensaku) が参考になりそうです。

## インデックスの自動更新を設定する

– cron でアクセスが少なくなりそうな 06:00 に自動更新するように設定した。

## 雑感・気になる事

– UTF-8 のページでもインデックスは正常に作られているみたい。 Shift_JIS でインデックスしてるのかな?
– [ JavaScript ] と言う検索語で検索すると沢山のページがヒットするんだが、body タグ内の全てのソースコードがインデックスされているんだろうか?
– 既に静的なページが存在し、全文検索を導入する場合に良いかも?
– Movable Type のサイト内検索が遅い。と悩んでいた時に Namazu を知っていれば、ブログツールを乗り換えなくて済んだのかも?

以上です。何かあれば追記する予定。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です