- 投稿日 : 2008-01-21
- 更新日 : 2008-01-31
- ウェブ開発・運営
ちょっと機会があり、初めて全文検索システムの Namazu 2.0.16 を設置してみたので設定のメモを書いておきます。
UTF-8 で書かれたページから Namazu 2.0.16 を使うと検索語が文字化けする
UTF-8 で書かれたページのフォームから検索すると、検索結果ページで検索キーが文字化けしてしまい、正常にヒットしない問題が発生。 試しに、Shift_JIS で書いた検索フォームから検索すると、検索キーの文字化けは発生せず、正常にヒットする。
検索結果ページの文字コードは Shift_JIS みたいなので、UTF-8 ページからの検索語がうまく渡せていないのかな?と思って Google 検索すると次のページが見つかりました。
PHP を間に挟んで文字コードを変更しているみたい。なるほど。上記ページの方法で試してみるとうまくいきました。情報ありがとうございます。
PHP が使えない時は、こちらの記事 が参考になりそうです。
インデックスの自動更新を設定する
- cron でアクセスが少なくなりそうな 06:00 に自動更新するように設定した。
雑感・気になる事
- UTF-8 のページでもインデックスは正常に作られているみたい。 Shift_JIS でインデックスしてるのかな?
- [ JavaScript ] と言う検索語で検索すると沢山のページがヒットするんだが、body タグ内の全てのソースコードがインデックスされているんだろうか?
- 既に静的なページが存在し、全文検索を導入する場合に良いかも?
- Movable Type のサイト内検索が遅い。と悩んでいた時に Namazu を知っていれば、ブログツールを乗り換えなくて済んだのかも?
以上です。何かあれば追記する予定。
Comments:0
Trackbacks:0
- Trackback URL for this entry
- http://bowz.info/1305/trackback
- Listed below are links to weblogs that reference
- Namazu 2.0.16 設定の覚え書き from Bowz::Notebook