2016-09-24-Sat 検索ちゃん2号
_ [Web] と、言うわけで
この日記の全文検索システムを再構築してます。
以前はtdiarygrep.rbというモノで動いていたんですが、Rubyがバージョンアップしてから動かなくなりまして。
仕方無しにGoogle検索でお茶を濁していたんですが、tdiaryってデータをHTMLで持っていないので、Googleのキャッシュに引っかからない限りはHitしない。使えないんですよね。
この日記は自分の備忘録でもあるので、過去データが検索できないと意義が半減(苦笑)。なので重い腰を上げて新しいシステムを構築し始めたのです。
やろうとしているのは、tdiaryのプラグインであるsqueeze.rbを使ってHTMLデータを書き出し、それをnamazuでインデックス化、検索すると言うもの。
先人のログを見ながら試行錯誤しているんですが、これがなかなか…。Rubyやtdiaryのバージョンが違うと動かないことが多しで、困難を極めてます。
最初のsqueeze.rbの導入からして躓いてますよ。。。