2384856 ランダム
 ホーム | 日記 | プロフィール 【フォローする】 【ログイン】

傀儡師の館.Python

PR

日記/記事の投稿

カレンダー

キーワードサーチ

▼キーワード検索

カテゴリ

バックナンバー

2019年07月
2019年06月
2019年05月
2019年04月
2019年03月
2019年02月
2019年01月
2018年12月
2018年11月
2018年10月

フリーページ

プロフィール


kugutsushi

サイド自由欄

設定されていません。
2007年02月20日
XML
カテゴリ:検索
Hyper Estraier を使ってみた。以前から関心はあったのだが、インストールするのも面倒かなと思ってやらなかったのだが、DesktopHE という Windows のデスクトップ上で Hyper Estraier を簡単に使えるようにするツールが別の方によって公開されているので、それを使ってみる。

DesktopHE は GUI を持った通常のアプリケーションなので Apache も不要だし、ちょっと動かして試してみるにはよいかなと。JDK/JRE5.0 がインストールされていれば、あとは、ダウロードして解凍したら、DesktopHE.exe をダブルクリックして起動するだけ。起動したら検索対象を選択してインデックスを作成すれば、まったく苦労なしに使い始めることができる。

ちなみに Wordファイル、Excelファイル、PowerPointファイル、pdfファイルからのテキスト抽出には、xdoc2txt が使われている。DesktopHE に同梱されているので、これもまた、まったく気にする必要がない。Hyper Estraier のプログラムファイル等も含まれているのも便利でいい。改訂履歴 1.5.5 → 1.6.0 (2007/02/06) を見ると、同梱されている Hyper Estraier のバージョンは 1.4.9 なので Hyper Estraier の Windows 版として公開されている最新のものと同じ

Hyper Estraier はインデックス作成の速度も速いし、N-gram 方式なので検索漏れもないし(MeCab を使うこともできるようだが)、いいかもしれない。Pyblosxom の全文検索もこれ使うのがよさそうと思う今日この頃。










最終更新日  2007年02月20日 05時38分37秒
コメント(0) | コメントを書く
[検索] カテゴリの最新記事

Copyright (c) 1997-2019 Rakuten, Inc. All Rights Reserved.