カテゴリー:
全文検索エンジン
閲覧数:459 配信日:2017-03-22 14:35
Apache Lucene
Javaで記述された全文検索ソフトウェア
・予め蓄積した大量のデータから、指定したキーワードを探し出す機能を持つ
・Javaのクラスライブラリとして提供される
Elasticsearch
Elastic社のもとでOSSとして開発されている「Lucene」ベースのオープンソース全文検索エンジン
・Nodeが必要
・Apache Solr vs Elasticsearch
全文検索用のライブラリApache Luceneを利用したデータストア
・RDBとは異なる
データストアとは?
・データを決められた形式で記憶装置などに永続的に保存・蓄積するソフトウェア、および、そのような機能・処理
形態素解析系
・BigTable
・Googleのほとんどのサービスを支えるBigtableの誰でも使える版 Cloud Bigtable
・Googleの誇る巨大データベースBigTableのオープンソースクローン「Hypertable」
・Hypertable - Big Data. Big Performance
Groonga
C言語で書かれた国産の全文検索エンジン
・グルンガ
・An open-source fulltext search engine and column store
・MySQLのストレージエンジンとしてSQLベースで容易に高速な全文検索が可能なMroongaが提供されている
Senna 組み込み型全文検索エンジン
Fess
・Java 1.8利用
・OSには依存しない
・Web以外に共有フォルダなどもクロールできる
・クローリングの設定など必要な設定はすべてGUI上でできる
・Elasticsearchを検索エンジンとして利用している(内包しているので別途インストールの必要はない)
最終更新2014年
FINDSPOT
・有償
・オープンソースでの公開が計画されていたが、取り止めになった…
・現在の開発状況は不明
最終更新2011年
Namazu
・バックエンドに RDBMS は使っておらず、独自のデータ構造を持ったデータベースを構築している
・形態素解析方式
・chasenもしくはKAKASIの形態素解析を利用し,わかち書きをした上でインデックスをかける
・機能的にはChaSenの方が高度な分析が行える
・スピード的にはKAKASIの方が高速
・全文検索で文書の山に立ち向かう
最終更新2010年
Tritonnプロジェクト
最終更新2007年
Hyper Estraier