Apache Solr

検索エンジン全文検索エンジン

Apache Solr とは?

 状態:-  閲覧数:738  投稿日:2017-03-05  更新日:2017-03-17  
オープンソースの全文検索システム
・Javaベース
・Apacheソフトウェア財団のLuceneプロジェクトのサブプロジェクトとして開発されている
・全文検索エンジンライブラリLuceneをベースに、管理画面やキャッシュ機構を取り入れたアプリケーション

特徴
・速い


機能


転置インデクス方式
・インデクス作成時に文書を解析して単語に切り分け、単語ごとにそれが含まれている文書の情報を記録しておく
・予め転置インデクスを作成しておくことで、ある単語で検索した時に、その単語がどの文書に含まれているのかをすぐに探しだすことができる
・インデクス作成には時間を要するが、一旦インデクスを作成した後は、高速に検索できるのが利点

インデックスレプリケーション
・あるSolrサーバで生成したインデックスデータを、他のSolrサーバに自動でコピー(複製同期)することが可能

分散インデックス
・複数のSolrサーバに分散しているインデックスから返される検索結果を取りまとめて処理する
・インデックスが大規模になった時にマスタースレーブを作ったり、インデックスを分割したりとサーバーの負荷を軽減して高速検索を可能にする

適合度(Score)
・検索結果を「適合度(Score)」によって順序付ける
・適合度の算出は、「tf-idf」と呼ばれる方法で、文章中の単語の重み付けを行う

ファセット機能
・絞り込み
・単語、クエリ、範囲に対する件数を返す


要件


javaのインストール

Twitter検索結果。「Apache Solr」に関する最新ツイート


検索エンジン

転置インデックス

コメント投稿(ログインが必要)



類似度ページランキング
順位 ページタイトル抜粋
1 Apache JMeter 67
2 Same-origin policy 62
3 Ordinal Scale 58
4 Chromecast 57
5 PowerShell 57
6 article 56
7 Flash Video 55
8 AirPlay 44
9 Eclipse 44
10 activeCollab 43
11 Basecamp 42
12 Headless Browsers 41
13 Hyper Estraier 40
14 Cross-Origin Resource Sharing 40
15 リスト探索(list search)アルゴリズム 40
16 curl 40
17 cron 40
18 memcached 40
19 curl 40
20 Subversion 38
2022/7/03 1:53 更新
週間人気ページランキング / 6-26 → 7-2
順位 ページタイトル抜粋 アクセス数
1 ベクトル | 数学 | プログラミング用語 268
1 curl | HTTPクライアント(ネットワーク) | プログラミング用語 268
2 ルーター | ネットワーク | プログラミング用語 267
3 Flash Video | コンテナフォーマット | プログラミング用語 265
4 正規表現 | プログラミング | プログラミング用語 261
5 デーモン | Linux | プログラミング用語 258
6 ユースケース | 開発 | プログラミング用語 237
7 チェックアウト | バージョン管理システム(開発) | プログラミング用語 158
8 YouTube | API | プログラミング用語 128
9 Linux | プログラミング用語 45
10 PowerShell | スクリプト | プログラミング用語 44
11 可搬性 | プログラミング | プログラミング用語 33
12 クローラ | 検索エンジン | プログラミング用語 25
13 Subversion | バージョン管理システム(開発) | プログラミング用語 23
14 アンチパターン | プログラミング | プログラミング用語 11
15 プログラミング用語 9
16 deflate | ネットワーク | プログラミング用語 8
17 Nginx / Nginxとは?/ Apacheとの違い | プログラミング用語 6
17 YouTubeに掲載されている動画を、ユーザーが作成したWebサービス上で再生する方法 | プログラミング用語 6
17 WebLogic | アプリケーションサーバ(サーバ) | プログラミング用語 6
2022/7/3 1:01 更新