MeCab とは?
状態:-
閲覧数:1,925
投稿日:2009-07-09
更新日:2017-03-20
テキストデータについての、いわゆる形態素解析
・言語処理の技術のひとつ
・自然言語で書かれたテキストを、単位(品詞)ごとに分解してくれる
・開発者(工藤拓)の好物「和布蕪(めかぶ)」から取られた
単体では?
・コマンドラインベースで動作するアプリケーション
・言語処理の技術のひとつ
・自然言語で書かれたテキストを、単位(品詞)ごとに分解してくれる
・開発者(工藤拓)の好物「和布蕪(めかぶ)」から取られた
単体では?
・コマンドラインベースで動作するアプリケーション
スクリプト言語で使用するためには?
C++
「Mecab」自体はC++(?)で書かれている
この機能を自作プログラムから使うには?
標準入出力を経由してアプリケーション越しにデータをやり取りする
・関数などを直接コードから呼び出す
関数などを直接コードから呼び出すには?
MeCabの配布物に付属している(C++の)DLLファイル「libmecab.dll」をC++以外の言語から呼び出す
公式サイトで言及している各種スクリプト言語バインディング(perl/ruby/python/java/C#)
・他言語でアクセスする「スクリプト言語バインディング(perl/ruby/python/java/C#)」はあるが、 PHPは存在していない(少なくとも公式的には)
PHPで「Mecab」を利用するには?
コマンドで使用するか、非公式のエクステンションを利用するしかない
・コマンド使用のサンプルコードはすぐに動作可能だが、非公式のエクステンションはインストールが必要
方法1
・パイプ利用(MeCabは標準入力から日本語を受け取り、標準出力に解析結果を返すため使わないといけない)
方法2
・非公式のエクステンション利用