MacにMeCabをインストールしPythonから使う
形態素解析ツールのMeCabをMacにインストールし、Pythonから使うための手順をまとめておきます。動作はMac OS X 10.6.2、Python 2.5.5で確認しています。
MeCabのインストール
$ sudo port install py25-mecab
ipadicのインストール
$ sudo port install mecab-ipadic-utf8
mecabrcの修正
デフォルトではEUC-JPの辞書が指定されているので、さきほどダウンロードしたUTF-8の辞書に変更する。
$ sudo vi /opt/local/etc/mecabrc
修正前:
dicdir = /opt/local/lib/mecab/dic/ipadic
修正後:
dicdir = /opt/local/lib/mecab/dic/ipadic-utf8
Pythonからテストしてみる
$ python Python 2.5.5 (r255:77872, Mar 21 2010, 18:43:03) [GCC 4.2.1 (Apple Inc. build 5646) (dot 1)] on darwin Type "help", "copyright", "credits" or "license" for more information. >>> import MeCab >>> mecab = MeCab.Tagger() >>> print mecab.parse('私の名前はmurapongです。') 私 名詞,代名詞,一般,*,*,*,私,ワタクシ,ワタクシ の 助詞,連体化,*,*,*,*,の,ノ,ノ 名前 名詞,一般,*,*,*,*,名前,ナマエ,ナマエ は 助詞,係助詞,*,*,*,*,は,ハ,ワ murapong 名詞,固有名詞,組織,*,*,*,* です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス 。 記号,句点,*,*,*,*,。,。,。 EOS
MeCabを直接使う場合
$ mecab 私の名前はmurapongです。 私 名詞,代名詞,一般,*,*,*,私,ワタクシ,ワタクシ の 助詞,連体化,*,*,*,*,の,ノ,ノ 名前 名詞,一般,*,*,*,*,名前,ナマエ,ナマエ は 助詞,係助詞,*,*,*,*,は,ハ,ワ murapong 名詞,固有名詞,組織,*,*,*,* です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス 。 記号,句点,*,*,*,*,。,。,。 EOS