読者です 読者をやめる 読者になる 読者になる

MacにMeCabをインストールしPythonから使う

形態素解析ツールのMeCabをMacにインストールし、Pythonから使うための手順をまとめておきます。動作はMac OS X 10.6.2、Python 2.5.5で確認しています。

MeCabのインストール

$ sudo port install py25-mecab

ipadicのインストール

$ sudo port install mecab-ipadic-utf8

mecabrcの修正

デフォルトではEUC-JPの辞書が指定されているので、さきほどダウンロードしたUTF-8の辞書に変更する。

$ sudo vi /opt/local/etc/mecabrc 

修正前:

dicdir = /opt/local/lib/mecab/dic/ipadic

修正後:

dicdir = /opt/local/lib/mecab/dic/ipadic-utf8

Pythonからテストしてみる

$ python
Python 2.5.5 (r255:77872, Mar 21 2010, 18:43:03) 
[GCC 4.2.1 (Apple Inc. build 5646) (dot 1)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import MeCab
>>> mecab = MeCab.Tagger()
>>> print mecab.parse('私の名前はmurapongです。')
私	名詞,代名詞,一般,*,*,*,私,ワタクシ,ワタクシ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
名前	名詞,一般,*,*,*,*,名前,ナマエ,ナマエ
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
murapong	名詞,固有名詞,組織,*,*,*,*
です	助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
。	記号,句点,*,*,*,*,。,。,。
EOS

MeCabを直接使う場合

$ mecab
私の名前はmurapongです。
私	名詞,代名詞,一般,*,*,*,私,ワタクシ,ワタクシ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
名前	名詞,一般,*,*,*,*,名前,ナマエ,ナマエ
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
murapong	名詞,固有名詞,組織,*,*,*,*
です	助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
。	記号,句点,*,*,*,*,。,。,。
EOS