TokunagaTsukasa | 徳永司

単語の出現頻度の分析

文章中にどの単語がどのくらいの数出現するのか調べたくて方法を探した。素直にGoogleで検索すると、SEO関連のサイトが多い。

探していると、よさそうなページを発見。 ―日本語文章の頻度分析

Wordで出来るなら簡単だなーと思いながら試してみると、分析したい文章が長すぎてWordにコピペするとフリーズしてしまい断念。同ページで紹介された、形態素解析システムと呼ばれるもので処理できないかと検索してみると、これまた良さそうなページを発見。 ―単語の出現頻度を求める

上記のページで紹介されていた、MeCabを下記ページを参考にインストール。 ―MacにMecabをインストールする (2013.3)

./configure コマンドを実行するとエラーが発生してしまい、ハマる。エラー文で検索してみると、Xcodeがインストールされていないのが原因らしい。 ―Mavericksでbrew upgradeしたらハマった話

Xcodeをインストールすると、無事コマンドを実行できインストールすることができた。

自然言語処理という、言葉だけは知っていたが、Wikipediaを少し読んでみると考え方などがとても面白そうだ。関係する書籍に少し目を通してみたい。

Prev 成人式の話 Next QGISのインストール