発言から人物像のカラーリング
やってみたいこと&現時点でざっくり出来そうなこととしてアイディアをメモ。
そもそも私はMAGIシステムを作りたいと思っていた小学生。
最近はサイコパスのシビュラシステムにも影響を受けつつ。
とりあえず簡単に、ユニークユーザの発言等が一定数以上存在するデータストアから、そのユーザの発言に含まれる感情を分類し、感情に紐づくその人の色相のようなものを表示してみたい。
感情の分類は以下WikiのPlutchikの感情の輪あたりを採用するとして、ざっと32色ほどあればよいのでは。 感情の一覧 - Wikipedia
頻出上位を出現割合に合わせてストライプ様にしてもいいし、マーブルにしてもいいし。
直観的にわかりやすいもので。
発言を拾うデータストアはTwitterあたりでいいと思う。
対象は日本語のみ。
ただ、言葉が本来持つ意味からくる感情と、現代日本人が使用する際に充てる感情が違う言葉はどうせ存在するので、そのあたりどうするかは要検討。(※1)
単語前後にある「ない」(否定)とか「かな」(疑問・曖昧)も拾わないときっと正しく判定出来ない気がする。
形態素解析は昔ちょっと調べたlucene-gosen https://code.google.com/p/lucene-gosen/ とか?
新しい、良いものがあればそれで。
そもそも、日本語と感情をよろしく分類してくれるライブラリがどこかしらにはきっと存在していると思っているので、それは調査する。
※1のために、最初は教鞭をとりつつ辞書作るなら機械学習も必要かもしれない?
Mahout http://mahout.apache.org/ よりいいもの出てるかな。
この辺りを使って遊びたかったんだ。我ながら結構興味あったなーとしみじみ。
名称 | URL | 用途 |
---|---|---|
https://dev.twitter.com/overview/documentation | 解析対象データ収集先 | |
lucene-gosen | https://code.google.com/p/lucene-gosen/ | 形態素解析器 |
Mahout | http://mahout.apache.org/ | 機械学習 |
(適宜更新)
このアイディアの具現化に必要で、メモしておきたいのはこれくらいかな。
うぇぶあぷり的なものにするとして、軽めのフレームワークはせめて使いたいなー。
Playは使い慣れているけど、あんなに色々はいらないので・・・
大好きtwirl(笑)とか、ルーティング捌いてくれるあれとか(名前ど忘れしたw)あればいいのかなー。
まぁ、一人の人が、「発する」言葉なんて、本人の思考パターンや性格をそのまま反映している人もいれば、真逆だって人もいるでしょう。
とはいえ、それを見る・受ける人が感じているイメージとしては適切なものになる気がするので、他個分析くらいには使える?
自分はどう見えているか、見せたい自分になっているか、その辺が可視化されるおもちゃですねー。