このニュースひっかかります。
http://headlines.yahoo.co.jp/hl?a=20050722-00000017-nkn-ind&kz=ind
文章を最小単位に分割して品詞情報を付ける形態素解析を、収集した大量のウェブページに対して行い、形態素列の頻度とその前後の形態素の異なりとを指標とした関数を用いて用語を獲得する。
これって,アリなんすかねぇ。形態素スレ辺りで時々話題になりますけど,いくらウェブ上にあるからといって,そこからエキスを抽出するのってご法度とちゃいましたっけ?これがアリなら,みんなやりたいはずですよ〜。
なんかルール変わりましたぁ?
官民でやればOKなのですかねぇ。新聞社からバカ高いデータ買ってるひとたち,怒りませんか?
もしかして私が世間の流れについていけてないだけですか?