自然言語処理に感じる虚しさ(Nothingless on NLP)

ナウなヤングの流行語を無理して使うオサーンの悲哀に近い。

例えば、

明治以来の実在する人名辞典を使って

「人名かどうか」を峻別するフィルタを

ディープなラーニングで作成しました!

というような話を聞いた時の感想。

マイナンバーのテーブルに直結するほうが

“スマート”だよね?

実際にそんなことはできないわけですが、あるべき実装としては後者がただしいですよね。

それでも仮に、ソーム省が

マイナンバー発行済み氏名かどうか

調べるAPI

を公開したとすると、

全人名を総当たりで

マイナンバーのテーブルをぶっこぬこうとする

輩が多数沸いてしまうわけですね。そんでもって回数制限・・・と。

 

さて、「人名かどうか」ではなく「宛先かどうか」だと、問題はさらに複雑になります。

法人名なら、登記情報を叩けばなんとかなるかもしれませんが、自営業ならどうでしょう。

やはりここでもDUNSサーバのハックが必要でしょうか?

表記も問題です。

~~㈱ 御中

~~気付

~~宅 裏

~~ビル3F Aルーム

屋号や社名を変更したらどうなるでしょうか。

 

実用的な精度で「宛先かどうか」を峻別するフィルタは実現できるでしょうか?

そんなものはベタに実装すりゃなんとかなるのです。

 

そもそも、インゲンがストリーミング指向で文章を書いたり、しゃべったりするのはあと何十年か、という話です。

脳to脳通信が一般化すれば、従来の遅くて話にならない可聴帯域向けの言語などクソの役にも立たないはずです。

TCP/IPでつながるのにUART向けのHDLCしゃべらせるんですか、という話ですな。

もちろん、旧来ジンルイ言語 over 脳間通信でも構わないですが。

 

シンギュラリティが嘘から出たマコトになりつつある現在、非常に虚しい感じがします。

もしかすると旧来の自然言語処理は、

奈良時代の絵巻物を

高精細カメラでデジタルにアーカイブする

というような考古学同様の何かになり下がるのではないかというあきらめすら感じてしまうわけです。

しかも字面や音声はすでにデジタル化可能なのですよ。

300年後、それを誰がどんな風に参照するんです?