2009年05月08日

私のプログラムはこの文を読むことができない

昔から形態素解析を使った言語解析のプログラムをちまちま書いているのだけど、今日この記事を見て人間の遠さに少しがっかりしました。


これ、読めますか?
こんちには みさなん おんげき ですか? わしたは げんき です。
http://news.livedoor.com/article/detail/4143419/


人間は文字の最初と最後が合っていれば、その間にある文字が入れ替わっていても認識可能らしい。確かにこの記事の中にある文の大半は普通に読めてしまった。

人間は直感でいくつかの選択肢に絞るのが得意らしい。例えば将棋。とある局面において指せる手の数はコンピュータが総当り出来ないほど多い。でも、棋士はその中から有効な手を直感で数手に絞ることができるらしい。

間の文字が入れ替わっていたとしても文字の最初と最後を認識した時点で、人は言葉のパターンの中から1つの結論を導き出してしまう。私が書いている子は、いつか人の言葉を解せるようになるのだろうか。こんな間違いだらけの文章を読めるようになるのだろうか。

ニンゲン ナカンニ マタケク ナイ
posted by MW at 23:16| Comment(4) | TrackBack(0) | ニュース | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
ハードウエアは越えられない壁じゃないのかな
Posted by at 2009年05月09日 00:55
私もこの文章、さっそくドキュメントリーダーで読ませてみました。もちろん読めませんけど。

もうひとつ。これと似ていて、でも「確かに読めない」パターンってのも作れるかなぁと。
Posted by baldhatter at 2009年05月09日 10:50
はじめまして。
ちょくちょく覗かさせていただいております。

リンク先の文章は、最初違和感があったのですが、結構さくさく読めましたよ!

フリープログラマに関する(仕事や生活など)記事は楽しく読ませていただいてます。
どうやったらフリーになれるんだろうかなど思いながら・・・
一応phpでWEB開発をしています。
もしよかったら相互リンクしてもらませんか?
Posted by サムライ at 2009年05月09日 14:03
どもです。一文字ごとに予測して、その予測に近いものを(不完全であっても)採用するくらいしかないかなぁと思いました。

ぷろらぐむ

とあったら、「ぷ」「む」「5文字」で一般的な言葉を当てて、残りの文字の的中率で漁る感じ。この場合、baldhatterさんの言う「確かに読めない」パターンを読んでしまいそうですが……

簡単に書こうかと思ったのですが、ドラクエで遊んでいたので出来ませんでした。。。


>サムライ様
どもです。リンク載せました。今後ともよろしゅうお願い致します。
フリーは首都圏だとけっこうやってる会社あります。自分のような社会不適合な人間にはオススメです。
Posted by MW at 2009年05月10日 01:40
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:


この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。