メッセージ。 - あ。ニューロやられて...

# あ。ニューロやられて...

あ。ニューロやられてたんですかぁ。ぼくも、同じ研究室に3段のニューラルネットワークで文字認識の研究をやってる人がいましたー。 (^-^)

とりあえず2段目についてコメントしますね。「ファジー」(というのは、プロ相手には語弊がありましたね)な処理はいらないだろうという考えは、よく分かります。ぼくも同じように考えたことがあります。で、実際にやってみたんですよ。

するとですね、たしかにアルファベット前後のスペースは、単純な置換処理でうまく削除できました。ただ、100%期待したものにはならなかったんですね。結果をちゃんとメモらなかったのでアレなんですけど、次のような問題があったように記憶しています。

(1)AAの中のスペースまで取ってしまう(ソースコードの中なども同様)
(2)句読点として「, 」と「. 」を使う流派の場合、問題が複雑になる(句読点とカンマ、ピリオドの意味論を区別できない。また、カンマ・ピリオド前後のスペースはどうするか問題が発生する)
(3)一行を80文字程度で折り返す流派の場合も、問題が複雑になる(単純に改行を削除してレンダリングすればいいのか。改行をスペースの意味で使う流派もありそう。そもそも改行ってなんだっけ?みたいな)

こういうことがあって、「あーもうだめだーボカーン!」ってなった経験があります。要は、100%は不可能ってことですね。機械がうまくやってくれればいいけど、90%ぐらいまでしかうまく動かない。あとは余計なお世話になっちゃう。

90%でよしとするか、ダメとするかは人それぞれかなぁ……。でもとにかく、100%はない。そして、機械を使う人間は、「100%はない」ということを知っておくしかしょうがないと思うのです。機械にうまくやらせようとしても無理って、知ってないと、落とし穴に落ちるよって。
2006-06-27 11:28:34 / ふじさわ / Comment: 0 / Trackback: 0

Comment

コメント投稿機能は無効化されています。

Trackback

TrackBack投稿機能は無効化されています。