2007-10-12 誤認識 誤植? OCRは、さかしらをすることがある。既知の文字列に引きつけてしまうのだ。 「江戸語」が「江戸詰」になってしまっているファイル群があることに気付いた。「江戸詰と東京語」とかいうのは、機械的に書き換えられるが、そうは行かないものがあって、困る。 さかしらをしないモードになっているかの確認を忘れないようにしないといけない。