誤認識

OCRは、さかしらをすることがある。既知の文字列に引きつけてしまうのだ。


「江戸語」が「江戸詰」になってしまっているファイル群があることに気付いた。「江戸詰と東京語」とかいうのは、機械的に書き換えられるが、そうは行かないものがあって、困る。


さかしらをしないモードになっているかの確認を忘れないようにしないといけない。