OCRサーバー

一台はほぼADFのスキャン専用マシンと化し、別の一台はOCR用に特化している。OCRはフォルダ監視機能を使っている。高いソフトだというのに、認識能力が特段すぐれているわけではない。フォルダ監視などの際の読み込み容量が大きいのが取り柄なのだ。

この2台と常用の一台を共有しておいて、ADFスキャナを繋いでいるマシンからOCR専用マシンに画像ファイルを放り込むと認識を始める(始めると言うよりも、認識の順番を待つファイル群に加わる、という方がよいだろう)。


気の向いたときに、常用のマシンから、認識結果のファイルが出力されることになっているフォルダを覗いて、新しく出来たファイルを貰ってくる。しばらく新しいファイルが作られていないようなら、OCR専用マシンを実際に覗いてみる。異常終了していたり、結果が保存されない状態で止まっていたりするので、また作業をはじめさせる。このマシンは働き通しなので、熱くなったりしてちょっと心配でもある。



大規模なところのような一日三千冊というのには遙かに及ばないが、一日15冊ぐらいは出来そうだ。私と同じぐらい電子化が好きで本を裁断することにためらいがなく、私とは違って飽きっぽくなく、仕事を抱えていなければ一日30冊ぐらいはいけるだろう。