電子化ぐらし

人情

人情本刊行会の村上静人、歿年は何時なのかというと、古書通信に記事があった。 小林信行「「アカギ叢書」と村上静人」(日本古書通信 2007年1月号) 1960年歿である。つまり、今年末に著作権保護期間が終了する。 人情本刊行会叢書を全部うわづら化できれば…

docune消滅

docuneの消滅は、やはりショックだ。 http://service.okwave.jp/dqn/ 知らぬうちに告知され、知らぬうちに消えていた。その間、5日*1。 登録の際にはメールアドレスも入れたはずだが、そこへの連絡も無し。 最初は、おそるおそる挙げた、著作権保護期間満了…

海舟座談

没年不詳者の部分は電子化せずに公開するわけだが( http://docune.jp/doc/6723 )、出て来る人を調べていると、どうも、龜谷天尊(http://d.hatena.ne.jp/jyunku/20080731/)だとか、神保町のオタさんが関わる人が居そう。 滝川辰郎(瀧川龍舟)の没年とかご…

かけ忘れ

人のお話を伺いながら、関連するファイルを探してみたが、見当たらない。 電子化した記憶はあるのだが…… デスクトップPCのHDを探してみたら、 画像にしただけで、OCRにかけていないファイル群がみつかった。もったいない。

去年の11月ぐらいにブックマークしていた* http://www.myopenarchive.org/ が、本格稼働となったらしい。 未発表の学術論文を投稿・共有するサイトです。 と、「未発表の」となっているのはなぜだろう。既発表であっても、既発表媒体が転載に理解を示してい…

更新情報

http://docune.jp/people/851/「子どもの日」にちなんで、「少年必読日本文庫」*特集。 大江玄圃・間合早学問 http://docune.jp/doc/4283 此書「間合早學問」と題す。少年の人の爲に漢學をする捷徑を示したるもの也。其言卑近に似たれども亦登高の楷梯とすべ…

更新情報

http://docune.jp/people/851/ ↑ここにはRSSなどがないので、 http://uwazura.seesaa.net/ ↑ここで報告した方がよいとは思うのですが、面倒です。 この「くうざん本を見る」で報告するかな。 江村北海『授業篇』(少年必読日本文庫) 少年の皆さん、必読です。…

「影を慕いて」

最近は皆さん、これをコンピューターで、モニターに写してそこで見よう、それで見たつもりになるということが実に浅はかです(笑)。それは影です。影をいくら見ても…影を慕いてという歌はありましたけれども、せいぜい慕う程度にしておいたほうがよろしい(笑)…

複製

ゼロックスの複本を作ってたれの手にも届くところに置くに如かない。複本では原本を構成する紙の質とか筆墨の味とかいふ美的要素はうしなはれるにしても、逆に原文からすべての美意識のほこりを払って、これに今日の光をあてるといふ益がある。 石川淳「ゼロ…

裁断機

念願の、手動裁断機が届いた。もっと分厚いのが切れるようなものにするつもりだったけれど、重量を見てひるみ、130枚タイプにした。ところが、これも重かった。机上に何とかスペースを作り、置く。付属品のドライバーと、ハンドル固定用のネヂの穴が合わず、…

うわづら置き場を探せ2

http://www.thinkfreedocs.com/index_jp.phpファイルあたり10Mバイトまで。総容量は1GB。 おや? 1GBというのは、こちらの方か? http://www.thinkfree.com/myoffice/main.tfo?method=main よくわからない。 ここに一つ、ファイルを置いたのだけれど。 http:/…

うわづら置き場を探せ

http://docune.jp/ ここなどどうだろう、と幾つか置いてみて様子見。 ファイルあたり15Mバイトまで。総容量は不明。

本の破り方・糸綴じの場合―97531、97531

糸綴じ(糸かがり綴じ)の場合、16ページ(8枚)分が一纏まりになっていることが多いので、以前は8枚ずつの纏まりに引きはがしてから、それを4枚ずつに分けてゆく、という手順を取っていたのですが、近頃では、最初から4枚ずつ引きはがすようにしています。そう…

青空文庫の署名呼びかけ動画

http://www.veoh.com/videos/v213693PSM4bpBY 貼り附けはうまく行かない。

ADFの敵

スキャナが異音をたてた。紙詰まりのようなので、いったん紙を取ってセットする。またすぐに異音。 はて、と覗いてみると、ローラーにスピン紐が絡まっている。道理で。スピン紐を取り忘れてスキャンして、その部分が読めないケースはこれまでにもあったが、…

ルビ

ルビのあること自体はよいのだけれど、本文とくっついているルビは嫌いだ。OCRで読めない。いちいちルビを消すほど暇じゃないし。

発見

しばらく行方不明になっていたファイルが発見された。ファイル名を漢字ではなくローマ字にしていたために見つからなかったようだ。残念なことに、時既に遅しで、そのファイルはあらためて作り直していた。時間の無駄だったということがわかる。 以前に附けた…

年末

今日の24:00で著作権保護期間が切れるのは、 http://www.jca.apc.org/~earthian/aozora/dead.html の他に、 秦豊吉(丸木砂土) 橋本増吉 馬場恒吾 樋口慶千代 日野草城 小泉苳三 溝口健二 宮城道雄 西村真琴 太田亮 緒方竹虎 楊樹達 石黒魯平というところか…

義賊・鼠小僧くうざん

http://d.hatena.ne.jp/NOV1975/20061214/p1 ここのコメント欄で、著作権の保護期間が切れていても、著作者の子孫には連絡を取るのが礼儀だと考えていらっしゃる方がいらっしゃる。 間違えました。 ↑ではありませんでした。 http://d.hatena.ne.jp/m-hiyama/…

OCRの誤認識・二ニ

漢数字の「二」とカタカナの「ニ」はよく間違えられるが、特に漢字片仮名交じり文をOCRに掛けた場合には、カタカナの「ニ」は殆ど漢数字にされてしまう。これを一括で修正したい。使い慣れたsedの形式。 s/二\([関關對対供]\)\([シスセ]\)/ニ\1\2/g s/\([故…

いつも読んでる「bookscanner記」の「残すもんと残さんもん」 http://d.hatena.ne.jp/bookscanner/20061123/p1 は、以下の話題と関連。 http://d.hatena.ne.jp/kuzan/20061001/1159679775

読んでからバラすか、バラしてから読むか

読む、といっても、ただ、メモも取らずに、楽しみとして、あるいは教養として読むのであれば、バラさない形で読むのが読みやすいに決まっている*1。問題は、メモを取ったりするような本の読み方の場合である。電子化など考えていなかったころ、専門書ではな…

カミとカミとの諍い

ADFで順序がくるうのは、こんな感じで。

泣き面に蜂

画像データを保存してる外附けハードディスクが行方不明になったので、見てみると何だか回転出来ていないような音を立てている。ちょっといじめすぎたか。隣のHDとの距離が近すぎたか。ちょっと熱い。 これはダメかも知れない、バックアップはどうだろうと…

面倒なチェック

OCRしたものでも、引用したり、シャブリ尽くしたりすることがないものは校正しないようにしている。校正しないとなると、一連の作業の中でもっとも面倒なのは、スキャン時に脱落がないか、というチェックである。普通の本で、ちゃんと毎ページにノンブルが付…

本を破るなんて

昨日のように、本の破り方をかいてもあまり参考にする人は居ないだろう、とは思う。本を破ることに抵抗がある人は多いだろう。私もそうだった。ADFのスキャナを買った頭初は、コピーしてあるものをスキャンしたり、わざわざコピーしたりしてからスキャンして…

本の破りかた

普段は、裁断機を使って本をバラバラの紙にするのだが、手で破ることもある。破ると言うときつい言い方だが、剥がすのでなく、破るつもりでいないと作業効率が悪いし、出来上がりが悪い場合もある。 ここでいう出来上がりとは、ADFにうまく掛かるか、つまり…

火縄銃

http://ameblo.jp/kimito001/entry-10018266306.html うん、私は火縄銃を使おう。「ロシアの鉛筆」のように。

最大の失敗

電子化ぐらしにおいて、最も後悔するのは何かというと、ADFの中に紙が巻き込まれてしまい破れてしまうことではない。復原不可能なほどに破れてしまって再スキャン出来ない場合は困るが、それでもたかだか2ページのことである。最も困るのは、本の背表紙を切…

OCRサーバー

一台はほぼADFのスキャン専用マシンと化し、別の一台はOCR用に特化している。OCRはフォルダ監視機能を使っている。高いソフトだというのに、認識能力が特段すぐれているわけではない。フォルダ監視などの際の読み込み容量が大きいのが取り柄なのだ。この2台…