内村鑑三全集の拡張新字体

2009/02/02 當山日出夫

そろそろ花粉症のシーズンで、モーローとしている。この時期、本を読むのがつらくなる。紙の裁断面からのこまかな、紙の粉(?)。新刊の本を、パラパラめくっただけで、くしゃみがでる。学生のとき、約3万枚のカードを、手書きで書いて、並べ直して、索引(漢字:部首順、訓読文:五十音順)を、作ってからのこと。

とはいいながらも、内村鑑三をあれこれながめている。

現時点での問題点は、(私の考えるところ)、

とにかく売ること。より多くのひとにつかってもらうために。そして、その利用のうちに、プレーンなテキストファイルの利用をふくめたい。ISBNをつけて、市場で流通させる。

しかし、現在のデータで、本文のテキストファイルが容易には、得られない。全集(岩波)を、そのまま、一太郎で、再現してあるので、原本のルビと、編集での追加ルビの、これを区別してとりだして、どうにかするしかない。いっそのこと、力仕事で、XMLか、と思うが、どうしよう。

過去10年以上のわたる仕事のため、文字コードの処理が不統一。というより、0208+0213:04(今昔文字鏡から変換)というセット。つまり、かなりの、拡張新字体を含む。これを、可能な限り、いわゆる旧字体になおすか、どうか。

特に、「涜」(さんずい+売)など、「瀆」(さんずい+賣)に、なおすかどうか。

さあ、どうしようかなあ、というところである。

當山日出夫(とうやまひでお)