電子出版における文字:懶惰を具体例として

2009/02/20 當山日出夫

デジタル版『内村鑑三全集』で、あたまをかかえこんだ状態。つぎのような例は、どうすればいいのか。

「懶惰」(らんだ)という内村鑑三が非常に多用する語がある。この「懶」の字については、右を、「頁」につくる字を、内村はつかっている。

用例はきわめて多い。その一例としては、「懶惰男女」として

・岩波版『内村鑑三全集』(書籍版)第2巻「基督信徒の慰」 p.12 l.9

この箇所、国会図書館近代デジタルライブラリーで確認できる。

・原本では14ページ、画面表示では、10/76。

そして、この「懶(頁)」は、0208・0213(04)の範囲内にはない。UnicodeのCJK統合漢字にない。つまり、コードポイントがない。

・書籍版では、字が正しく印刷されている。この全集の組版は、精興社。したがって、精興社が、かつて使用した文字をすべてデジタル化して保存してあるならば、ここに「表示用」としてPDFに埋め込むことは可能。

・とりあえずのデジタル版の作成では、今昔文字鏡を使用した経緯があるので、今は、文字鏡フォントになっている。文字鏡番号=011454。だが、今昔文字鏡は、通常の文字を、文字鏡フォントに切り替えて表示しているだけである。プレーンなテキストにすると(エディタにコピーすると)「艶」になる。

結局、「懶(頁)」については、
(1)なんらかのフォント(または画像)を、PDFに埋め込んで表示することは可能。表示用のPDFとして。
(2)しかし、検索はできない。そもそも、検索のために文字を入力することからして不可能。検索用のPDF、インデックス用テキストファイルでは、あつかえない。
(3)論文を書くなどの時、PDFからコピー(ワープロ、または、エディタ)すると、字が化けるか、消えて無くなるか、いずれかになる。

つまり、「懶(頁)」は、現在のデジタル環境では、使用できない文字になる。共有できる、公的な、コードポイントを持たない。

解決策は、次のいずれか。

(1)どうせワープロで、原本どおりの字がつかえないのであるならば、通常の「懶」に置き換えてしまう。ただし、その旨、デジタル版全集の凡例において明記が必要。

このような処置(全集で使用していない字を置き換える)は、他にも多くある。現時点では、「祈祷」「冒涜」など、拡張新字体(0208)で入力してある。これを、そのまま残すか、0213(04)に変更するか。書籍版全集は、「常用漢字旧字体」が基本であるから、0213(04)準拠が、最も適している。個人的には、「冒涜」の拡張新字体を使うぐらいなら、「懶(頁)」への変更も、かまわないのではと思えるが、どうであろうか。

(2)デジタル版全集を利用の方は、今昔文字鏡をお買い求め下さい、とする。この方式であれば、一番、問題がなさそうにも思える。だが、フォントのライセンスを厳格に考えるならば、非常に窮屈な方法になる。また、DVD版の予定価格は、6万円。それにプラスして、今昔文字鏡を買って下さい(いや、買わなければなりません)とは言いにくい。

また、当然ながら、ワープロ(WORDや一太郎)では利用できても(見えても)、プレーンテキストの利用は無理。きわめて、制限をうけた使い方しかできない。

(3)であるならば、いっそのこと、ゲタ(〓)にして処理する。「懶惰」という用語を検索しようと入力しても検索不可能。「艶惰」にしなければならない(今昔文字鏡にしたがうと)などと、別に一覧をかかげなければならない。これを見過ごしたら、検索不可で、全集に無い語になってしまう。

以上は、「検索」ということを前提に考えた場合。この場合は、まだ、その文字を意識しているから、なんとかなる。だが、他の語を検索して、それをふくむ前後の文章を「引用」して使おうとしたとき、問題はより深刻になる。

ここで例に出した「懶惰」の周囲を見ると「神の職工場」という、おそらく内村鑑三研究にとっては重要なキーワードが使用されている。では、「神の職工場」で検索をしたとき、そして、それを論文に引用しようとしたとき、

(1)「懶(頁)」が、他の字に化けてしまったり、まったく、欠落してしまったりしていた場合、それを、読んで発見する。

(2)ゲタ(〓)になっているので、0213(04)で使えない字であることが分かる。正しい字は、書籍版全集、または、閲覧用PDFで、文字が確認できる。この場合、「懶惰」と表記を改めて引用するか、今昔文字鏡で「懶(頁)」を使用するか、これは、ユーザの判断になる。

実用的に考えて、
(1)で、化けてしまった字、消えて無くなった字、を目でみて探す。
(2)ゲタ(〓)として、見えている字について、なんらかの対応策をとる。
このいずれが、デジタル版全集の利活用においてミスが無く、現実的・実用的であるか。

私は、(2)の方であると考える。いや、(1)を支持する自信がない。(1)に賛成するひとには、「校正おそるべし」ということばを知っておいてもらいたい。

あるいは、こうもいえよう。現在のデジタル文字の環境において、「美しさをもとめる、確かにゲタ(〓)の入った画面は、きれいではない」か、あるいは、「学術的利用としての安定性・確実性をもとめる」、このいずれの立場をとるか、である。

ここで、最初の問題にかえる。内村鑑三は、「懶(頁)惰」を使用している。しかし、この表記(字体)を忠実に再現して、現在のデジタル環境において、表示の安定性、検索の可能性を確保することは、きわめて困難である。

これとは別に、「葛」「昂(志賀重昂)」などの処理もあるが、後ほど。

ついでに、余計なことをいえば、ここで事例に出した『基督信徒の慰』は、変体仮名活字が使用してある。それを、現在、通行の仮名字体にすべてなおすのであることに何のためらいもないのだろうか。近代デジタルライブラーで見る限り、助詞の「は」については、「は・ハ」をつかいわけている。本文では「ハ」、ルビでは「は」。しかし、なにゆえ、漢字の字体について、かくも厳格でなければならないのか。

當山日出夫(とうやまひでお)