電子翻刻における「読み」と「見たまま」

2009/06/22 當山日出夫

日本語練習中
http://d.hatena.ne.jp/uakira/20090615

による。

青空文庫
芝野耕司先生講演会「電子翻刻における「読み」と「見たまま」」開催のお知らせ
http://www.aozora.gr.jp/soramoyou/soramoyouindex.html#000297

テーマ:「電子翻刻における「読み」と「見たまま」」
講師:芝野耕司先生(東京外国語大学アジア・アフリカ言語文化研究所教授)
日時:7月4日(土) 午後2時30分〜4時30分
会場:東京国際フォーラム 会議室 G407

講演テーマは以下のごとくある。

青空文庫は、電子化の作業の足場を、JIS X 0208JIS X 0213と呼ばれる文字コードに置いています。
前者の1997年改訂において、また後者の2000年の制定においても、原案作成委員会の委員長を務められのが、芝野耕司先生です。

青空文庫では、紙に印刷されたり書かれたりした文献を、テキストに置き換えてきました。
その作業を通じて、私たちがやってきたことは、何だったのでしょう?

もちろん、そんな理屈っぽいことを言わなくても、普段の作業は、問題なく進められます。
ところが文字の中には取り扱いのむつかしいものがあって、その処理方針を巡り、青空文庫は、電子翻刻をめぐる長い論議を体験しました。
きっかけとなったのは、5-17(ケ)と5-86(ヶ)が、日本語のどの文字に対応しているかの解釈でした。

「JIS漢字コードが符号化しているのは、社会に通用してきた「文字」である。その中で「ケ」のような形をしたものには、「け」と読む片仮名と、「こ」「か」「が」と読む漢字がある。異論もあるが、青空文庫の作業では、その立場をとる。実作業では、底本の文脈を読み、入力対象がどちらかを見きわめて、対応するコードを入れよう。」
こうした、「読み」に立脚する立場が主張されました。

もう一方からは、「JIS漢字コードは、「文字の種類」と「形」の組み合わせのみを規定している。「ケ」の形をしたものは、JISには、大小二つのパターンが、片仮名のみにある。底本の「ケ」のような形をした文字は、この大小の差異をキーとして、どちらで入れるか決めるべきなのだ。」とする、「見かけ」を重視する立場が主張されました。

ぶつかったのは、電子翻刻における「読み」と「見たまま」の二つのイメージです。

長く紙の書籍に蓄えられてきた知識や表現を、私たちは今、電子ファイルに移そうとしています。
国立国会図書館近代デジタルライブラリーや、グーグルブック検索、高麗大蔵経入力プロジェクトなど、あらゆる文献の電子化計画において、二つの立場は、作業方針に関わり、成果物の形を決めてくるでしょう。

芝野先生には、世界中で広範に進み始めた文献の電子化作業を見渡しながら、電子翻刻における、「読み」と「見たまま」についてお話しいただきます。(倫)

こここでは、電子翻刻といっているが、基本的なながれは、文字をうつす、ということにある、だろう。

行きたいが、どうも、いけそうになない。残念。

當山日出夫(とうやまひでお)