仮名とコンピュータ

2016-08-17 當山日出夫


仮名について考えてみているのだが……やはり、ここでも「コンピュータで使える文字」という制約のようなものを感じないではいられない。これは、ニワトリとタマゴのようなものかもしれない。


このような文字が実際に使われているのでコンピュータで使うように規格をさだめる。そして、逆に、コンピュータで使える文字を使って書かざるをえないので、実際の表記がそれに制約をうける。


このことが、問題になったのは、先年の新しい常用漢字の改訂のときであった。このとき、現行のコンピュータで使用されている文字がどうであるか、ということがかなりの論点になった。(このようなことについては、このブログの過去の記事にいくつか書いておいたことがある。)


仮名についても、同様かもしれない。これは、実証的な研究が必要なことなのであるが、おそらくは、通常の日本語を書くために必要な文字(仮名)という認識があった。この背景には、おそらく現代仮名遣いのことを考えておくべきであろう。この観点からは、1978 年の0208規格(当初は、『JIS C 6226』)において、変体仮名ははいる余地がなかった。また、濁点つきの「う」(う゛)や、小書きの「か」「け」も必要のないものと認識された。


それが、その後、外来語の表記の制定、アイヌ語表記の必要、JIS規格における平仮名と片仮名の整合性の必要、このような理由で、0213規格において、文字が追加された。


たぶん、JIS規格にのみ目を向けて考えるならば、このような筋道で考えてよいことになる。


だが、今日、実際のコンピュータの文字は、ユニコードである。この状況のなかでは、JIS規格にない文字であっても使用可能である。これは、特に漢字についていえることであるが、それ以外の多言語情報処理という観点からは、各種の言語の表記に対応しうるということになる。そして、そのなかに仮名もある。そして、将来においては、変体仮名ユニコードとして使用可能になる。JIS規格においてではないのである。


大きな筋道としては、上記のように考えてみてよいのではないかと思っている。いわゆる「外字」という方法がないではないにしても、「コンピュータで使える文字だけが文字である」ということは、仮名についても、ある意味ではいえそうである。


そして、実際の世の中の仮名の使用はどうであったかというと、コンピュータに拘束されない文字の世界があった。特に景観文字については、そういえると思う。わかりやすくいえば、「蕎麦屋」の「そば」の変体仮名などである。


このような閉じた領域でのコンピュータ文字としての仮名、一方で、開かれた領域をもったものとしての仮名、この二つの側面が現代の仮名のあり方であろう。仮名の開かれた文字としての側面については、改めて考えてみたい。

変体仮名が必要とされる理由

2016-08-16 當山日出夫


0208の仮名から、0213で増えて、さらに、こんどユニコード変体仮名がふえようとしている。その理由を確認しておきたい。


私なりに整理すると次のようになるだろう。
(1)
学術利用
・仮名字体史研究
・古文書や古記録などの翻刻
(2)
行政利用
・戸籍事務


このうち私のかかわったのは、(1)の学術利用についてである。学術(日本語学、日本文学、日本史学、古文書学など)の分野での、変体仮名の需要はたしかにある。


ここで確認しておきたいことは、主に日本文学などの分野で変体仮名で、テキストを翻刻することを目的としたものではない、ということである。また、一般の商業的な利用も念頭にはおいていない。


まず、翻刻であるが……「翻刻」というのをどう定義するかにもよるが、基本的には、昔の崩し字、変体仮名などを、現代の通行の文字(漢字、仮名)におきかえて、読みやすいテキストをつくること、ととりあえず考えてみる。このとき、変体仮名は不必要である。変体仮名で書かれているものを、現代の普通の仮名に書き直すことが翻刻の仕事なのであって、変体仮名のまま翻刻したのでは、変体仮名を知っている人しか読めないテキストになってしまう。これは、通常、翻刻とはいわないだろう。


そうではなく、昔の書物や古文書などに、どのような変体仮名がつかわれていたか、日本語学の研究分野において、文字史・表記史からの研究がある。このような研究分野においては、変体仮名フォントは、必要なものになってくる。そして、今般の変体仮名ユニコード提案においても、これまでの文字史・表記史の研究論文については、チェックをかけている。その論文が書けるようになるかどうかは調査して文字を選んでいる。


だが、ともあれ、変体仮名が将来ユニコードで使用可能になったとして、そこで次のことが改めて問われることになるだろう……それは、仮名の字体とはなんであるのか、それ文字コードをあたえるということは、文字の何に対して、どのような認識のもとに、コード化していることなのか。


そして、それは、先にのべた草仮名をどのように認識するか、と関連してくるはずである。

JIS規格の平仮名と片仮名

2016-08-15 當山日出夫


これまで見てきたところによると、どうもJIS規格においては、平仮名と片仮名は、整合性という点で、問題を残しているように思える。意図的にそのようにしたというのではないであろうが、結果的にはそうなっている。


0208において、片仮名のみに、「ヴ、ヵ、ヶ」があり、それに対応する平仮名はなかった。


それが、0213になって、対応する平仮名「ゔ、ゕ、ゖ」が追加になった。と同時に、外来語表記用に、「ヷ、ヸ、ヹ、ヺ」が追加になっているが、それに対応する平仮名は、0213にははいっていない。


またアイヌ語用には、片仮名が追加になっているのであって、それに対応する平仮名はない。(これは、その用途を考えればなっとくできることではあるが。)


結果的に、平仮名・片仮名が、別系統の文字として、平行して存在することになっている。同じ文字列を、平仮名でも片仮名でも、同じように書けるということはない。片仮名専用文字というものを持つことになっている。


ここで、次のような疑問が生じることになる。日本語の表記において、平仮名と片仮名は別の系統に属する別々の文字であるのか、あるいは、同じ音(あるいは、同じ語)を表しうる種類は違うが基本的に同じ文字、ということになるのであろうか。


これは、おそらく日本語の表記史の流れの中で、平仮名と片仮名の関係をどのように位置づけるかで、考え方が変わってくるところの問題であると思う。ここで、私は結論を出そうというのではない。しかし、JIS規格の文字(平仮名・片仮名)を見るときに、日本語の表記史からの視点というものが、あってもよいと思うのである。


JIS規格を見ている限り、平仮名・片仮名において、整合性をたもとうとするベクトルと、その用途に応じて必要とされる(使用される)文字は異なるのであるとするベクトルと、二つの方向性が、同時に観察されるように思える。


なぜこんなことを考えてみるかというと、JIS規格は、何をきめたものなのか。そして、ユニコードは何をきめたものなのか。それは、どのように運用可能なものなのか、という点に論点がおよぶと思うからである。


ユニコードの運用という観点にたって見るならば、濁点つきの平仮名「わゐゑを」もありうることになる。現実の問題としては、ワープロ編集画面で、使用することはできる。あるいは、将来的には、濁点つき、半濁点つきの変体仮名もありうる、その可能性を否定できない。


また、半濁点つきの「かきくけこ」「カキクケコ」(ガ行鼻濁音)は、ユニコードにははいっていない。これは、合成でしめすことになっている。


では、JIS規格で文字が決まっていることの意味とは何なのであろうか。

0213で増えた仮名の由来

2016-08-14 當山日出夫


0208で使用できる仮名は、昨日、書いたとおりである。これに対して、0213では、仮名が増えている。その典拠を確認しておきたい。


まず、次のように分けて考えることができようか。その由来について分類して考えてみることにする。


半濁点つきの仮名(ガ行鼻濁音)
か゚き゚く゚け゚こ゚
カ゚キ゚ク゚ケ゚コ゚


片仮名に対応した平仮名
ゔ(片仮名=ヴ)
ゕ(片仮名=ヵ)
ゖ(片仮名=ヶ)


濁点つきの仮名(外来語表記)
ヷヸヹヺ


半濁点つきの片仮名(アイヌ語表記)
セ゚ツ゚ト゚


小書き片仮名(アイヌ語表記)
ㇰㇱㇲㇳㇴㇵㇷㇸㇹㇷ゚ㇺㇻㇼㇽㇾㇿ



以上をまとめると、次の4点になる。


(1)
ガ行鼻濁音の表記。


(2)
片仮名(ヴヵヶ)に対応させる形での、平仮名の追加。


(3)
外来語表記のための片仮名の追加。


(4)
アイヌ語表記のための片仮名の追加。


どれも、日本語学的には、納得のいくものであるといってよいであろう。


なお、ここで確認しておきたいのは、外来語の表記。これが、次を典拠としていること。


外来語の表記
平成3年の内閣告示第2号


これのことだろう。
http://www.mext.go.jp/b_menu/hakusho/nc/k19910628002/k19910628002.html



なお、平成3年は、1991年にあたる。したがって、2000年制定の『JIS X 0213:2000』が、これを反映しているのは当然のことといってよ。


ちなみに、この文章は、EmEditorで書いている。仮名の入力は、ATOK2016(文字パレット)を使用。使用のコンピュータは、Windows10。表示は、正しくなされている。
これを、別のエディタ(WZ、MIFES)で見ると、表示がみだれる。ただ、ワープロ一太郎、Word)の編集画面で見ると、きちんと表示する。


付記
上記の記事を、アップロードした後、ブラウザで確認してみると、私の使用している
Forefox
GoogleChrome
では、正しく表示されている。

「0208」の仮名

2016-08-13 當山日出夫
2016-09-13 追記 「ゎ」「ヮ」を追加


ここで、「0208」で仮名がどれだけ使えたか、確認しておきたい。


平仮名
あいうえお ぁぃぅぇぉ
かきくけこ 
がぎぐげご
さしすせそ
ざじずぜぞ 
たちつてと っ
だぢづでど
なにぬねの
はひふへほ
ばびぶべぼ
ぱぴぷぺぽ
まみむめも
や ゆ よ ゃ ゅ ょ
らりるれろ
わゐ ゑを ゎ


片仮名
アイウエオ ァィゥェォ
カキクケコ
ガギグゲゴ
サシスセソ
ザシズゼゾ
タチツテト ッ
ダヂヅデド
ナニヌネノ
ハヒフヘホ
バビブベボ
パピプペポ
マミムメモ
ヤ ユ ヨ ャ ュ ョ
ラリルレロ
ワヰ ヱヲ ヮ




確認しておくならば、「0208」、正式名称は、


「7ビット及び8ビットの2バイト情報交換用符号化漢字集合」
JIS X 0208:1997


であり、その


1.適用範囲


の備考に、


「この規格では、平仮名、片仮名、ラテン文字などの非漢字も含めて、”漢字集合”と呼ぶ。」


とある。


つまり、平仮名も「0208」で規定されていたと理解していいだろう。そして、その区点に、平仮名・片仮名も配置されている。


そして、重要だと私が考えることは、この平仮名・片仮名で、特に不満の声は聞かれなかったということである。少なくとも、漢字ほどには批判はなかったと覚えている。

『JIS漢字字典』とJIS仮名

2016-08-12 當山日出夫

ここで、『JIS漢字字典』について見ておきたい。私は、二種類のものをもっている。(ここでいう『JIS漢字字典』とは、日本規格協会から出版の本のこと。一般のJISコード字典の類ではない。これはこれとして、以前、ある研究会で発表したことがある。)


(1).芝野耕司(編).『JIS漢字字典』.日本規格協会.1997


(2).芝野耕司(編).『増補改訂 JIS漢字字典』.日本規格協会.2002


この二種類の『JIS漢字字典』は、その収録対象の文字がおおきくことなっている。先に、1997年に刊行のものは、漢字のみである。それも、第一・第二水準のものに限定されている。1997年の刊行であるから、『JIS X 0213:2000』の刊行前である。これは当然のことかもしれない。だが、注意しておくべきことは、これは漢字のみを対象としていて、非漢字……ここであつかっている仮名などが中心になるが……は、対象となっていない。


後で刊行の『増補改訂』版の方。これは、第三・第四水準の文字の追加をふまえて、漢字だけではなく、非漢字……仮名をふくむことになる……も、対象としている。これは、新しいJIS規格になって、漢字以外の文字なども増えたことを考えれば、当然のことかもしれない。


漢字の配列の方針も大きく異なっている。(1)の先に刊行の方は、第一・第二水準の漢字を、そのコード順に収録して、検索は索引(音訓索引・部首画数索引)でおこなうようになっている。これに対して、(2)の『増補改訂』版の方は、第四水準までの全部の漢字が、部首画数配列となり、それに索引(音訓索引)がついている、という体裁である。そして、漢字のあとに、非漢字(仮名など)が収録されている。


ここで、ある疑問がある。では、なぜ最初の『JIS漢字字典』(1997)では、仮名は対象としていないのであろうか。収録したとしても、その字数はわずかなものである。本にするのに困難が生じるというものではない。この本の主な編集方針が、JIS規格にふくまれる文字の解説であるにもかかわらず、漢字のみであって、仮名は対象となっていない。


それは、編集の意図が、漢字(JIS漢字)におかれていたことに起因すると思われる。


この背景にあるのは、JIS漢字批判である。いわく、この字がはいっていない、この字の字体が気に入らない、といった批判に対して、JIS規格で決められた漢字の氏素性をあきらかにしておこうという背景があってのことと、今になってふりかえってみれば、思うのである。


私の経験的知識からしても、確かにJIS漢字は批判された。だが、仮名はどうだっただろうか。JIS仮名への批判というのがあっただろうか……これについては、私の経験からすると、なかったとしかいいようがない。


JIS仮名は、変体仮名が書けない。だが、印刷史から見れば、かつては変体仮名活字がつかわれていた時代があった。ならば、変体仮名が書けないJIS仮名は、日本文化を正しく継承する役割をはたしていない、さらには、日本文化を破壊している、このような批判があってもよかった、はずである。だが、そのような批判はなかった。


そして、今般の変体仮名ユニコード提案についても、そのことへの批判もあまりないかわりに、大歓迎の声もさほど多くはないように感じている。一般には、コンピュータで変体仮名が使えるようになれば便利になる、この程度のうけとめようであろう、と私などは感じている。


では、なぜ、JIS仮名は批判されなかったのであろうか。

増えた文字をどう入力するか−Microsoft IMEの場合

2016-08-11 當山日出夫


Microsoft IMEの場合をみてみることにする。


ただ、私の使っているバージョンは不明。というよりも、今のMSIMEは、そのバージョンを明示しないようになっている。試しに、グーグルで検索してみると、Microsoft IMEのバージョンの確認方法について、かなりの質問があることがわかる。


私の使っているものを見ておけば……Windows10マシンを買ったときに、MS-OFFICEの2013版を一緒に買った。その後、それが自動的にアップデートして、今では、2016版になっている。そのなかで使っているMSIMEである。(だから、たぶん、最新版なんだろうと思っているのだが。)


先に見た、ATOKの場合と同じように順番に見ていくことにする。ワープロは、Word2016である。


1.半濁点について


ガ行鼻濁音用の半濁点は、入力可能である。「KA」から、「か」(半濁音)が候補に出てくる。ただし、「環境依存」という注意とともにであるが。同様に、半濁音の、き(KI)、く(KU)、け(KE)、こ(KO)も、出てくる。同様に、片仮名(半濁音)の、カ、キ、ク、ケ、コ、も入力(変換)可能である。


アイヌ語用の仮名については、セ(SE)、ツ(TU)、ト(TO)、で半濁音の片仮名に変換できる。


2.濁点について


「ヴ」に対応する平仮名の「ゔ」(「う」濁点)は、「VU」から変換できる。


ワ行については、ヷ(VA)、ヸ(VI)、ヹ(VE)、ヺ(VO)で可能である。


3.小書きの仮名について


小書きの「か」「け」は、「LKA」では入力できない。しかし、「ゕ」(KA)、「ゖ」(KE)と、通常の仮名の変換候補のなかに入っている。


アイヌ語用の小書き片仮名についても、同様。「L」をつけたローマ字入力からでは出ないが、通常の仮名の返還候補のなかに入っている。たとえば、「TO」から「ㇳ」(小書き片仮名)が出てくるし、「PU」から「プ」(小書き片仮名)が出てくる、というように、である。


4.IMEパッド


IMEパッドから、文字をクリックして入力することも可能である。これも、Unicodeと『JIS X 0213』、と両方のコード表を見ることができるので、ここから文字を選ぶことも可能である。ただ、これも、ATOKの文字パレットと同様に、その文字が、そこにあることをあらかじめ知識として知っていないと使えないということがある。また、これをつかうためには、ATOK文字パレットと同じであるが、JIS規格『0213』で入っている文字と、Unicodeに入っいる文字の違いを理解していないと、使いこなすことができない。あらかじめ、文字と文字コードの知識があることを前提とした利用をすることになる。


このように、ATOKと、Microsoft IMEを、比べてみると、こと0213・ユニコードの増加文字については、Microsoft IMEの方が、きちんと対応していることがわかる。


ただし、問題点がないではない。Wordは、ユニコードワープロである。そのため、ユニコードで表示する。上記の、半濁音の仮名(ガ行鼻濁音、アイヌ語)は、Wordでは、合成した結果で表示している。JIS規格の仮名(単独の一文字)で表示しているのではない。したがって、Wordで表示されている文字(半濁音)を、一太郎にコピーしても、大丈夫で、同じように表示するのだが、他のエディタにコピーした場合、合成が分離してしまうことがある。


これは、IMEパッドから、JISコード表をクリックして、追加の半濁音仮名を入力してもそうなる。ただし、既存の、「ぱぴぷぺぽパピプペぽ」については、問題ない。また、文字単独ではいっている「ヷヸヹヺ」「ゔ」(濁音)についても問題はない。


現に、この文章は、WZ Write 2 で書いているのだが、ここに、Wordでの文字(半濁音)をコピーしてもってきたら、表示が乱れてしまう。ブログ記事であるので、各人のパソコン環境でどう見えるかわからない。ここで書いているときは、意図的に、半濁音の仮名はつかわないようにしている。


要するに、『JIS X 0213』、ユニコードで、増えた半濁音仮名については、要注意であるということになる。