増えた文字をどう入力するか−ATOKの場合

2016-08-10 當山日出夫


つぎの問題として、『JIS X 0213』でふえた、あるいは、ユニコードにある文字(仮名)をどのように使用可能かということがある。まず、手始めに、私が普段つかっている、「一太郎2016」と「ATOK2016」で見てみることにする。ただ、日本語入力の環境からすれば、別に一太郎でなくてもいいのだが、一般に使用されるであろう環境でためしてみることにする。また、あえてワープロでためしてみることは、実際に使われる一般の環境において、その表示がどうなるか確認する意味もある。


1.半濁点について


ガ行鼻濁音の用の仮名、半濁点つきの「かきくけこ」「カキクケコ」であるが、これの入力はできないようである。


「か(KA)」「が(GA)」から、変換してみても、「か(半濁点)」が出てくることはない。


また、「まんが」から変換しても、漢字の「漫画」や片仮名の「マンガ」は、出てくるのだが半濁点つきの「か」をふくんだ表記がでてくることはない。


これをカナ入力モードにきりかえて、「か」+「゜」と入力してやってみると、「か゜」となるだけであって、一字で「か(半濁点)」にはならない。


片仮名についても、同様である。


また、アイヌ語用の半濁点つき片仮名についてみても、同様に入力できないようである。


2.濁点について


これも同様に入力できない。あるいは、一部、入力できるものがある。


片仮名の「ヴ」従来どおり、「VU」で出てくるが、この状態から、F6キーで平仮名に変えてやると「う゛」になってしまう。「う」と「濁点(゛)」が分離された状態、2字で出てくる。一字にはならない。ATOKの機能としては、F6・F7を押すことによって、平仮名と片仮名をきりかえることになる。であるならば、「ヴ」に対応する平仮名(『0213』で追加)になってもいいと思われるのだが、そうはならない。


「U」(う)から変換してやっても、出ない。


「ワ(濁点)」については、「VA」から変換すると「ヴァ」になってしまう。これについては、「WA」から変換すると、「ワ(濁音)」が候補に出てくるようになっている。だが、「WI」からは、「ヰ(濁音)」が出ない。「WE」も同様に出ない。しかし、「WO」からは「ヲ(濁音)」が出る。ワ行濁音については、不統一なようである。


結局、ワ行濁音で、「ワ(濁音)」「ヲ(濁音)」は、仮名からの変換で出せるが、「ヰ(濁音)」「ヱ(濁音)」は、出てこないようである。


3.小書きの仮名について


これも同様に入力できない。


「LKA」としても、「か(小書き)」が出ない。「ヵ」(片仮名の小書き)は出てくるのだが。


アイヌ語用の小書き片仮名は入力できないようである。「LKU」から、「ク(小書き)」は出てこない。


4.文字パレット


結局、ATOKメニューから、文字パレットを出して、その「和文コード表」「Unicode表」をつかうしかないようである。


しかし、これは、そこにその文字があることを事前に知っているから、使えるという性格のものであって、そこから文字を探す、入力するというのには向いていない。たしかに、ここ(Unicode表)から、文字をクリックしてやれば、半濁点つきの仮名の入力ができる(合成表示が可能)。


だが、これは、現在の文字コードに合成用の半濁点がある、ということを知っている人にでないと意味のない機能である。そして、おそらく大多数のユーザは、このことを知らないのではないか。


また、文字コード表にも問題がないわけではない。


和文コード表」を見ると、通常の平仮名・片仮名とは、別の飛び地(ギリシャ文字)に、小書きのアイヌ語用片仮名があり、さらに、そこからまたとんだ飛び地領域(ロシア文字)に、「ワヰヱヲ(濁点つき)」があることになる。これは、そこにそういう文字があることを知らないとつかえない。


Unicode表」でも同様である。「平仮名」「片仮名」とは別に「片仮名拡張」の領域が飛び地にあって、そこにアイヌ語用小書き片仮名がある。これも、その領域が飛び地であって、そこにその文字があることを知っている人にでないとつかえない。


あるいは、ATOK文字パレットの「記号・よく使う文字」を見るという方法もある。この一覧のなかの「ひらがな」「カタカナ」を見ると、『0213』で追加になった仮名(ガ行鼻濁音、アイヌ語用片仮名など)が掲載になっている。しかし、これも、ここにこういう文字があるということを知らないと意味がないことには変わりない。


5.表示


ただ、上記のように、キーボードの操作で簡単に入力することはできないのであるが、表示はできる。合成の半濁音つきの仮名など、確実に見ることができるようになっている。


以上、みてきたように、一太郎ATOKをつかっている環境を想定してみると、表示については問題ないのであるが、その入力法については、いろいろ問題を残しているようである。旧来の『0208』から、文字(仮名)が増えているにもかかわらず、キーボードからの入力では、それにきちんと対応しているとは思えない。


あるいは、これは、私が、ATOKの操作に不十分なせいなのかもしれない。確実にキーボードから、上記のような文字(仮名)を入力する方法があるなら、どうか、ご教示いただきたい。あるいは、変換辞書の設定を変更すればよいかのかと思うのだが、ヘルプを見た限りでは、よく理解できない。すくなくとも、標準的な設定(と、自分では思っている)でインストールした状態では、上記のようになった。


また、Microsoft IME については、別に検討することにする。

0208と0213とUnicodeについて再掲

2016-08-09 當山日出夫


JIS規格(0208、0213)とユニコードの関係について、昨日の記事にミスがあったので、それの訂正の意味をふくめて再度、記しておきたい。


大きく二つの点がある。


第一には、JIS規格においては、0208から0313が作成されるにあたって、文字の増加がある。これは仮名にもおよんでいる。


[1].ガ行鼻濁音用の仮名(平仮名・片仮名)
[2].アイヌ語表記用の片仮名 半濁音つき・小書き
[3].外来語表記用の、濁音つき平仮名・片仮名(う、ワ、ヰ、ヱ、ヲの濁音)
[4].小書きの平仮名(か、けの小書き)


第二には、JIS規格で追加になったすべての仮名が、ユニコードにはいっているということはない。


ユニコードにはいっているものとしては。


[1].外来語表記用の濁音つき片仮名 「ワ・ヰ・ヱ・ヲ」(濁音)これはユニコードにはいっている。(片仮名領域)


[2].外来語表記用の平仮名「う」(濁音) これはユニコードにはいっている。(平仮名領域)


[3].小書きの平仮名 「か」「け」 これは、ユニコードにはいっている。(平仮名領域)


[4].小書きの片仮名(アイヌ語用)は、ユニコードにはいっているが、仮名のエリアには収録されていない。「片仮名拡張」として、通常の片仮名とは、飛び地の領域に存在する。だから、この飛び地領域の存在を知らないと、見つけられないことになってしまう。


一方、ユニコードにはいっていないものとしては、


[1].ガ行鼻濁音用の仮名(片仮名・平仮名)、これは半濁音と合成して使用するようになっている。つまり、単独の文字としてははいっていない。そして、これは、現在の日本語用ワープロ一太郎、Word)では、表示させることができるが、エディタの一部(WZ、MIFESなど)では、できないものもある。EmEditorでは可能。


[2].アイヌ語用の片仮名(半濁音)、これも、合成で使用するようになっているので、ユニコードにははいっていない。


以上のように整理できるかと思う。


そして、次の問題は、これらの仮名をどうやれば実際に使うことができるのか、という問題になる。ワープロやエディタで使用できるか。どうやって入力するか、という課題になる。

0208と0213とUnicode

2016-08-08 當山日出夫


みてきたように、仮名といっても、文字セットによってちがいがある。二つのことを考えてみる。


第一に、『JIS X 0208』から『JIS X 0213』への変化においては、文字の追加がある。『0213』の方が使える文字が増えている。一般に、日本語ワープロで使う文字(仮名)としては、基本的にこの文字セットを考えることになるだろう。『0213』の文字を考えることになる。


第二に、ユニコードになったからといって、文字が増えるとは限らない。こと仮名についていえばそうである。(追記、これは間違いでした。後述参照。)


以上の二点であるが、第二の点も、整理すれば、基本的に次の三つの点になる。


(1).
半濁音つきの仮名が、ユニコードにはいっていない。もともとの『0208』にあったものは入っているが、『0213』で追加になったものは、収録されていない。
半濁音が使用されるのは、
[1]ガ行鼻濁音の表記
[2]アイヌ語の表記
である。
これらの、ガ行鼻濁音・アイヌ語の表記に必要な、半濁音つき仮名がない。これは、実際の運用としては、合成用の反濁音と一緒につかえばいい、ということになる。この意味では、かならずしも排除したということにはならないかもしれない。


(2).
小書きの仮名(片仮名)が、ユニコードにはない。これは、アイヌ語用に『0213』で採録されたものである。つまり、ユニコードをつかう範囲においては、アイヌ語の片仮名表記ができないことになる。(追記、これは間違い。片仮名拡張領域にはいっている。安岡さん、ご指摘ありがとうございます。ただ、片仮名と片仮名拡張と分離されていたので、気づきませんでした。申し訳ありません。)


(3).
『0213』からユニコードになったものとしては、
平仮名では、ゔ ゕ ゖ
片仮名では、ヷ、ヸ、ヹ、ヺ
ということになる。
これは、平仮名と片仮名の対応、それから、外来語表記に配慮した文字の選択と考えることができよう。

JIS X 0213:2000 で追加の片仮名

2016-08-07 當山日出夫

昨日は、平仮名について見たので、今日は片仮名である。『JIS X 0213:2000』で追加の片仮名については、


4.4.8 この規格では、片仮名29文字を新たに追加している。


とある。以下の文字である。


カ〜コ 半濁点つき
ワ〜ヲ 濁点つき
セ〜ト 半濁点つき
ク〜ロ 小書き


これらは、ガ行鼻濁音、外来語表記、それから、アイヌ語表記のための文字である。このうち、濁音つきの「ワ〜ヲ」は、「ヷ、ヸ、ヹ、ヺ」として、見ることができる。Unicodeにある。しかし、これら以外の仮名は、Unicodeの片仮名の一覧のなかにはない。


ワ行濁音のうち「ヴ」は、もとから『0208』にある文字なので、『0213』の追加にならない。


ATOK和文コード表」の「ひらがな/カタカナ」の一覧を見ると、半濁点つきの「カ、キ、ク、ケ、コ」「セ、ツ、ト」、それから小書きの「ク、シ、ス、ト、ヌ、ハ、ヒ、フ、ヘ、ホ、プ、ム、ラ、リ、ル、レ、ロ」があるのだが、Unicodeの方の片仮名にははいっていない。(追記、2016-08-08、これは間違い。片仮名拡張領域として、はいっていることを確認。安岡さんのご指摘によります。)


ここで、日本語の片仮名をつかって(それに工夫をほどこして)、アイヌ語を書くことの妥当性、という問題があるのかもしれない。だが、ここでは、その問題は、おいておく。


問題は、JIS規格にある文字(平仮名、片仮名)であっても、それが必ずしもUnicodeにはいっているとはかぎらない、ということである。Unicodeは、JIS規格を完全に継承しているものではない。これは、平仮名・片仮名についていえることである。

JIS X 0213:2000 で追加の平仮名

2016-08-06 當山日出夫


いったん、草仮名、『秋萩帖』からはなれて、JIS規格票を見てみることにする。


JIS X 0213:2000』では、平仮名もいくつか追加になっている。まず、そのことを確認しておきたい。規格票の解説にはつぎのようにある。


4.4.7 平仮名 この規格では、平仮名8文字を新たに追加している。


ここでいう8文字とは、
半濁点つきの「かきくけこ」
濁点つきの「う」
小書きの「か」「け」


である。このうち実際にエディタ……私は、今、WZ Editor9 をつかっているのだが(文字コードの設定は、UTF8)、メイリオで表示……で、現実に使用することのできるのは、「ゔ」「ゕ」「ゖ」である。半濁点つきの「かきくけこ」は単独の文字としては使用できない。(これは、エディタによって表示がことなる。後述。)


ただ、これも、ワープロ一太郎、Word)であれば、使用可能である。単独の文字として、半濁点つきの「かきくけこ」を表示できる。日本語用ワープロとして、JIS規格に沿ってその機能があることになる。


つまり、JIS規格『0213』にはあるのだが、Unicodeにはふくまれない(合成でしめす)文字ということになる。これは、たとえば、ATOKであれば、ATOK文字パレットの「和文コード表」と「Unicode表」の違い、としてもいいかと思う。Microsoft IMEであれば、IMEパッドの「Unicode基本多言語面)の「ひらがな」と、「JIS X 0213」の違いになる。


Unicodeでみれば、合成用の、
 U+3099 濁音
 U+309A 半濁音
に、どう対応するかということでもある。


Unicodeでは、この合成用の濁音・半濁音をつかって、半濁音つき「かきくけこ」を表示することになる。


JIS規格にあるからといって、Unicodeで使えるとは限らない文字、といってよいであろうか。


だから、Unicodeが文字が少なくて困るかというと、必ずしもそうではない。JIS規格にはない濁点つきの「あいういえお」でも表示が可能になっている。この意味では、より広い範囲の文字に対応しているといえよう。ちなみに試してみればわかるが、ワープロ一太郎など)で、Unicode表から、「あ」(普通の仮名)と「゙゛」(濁点、合成用)゙をクリックすると、濁点つきの「あ」などを表示させることができる。(ただし、ここで表示してある濁点は、合成用のものではなく、単独の文字としてのものである。U+209B。コピーしてもつかえない。ブログ記事として、表示の安定のため。WZではあつかえない。)


この意味では、通常の濁点つきの仮名(がぎぐげご、など)と、合成した仮名の二種類が、Unicodeのなかでは共存することにはなる。すくなくとも、ワープロでは、使用が可能である。


なお、エディタでどのように表示するかは、製品によってことなるようである。私の使用している、WZ(9)、MIFES(10)、では正しく合成を表示しない。しかし、EmEditorでは、意図したとおりに表示される。使う機能によって、エディタを選ぶべきかもしれない。私の場合、通常の文章……ブログに書いたり……であるならば、一番このみにあっているのはWZなので、それを使うことにしているが。

草仮名をコード化することの意味

2016-08-05 當山日出夫

あまり『秋萩帖』にのみ深入りしたくない。ここで考えてみたいのは、仮名の成立史というようなことではなく、草仮名を変体仮名のなかにふくめてとりあつかうことの是非をめぐる問題である。そして、それを文字コード化することの課題である。


一般的なところで、『国史大辞典』(ジャパンナレッジ)の「草仮名」の項目を見てみる。執筆は、小林芳規


仮名の一種で、万葉仮名を草体化したもの。江戸時代以来、平仮名をこう呼んだことがあったが、近年は、平仮名と区別して、仮名発達史上、古く行われた仮名体系を指している。草仮名の名称は、『枕草子』に「人の草仮名書きたる草子」とあり、『源氏物語』絵合に「草の手に仮名の所々に書きまぜて」ともある。『宇津保物語』蔵開中に和歌の書体を「草」や「女の手」「片仮名」などでさまざまに書き、『源氏物語』梅枝に「草のも、たゞのも、女手も」とあるのによると、女手(平仮名)とは別の仮名体系であったことがわかる。


この引用箇所にしたがう限り、万葉仮名(楷書の真仮名といっていいだろうか)とも、平仮名とも、異なる文字の体系である。ここから分かることとしては、草仮名は真仮名とも区別されるものであると同時に平仮名とも区別されるものである。独立した文字の体系であったことになる。


概念としては、草仮名というものを設定することは意味がある。


だが、今日において、実際の文字の字形を見て、判断できるどうかは、また、別の問題である。たしかに、楷書体の真仮名とも、平仮名(現行の文字)とも区別はできる。しかし、いわゆる変体仮名の、その個々の具体的字形を見て、何であるか判断することは難しいと言わざるをえないのではないだろうか。


JIS X 0213』の解説が指摘するとおり、漢字の草書体と区別することが困難である。それと同時に、平仮名(変体仮名)と区別することも困難なのである。この意味では、『JIS X 0213』の解説は不十分である。一般論としては、漢字の草書体と区別できないのは、草仮名であって、平仮名(変体仮名)ではないだろう。あるいは、逆説的には、この解説は、草仮名と平仮名を同じ範疇にふくめることを認定しているとも、解釈できる。


ところで、今般の変体仮名ユニコード提案の意図としては、先にしめした論文(『情報管理』)にあるとおり、その目的は、学術情報のためである。そして、この目的……具体的には、古典籍・古文書・古記録の翻字や、仮名字体史研究などになる……に役立つものをつくろうとして、仮名を見るとき、草仮名であるとして排除できるか、という問題もある。


作業の手順として、まず、近現代に活字・フォントとして存在して使用された、また、現に使用されている変体仮名を集めるところかからスタートしている。つまり、実際に、古典籍の翻字などにおいて需要のある文字ということである。この観点から見るかぎりにおいて、それを草仮名であるということを判断の理由として排除することは出来ないのである。


実際の作業として、変体仮名をあつめようとしたとき、草仮名を排除する積極的理由も、また、見出しがたいということになる。ただ、そうはいっても、あまりに漢字に近い字形(あるいは字体またはグリフ)のものは、のぞくという判断をすることにはなるが。


結論をのべるならば、草仮名というものが文字史のうえに存在することは認められる。しかし、実際の文字をえらぶ作業において、草仮名であることを判断して排除することはできないのが実際である。これは、国文学・日本文学の立場にたって、変体仮名のなかにふくめてとりあつかうのが、妥当であり、実際の作業もまた、そのようなものであった、ということになる。


また、今般の作業で、たずさわったメンバーが気づいた点としては、近代の活字、それも、変体仮名活字における、『秋萩帖』の影響という課題ある。この点については、その論考の出るのをまっている。

『秋萩帖』の翻字

2016-08-04 當山日出夫


私のもっている『秋萩帖』(影印)を見てみることにした。手元にあるものでは、次の二種類。


(1).『書道全集』第12巻.日本3 平安Ⅱ.平凡社.1954


(2).『書道藝術』(普及版).第14巻.藤原佐理 小野道風中央公論社.1976


『秋萩帖』を見るというよりも、その翻字を見てみる。(1)『書道全集』の方には、部分掲載。(2)『書道藝術』は全部のっている。ただし、両方ともモノクロ写真である。


翻字の方針は、ともに、漢字をつかって本文を翻字して、そのよこにルビのかたちで仮名(現行の平仮名)がふってある。


これはどういうことなのだろうか。完全に仮名(平仮名)と意識しているのならば、通行の仮名で翻字するはずだと思えるのだが。


ちなみに、『書道全集』には「北山抄紙背文書」ものっているが、その翻刻は、通行の平仮名である。


また、『書道藝術』の方を見ると、「継色紙」は、漢字(草仮名)に仮名でルビと、現行の平仮名が、まざった翻字。「本阿弥切」では、基本的に平仮名で翻字。


どうも、このような翻字の方針をみると、『書道藝術』『書道全集』の編纂されたときの意識としては、『秋萩帖』などは、草仮名であり、それは、真仮名を草書体で書いたもの、という意識で見ていたようである。


それから、参考までに近年になってから見た展覧会として、「書の至宝−日本と中国−」.2006年.東京国立博物館、がある。この図録にも、部分的に、これはカラーで掲載されているが、解説には、翻字はない。


また、現在は、『秋萩帖』は、WEBで見ることができる。『秋萩帖』は、東京国立博物館にある。


e国宝
http://www.emuseum.jp/top?d_lang=ja


秋萩帖
http://www.emuseum.jp/detail/100169/000/000?mode=simple&d_lang=ja&s_lang=ja&word=%E7%A7%8B%E8%90%A9%E5%B8%96&class=&title=&c_e=®ion=&era=¢ury=&cptype=&owner=&pos=1&num=1


ここ(e国宝)の改題を読むと、「平安時代・11〜12世紀」とある。この記載を信じるならば、あきらかに『古今和歌集』(905)より後の成立。『古今和歌集』は、平仮名で書かれたであろうから、この『秋萩帖』の草仮名は、『古今和歌集』よりも後になってから、草仮名で書いた文献ということになる。


この意味では、単純に、真仮名→草仮名→平仮名、という発展段階を考えるのではなく、平仮名成立後にも、草仮名は別の文字として存在していたことになる。


ともあれ、書道、書芸術の方面からのアプローチとしては、『秋萩帖』は、草仮名(草書体の真仮名)と見なしているといえよう。ところが、国文学・日本文学の方面になると、これは、平仮名の延長にとらえられることになる。さきにあげた、


笠間影印叢刊刊行会(編).『字典かな−出典明記−』(改訂版).笠間書院.1972


私が持っている本は、平成14年(2002)の203刷。この本、国文学・日本文学の方面における、定番中の定番の本である。学生が、変体仮名を勉強するのに手元においてつかう手引きとして、もっとも著名で代表的な本であるといってよい。この本においては、『秋萩帖』は、他の文献とならべて、平仮名(変体仮名)の連続のなかに位置づけられている。


さらに、『日本国語大辞典』(第二版)を見てみる。この辞典は、「あいうえお……」のそれぞれのはじめに、仮名の一覧がある。これの「あ」の項目をみると、「ひらがな」「かたかな」「万葉がな」と分類してあって、「ひらがな」なかに、『秋萩帖』の例も収録してある。もちろん、『秋萩帖』の巻頭の「あ」の文字もはいっている。ちなみに、この仮名字体の一覧の指導は中田祝夫とある。


「ひらがな」「かたかな」は、具体的文献からの集字(影印)で示すが、「万葉がな」は活字(明朝体)で書いてある。どうやら、「万葉がな」は漢字の用法としてみとめ、「ひらがな」「かたかな」になると、変体仮名をふくめて多様な字種があったと考えて作ってあるようである。ただ、これも、考えようによっては、草仮名という分類を立てなかったというだけなのかもしれない。「正倉院蔵万葉仮名消息文」も、「ひらがな」のなかにふくめてある。


以上のことを総合して考えると、どうやら、『秋萩帖』の文字を、草仮名とみなすか、それとも、平仮名にふくめて考えるか、立場によってわかれるようである。だが、すくなくとも、この文献の文字を平仮名(変体仮名)にふくめてあつかうことは、あながちまちがっているわけではなさそうである。