辞書に載っている語形から〈日本語の音の用法〉を考える

 

2021年12月12日

アドベントカレンダーというのがあるそうですが、今年は「言語学な人々」というアドベントカレンダーがあって、それにお誘いを頂いてホイホイと乗ってしまいました。

しかし、なんでもギリギリになってしまう私です。

 

adventar.org

私は日本語の研究をしているのですが、3年ほど前だったでしょうか、親元に帰ったときに、八十代の母親が小型の実用辞典を持ってきて見せるのです。これを見ながら字の練習をしていたのだが、ふと気になってページ数を数えてみたら、サ行がいちばん多い、なかでもシがいちばん多いと知った、と。

国語辞典とも言えないような用字辞典的な小型の実用辞典で、インデックスも付いていないものなので、ページ数を数えてみたようですが、その時、「この親にして、この子あり」と思ったのでした。

私は、たしか小学6年生の時に、家にあった国語辞典*1には載ってない言葉が多いように感じて、もっとよい辞典を買ってくれと頼んで買って貰ったのが、『角川国語辞典』でしたが、この辞書は、小口のインデックスが、行ごとではなく、文字ごとになっていたので、シの部が多いことは一目瞭然でした。

f:id:OKAJIMA_Akihiro:20211211160856j:plain

f:id:OKAJIMA_Akihiro:20211211160800j:plain

f:id:OKAJIMA_Akihiro:20211211161001j:plain

f:id:OKAJIMA_Akihiro:20211211160818j:plain

このようなインデックスの使いやすさを知った私は、その後、入手していった辞典にも、時折、インデックスの改良を施しました。

f:id:OKAJIMA_Akihiro:20211213151541j:plain

f:id:OKAJIMA_Akihiro:20211213164345j:plain

そんなに手許には残ってないのですが、高校時代に使っていた旺文社古語辞典(昭和44年改訂新版)などは、塗り分けをカ行までで止めています。これは多分、この辞書については、小口ではなく、中身の塗り絵の方に時間をとっていたからでしょう。助詞・助動詞の項目に赤鉛筆で囲いをつけ、和歌・俳句の項には、緑のボールペンで囲いをつけるなどしています。

f:id:OKAJIMA_Akihiro:20211211231541j:plain

それはさておき、この小口を見るだけで、この辞書では、サ行がカ行やア行ほど多くないことが見て取れるでしょう。頁数を数えてみると(足掛け、以下同じ)、ア行が227頁、カ行が236頁、サ行が180頁です。

単独で見ると、カが79頁、シが71頁で、カの方が多く、このことだけ見ると、古語辞典と国語辞典とでは仮名遣が違うので、このようなことが起きるのではないか*2、とも思えますが、カ行全体とサ行全体とでみても、国語辞典と古語辞典は違っていそうですから、これは仮名遣の問題ではないことがわかります。

これは、もちろん、辞典に採録されている語の性格の違いによるわけです。

さて、近代的な国語辞典の始まりとされる『言海』の巻末には、「言海採収語……類別表」というものが載せられています。

dl.ndl.go.jp

以下の所で、表にしてありますが、『言海』に収められた約35,000語について、五十音別にどれだけの数の語が入っているかを、それぞれの語の出自による、和語・漢語・外来語などの違いを示しつつ、数字で表したものです。

docs.google.com

これをみるだけでも、サ行が多いのは漢語であり、和語ではア行・カ行が多いのが分かります。

この表については、

岡島昭浩(2003)「「言海採収語・・・類別表」再読」『国語語彙史の研究』22

という論文を書きましたので、御関心の向きには、お読みいただければと思いますが、この論文では、語形を頭から見るだけでなく、2番目の文字で見たり、最後の文字から見たりしています。ただ、この辞典は、歴史的仮名遣いによるものであるし、収められている語も、明治前期までのものであり、外来語などを見ると、オランダ語からのものが85で、英語からのものが73、と、辞書に載せられる外来語が少ない時期だったことが伺えると思います。もっと新しい資料で、こうしたものを見て行きたくなるわけです。

しかし、『言海』以降の辞書で、このような表を載せてくれているものはというと、小学館の『新選国語辞典』が、全体における漢語・和語・外来語の数は載せているものの、五十音による数は示してくれていません。

電子辞書であれば、パパッと出せるようにも思えますが、けっこう面倒ですし*3、辞典間の違いを見るには、紙の辞典で頁数を数える、という原始的なやり方が、案外楽しいものです(項目数を数えるのは、電子化されたものでないと、気が遠くなります)。また、重要語は紙幅を割いている可能性も高く、項目数とは違った意味合いを持っているとも考えられます。

 

さきほど、旺文社古語辞典で、「か」の頁数が多いと書きましたが、これは古語辞典すべての性質ではなく、『岩波古語辞典』『小学館古語辞典』『小学館古語大辞典』では、「し」の方が多いのです。『時代別国語辞典 上代編』は、「か」の部が多く、原則として漢語が載らない辞典ですから、これは成る程と思いますが、小西甚一『基本古語辞典』、佐伯梅友三省堂古語辞典』でも、「か」の部が多く、語数の少ない辞典は和語の比率が高いのであろうと推定することになります。(カの部が多い辞典として、東條操『全国方言辞典』もあることを、ついでに書いておきます。)

 

さて、世の中には『外来語辞典』というジャンルの辞書があります(三省堂『コンサイス・カタカナ語辞典』の第五版が、比較的新しいものでしょうか)。この手の辞典では、どの文字で始まる項目が最も多いでしょうか。

英語の辞典では、sで始まるのが多いし、シャ・シュ・ショなどのことも考えると、国語辞典と同様に「し」の部だろうか、と考えた方、残念です。実は私もそう予想してしまったのですが、違います。

答えは「ふ」の部です。原語がFで始まれば、母音がなんであろうが、ファ・フィ・フ・フェ・フォで「ふ」の部に入ります*4。考えてみれば納得できると思います。(戦前最大の外来語辞典である、『萬國新語辞典』(昭和10年、1300ページ超)でも、フが最多です。1300ページの内、130ページほどが、フの部です。また、最大の外来語辞典である、あらかわそおべえ『角川外来語辞典』(初版1534ページ)は、外来語の認定に問題がある部分もありますが*5、これでも、フが最多です。117ページ。)

f:id:OKAJIMA_Akihiro:20211213151611j:plain

逆に、外来語辞典(カタカナ語辞典)で、少ないものは、何でしょう。

「ぬ」が少ないのですが、「よ」「や」「つ」「む」と言ったところも少ないです。英語の発音の少ないところは、少なくなります。ヨの部などは、ヨーロッパという、日本語的な発音(オランダ語由来ではあるのでしょうが)のもの、ドイツ語由来のヨードなど、地名由来のヨークシャーなどを除くと、ヨーグルト、ヨットなどと、もっと少なくなります。ツの部が少ないのも、ツーやツリーなど、トゥで取り入れうるものがツで取り入れられたものを取り除くと*6、英語以外のものが中心になっていることによるのが分かるでしょう。

さて、国語辞典では「る」で始まる語が少ない、というのは、尻取りをしたことがある人なら、誰でも知っていることでしょう。逆に「る」で終わる語は、かなり多いのです。ジャパンナレッジを使って、『日本国語大辞典』を後方検索をすると、「る」で終わる項目は、23745項目で、「う・ん・い・く」に次いで多いです。終止形で辞書に載せる動詞だけでなく、名詞でも「る」で終わるものは少なくなく2868項です。一方、「る」で始まる項目は712項目しかありません*7

そういえば、尻取りのルールで、〈「ん」で終わる言葉を言ってはいけない〉、というものがあります。「ん」で始まる言葉がないからだ、と説明されますが、「っ」で始まる言葉も、同様にない(もしくは極少し)なのに、なぜ、「ッで終わる言葉を言ってはいけない」というルールがないのか、というと、ッで終わる言葉がないからですね。ンで終わる言葉はたくさんあるのに、ッで終わる言葉はありません。「あっ」とか「こらっ」とかがある、というかもしれませんが、「あ」と「あっ」、「こら」と「こらっ」の間には、「イカ(烏賊)」と「イカン(移管)」、「イシ(石)」と「イシン(維新)」のように、意味の区別に役立っていませんから、「あっ」「こらっ」という言葉は、いわば一人前ではないし、尻取りには使わないのが普通でしょう。

もう、だいぶ長くなったので、止めようと思いますが、言語の音には、用法というようなものがあって、どんな具合にでも使えるわけではないのです。それは言語によって異なるのはもちろん、同じ日本語でも、時代によっても*8、方言によっても異なります。

また、位相といいますか、ジャンルによっても変わってきます。擬声語・擬態語については、その範囲を定めるのが難しいですが、辞典に載っているもので数えてみると、山口仲美編『擬音語・擬態語辞典』でも、小野正弘編『日本語オノマトペ辞典』でも、ヒの部が、カの部、シの部を押さえて、一番多いようです*9。ハ行音特有の清音・濁音・半濁音という3つの違いがオノマトペでは存分に発揮されていることと、ヒャヒュヒョという拗音を有するイ列文字が効いているのだと思われます。

 

ローマ字びきの、日本語辞典や和英辞典の類いにも、触れておきましょう。これは、採録されている語が国語辞典と同じであっても、違う観点で見ることが出来ますね。ヘボン式のローマ字の場合、もっとも多いのはなにかというと、これはkなのです。ヘボン式でも、カ行はすべてk、サ行はすべてsで書かれるのに、なぜ、kの方がsより多くなっているかというと、これは濁音行の数が効いているのでしょうね。

(上田萬年『ローマ字びき国語辞典』)

(福原麟太郎・山岸徳平『ローマ字で引く国語新辞典』 )

 

ポルトガル語に基づくローマ字びきの『日葡辞書』(17世紀初頭)の場合は、Cが最も多くなっています。なお、日本の幕末期に、フランスでこの『日葡辞書』をもとに作られたパジェスの日仏辞書では、フランス語に基づいたローマ字びきになっていて、カクコ・シセがCで写され(キケはk)、Cの部が膨大になっています。全933頁の内、179頁がCで、20%に迫る勢いです。ヘボン和英語林集成*10では、kの部はそれほど多くないのですが(初版で15%ほど)、やはりヘボン式ブリンクリー和英辞典明治29年)などでは、kの部の割合が20%を超えています(1687頁中の343頁)。

 

以上、甚だ中途半端ですが、これで終わります。ちゃんとしたことをするには、文字と音とを、もう少しちゃんと切り分ける必要があるのですが、その辺は、ちゃんとしておりません。お許し下さい。

 

ついでに、なんの考察もしてないので雑学知識なことになってしまうことを書いておきますと、手近にあった辞書でみたところ、中国語辞典のピンインではZで始まるものが多いようで(辞書によってはSが拮抗)、ウェード式だとCが多い。フランス語・スペイン語はc、ドイツ語・イタリア語は英語と同じくs、オランダ語はsとvが拮抗、ラテン語はpが多くcが迫る、ロシア語は圧倒的にП(ペー)、インドネシア語はM、といった感じでした。

ドイツ語とスペイン語は、aの部が結構多いことも目に付きます。その後、ポルトガル語辞典を見てみたら、aが一番多いのでした。大武和三郎『葡和新辞典』

 

さて、このアドベントカレンダーですが、当初、クリスマス関連の12/12ということで、12/12を語路合わせ的に「イフイフ」→「イブイブ」とも読めることから、12/23をイブイブと呼んだりすることについて書こうかとも思ったのですが、大筋は、

kuzan.hatenadiary.jp

に書いてあるし、今更書くこともない、と。

また、日本語の清音・濁音の定義を、「無声音・有声音」というような音声学的な説明を交えずに書いてみる、というのも書きかけましたが、次の機会にします。

*1:今なら「実用辞典」と呼ぶようなものですが、当時は、国語辞典だと認識していました。

*2:歴史的仮名遣いで「かう・かふ」と書かれるものが現代仮名遣いでは「こう」と書かれ、歴史的仮名遣いで「せう・せふ」と書かれるものが現代仮名遣いでは「しょう」と書かれる

*3:ジャパンナレッジの『日本国語大辞典』の項目検索は、異形からも引けるので重複があります。例えば、「っ」で始まるものを検索すると、名詞が1つ見付かりますが、これは、「きり」の「【二】(副助)」の「促音が入って「っきり」となる場合も多い」がヒットしているのであって、「っきり」の「(副助詞「きり(切)」の変化したもの)→きり(切)【二】【三】」もカウントされています。なお、「っ」で始まる項目を検索したら表示される3つの子項目の内、2つ「 いぬ 骨(ほね)折(お)って鷹(たか)にとられる」「りゅうすい一度(ひとたび)去(さ)ってまた返(かえ)らず」は誤入であろうと思われます。

*4:pのものも(後続音が[u]のものだけでなく、plやprで始まるものも)、bのものも「ふ」の部に入ります

*5:「ふく」が中国語「風feng」に由来するというなどの、与謝野鉄幹の語源説をそのまま書いているなど。

*6:このあたり、時代的なもので書こうとしましたが、ツイッターの存在に気づいて、止めました。

*7:

https://docs.google.com/spreadsheets/d/1VRkICc-wnnl-VUxp-IAlZDW5jHgFw9lk5KWjTho-av0/edit?usp=sharing

*8:「かは」「かほ」が、「カワ」「カオ」と発音されるようになるような、ハ行転呼の現象のことを、奥村三雄は有坂秀世の考え方に従って、「音韻の用法の変化」と書いています(『講座国語史』大修館)。

*9:小野正弘『日本語オノマトペ辞典』にはコラムのページがあるので、数えにくいのですが、ホの部も多いのが目に付きます。

*10:いわゆるヘボン式ローマ字が使われるのは三版からで、それまでは初版・二版では若干、異なりますが、いずれにせよ英語における発音とアルファベットの関係に基づいて、日本語にアルファベットを当てています。