概要
日本国の領土である日本列島・琉球諸島とその周辺の島嶼を主な分布域とする言語。詳細は下記に詳しいが、特徴を要約すると「高低アクセントを持つ非声調言語で、開音節が多く閉音節が極めて限定的にしか存在しない、膠着語である言語」である。
母語話者人口はほぼ日本の人口に等しく1億3,000万人程度と見積もられ、統計にもよるが現在世界に数千ある言語の中でも10位以内に入る規模を持つ。また、Pixivを含めアニメや漫画などのサブカルチャーに関する分野に関して言えばある種の国際語としての側面があり、英語をはじめとする一部の欧州語には流石に及ばないが、言語全体の中でいえば母語話者でない学習者もかなり多い部類に入る。そのため、「日本語話者=日本語を母語とする日本人」という図式は必ずしも成り立たないことに留意されたい。
文字表記に関して言えば、世界的に見ても稀有な「複数種類の文字を混ぜて書く言語」であることが大きな特徴といえる。5~6世紀頃に当時の中国語から輸入した漢字に、表音文字に特化させた漢字の派生文字である仮名を混ぜて文字表記を行う。もっとも今のスタイルは色々な変遷を経て確立されたもので、かつては漢字のみで漢文調や万葉仮名として表記したり、戦前くらいまでは「漢字+カタカナ」が広く使われていたなど、時代によって書き方はかなり変化している。
また、現在では極めて少ない「非中華系で漢字を使う言語」である。
起源と系統
現状あまりよくわかっていない。系統としては、沖縄語や奄美語、八丈語など周辺島嶼の土着の諸言語と共に構成される日琉語族(日本語族とも)に属する言語と扱うか、それらの言葉もまるっと日本語という一言語の方言と扱って「孤立した言語」であるとされるのが一般的である(UNESCOの見解では前者である)。というのも、どこまでが方言でどれくらい違えば別言語かというのに明確な定義はないからであるが、いずれにせよ日本国外の言語との系統関係は今のところ立証されていない。
ただしアイヌ語については数千年にわたって非常に近いところで話されていたものの、アイヌ語も他とも系統関係が見出されていない孤立した言語であり、日本語と系統は異なる。
地理的に近接する朝鮮半島の朝鮮語(韓国語)とは主に文法の面で類似性が多く指摘されている。しかしながら、類似する固有語が皆無に近い(似ている単語として挙げられるのはほぼ漢語であり、両者に土着の言葉とは言いがたい)こと、音韻の面で日本語は極めて開音節的であるのに対して韓国語は/-l/や/-k/、/-m/、/-b/などの子音で終わる閉音節が頻繁に使われるなど、差異も多い。よって現在は一般的に日本語は日琉語族、朝鮮語は朝鮮語族とそれぞれ別のグループだと考えられている。
過去にはトルコやモンゴル・シベリアの諸言語とまとめて両者が「アルタイ語族」に属するとする説などが唱えられたが、当時から日本語や朝鮮語がこれに属するかどうかは微妙なところだったのに加え、今ではアルタイ語族の存在自体が疑問視されており、それぞれテュルク語族・モンゴル語族・ツングース語族という別々のグループとされている。
ただ、こんにち朝鮮語として知られる言語との系統が立証されていないとはいえ、『三国史記』に記された高句麗の地名とその意味に関する記述からの分析に基づき、いまは絶滅したものの少なくとも7世紀以前は朝鮮半島の中〜南部に日琉語族の言語(半島日本語)が分布していた可能性が高いと考えられている。ただ、この時代の朝鮮の言語については詳細な記録が少ないため、具体的に何語がそうだったかまでははっきりしていない。
文法
基本的に「主語 - 目的語 - 動詞」の順をとるSOV型の言語である。英語や中国語などメジャー言語にはSVOが多いものの、世界の言語の約半数がSOV型なのでこれについては別段珍しい形ではない。
ただ、現在日本で教えられているいわゆる「学校文法」は体系の全く異なる英語を参考に組み立てられたもので、「主語」という概念はそもそも日本語には必要ないという者も少なくない。
この書籍によれば、「名詞文」(アウトだよ!等)、「形容詞文」(ちっちゃくないよ!等)、「動詞文」((3分間)待ってやる等)の3つとのことで、実際話す時は感動詞以外はこの3種類のうちいずれかを必ず使用していることが感じられるはず。
実際主語や目的語とされているものは順序関係なく使っても省いても違和感がないが、上記3文は最後に置かないと倒置的で、多用されると間違いなく違和感を感じるだろう。
日本語に限ったことではないが、現行の文法では不完全なため新たな総括が待たれる。
動詞に「た」を結びつけることで過去形、「たい」をつけることで願望、「れる」をつけることで受け身…のように、基本語彙に様々な語尾をくっつけることで意味を展開する「膠着語」というタイプの言葉である。膠着語には他にフィンランド語やハンガリー語などのウラル語族、トルコ語などのテュルク語族、モンゴル語、朝鮮語などがあり、先述の通り過去に提唱されたアルタイ語族やウラル語族も合わせたウラル・アルタイ語族説の根拠となっていた。が、あくまで膠着語であるというだけで他に目立った類似点が特にないことから祖語が共通と言い切る根拠には乏しく、先にも述べた通り今ではほぼ否定されている。
単語の借用では古代中国語から漢語の形で大量に単語を導入しており、漢語なしでは表現できる内容が限られる。とはいえ朝鮮語(同じく漢語を導入)や英語(フランス語由来の単語が多数存在)等と異なり、固有名詞以外は借用語無しでも表現にある程度融通が利く(なるべく大和言葉だけで書かれたひらがなの記事を参照して欲しい)。ただし、固有語とされる単語(大和言葉)でも中国語との類似が指摘されており、漢字伝来前にも中国大陸からかなりの語彙が入っているものと目されている。
発音
ほとんどの音節が母音で終わる開音節言語で、子音で終わる閉音節は「ん」と「っ」がつくもののみに限られる。このため、日本語の母語話者は子音を子音のみで発音することに不慣れな者が多く、外国語を喋っても通じないケースが多い一因となっている。
標準語では母音は5種類と多くはなく、子音も難解なものはあまりないので、そういう意味では音声は簡単な部類である。が、モーラ(拍)が極めて重要であり、必ずしも流暢に話すのが簡単とは言えない。モーラというのは「ん」や「っ」、長母音を含めてそれぞれを一拍とするリズムの取り方で、日本語ではこれを意識して重子音「っ」や長母音が含まれる言葉を正しいテンポで区別しなければならない。例えば日本語において「ミッキー」は「ミキ」ではない(※)し、「案内」は「アナイ」ではない。これは意外と非母語話者にとっては難しいポイントである。
※日本語話者はMickyを「ミッキー」と解釈しているが、英語本来の発音上は「ミキ」と明確な区別はない。
重子音や長母音を含んだモーラの概念がある言語としては他にウラル語族フィン・ウゴル語派のフィンランド語がある。そのため、歴史上の接点がほとんどなく共通の語彙が少ない言語なのに響きが妙に似ており、「一見日本語のようだがわけのわからないことを話している」ように聞こえ、空耳のネタになることが多い。
表記
文字の種類
日本語は発音こそ優しい部類に入るが、表記についてはかなり複雑な言語である。文字は主にひらがな、カタカナ、漢字を使う。また漢字も複数の時代に渡って中国の複数の地方から伝来し続けてきた上に、それに加えて日本語に土着の語彙にまで漢字をあてがっているため、一つの文字に対してやたら滅多に読み方のバリエーションが多い。このため、日本語の漢字は漢字を使い慣れた中国人にとっても頭痛の種である。ことに、一文字に2音節以上の発音を充てる言語は世界広しといえど日本語くらいしかない(「志」一文字で5音節もある)。
ひらがな・カタカナに限定すれば、いくつかの例外(助詞の「は」「へ」「を」など)があるものの、基本的には文字に対して読み方は1通りで対応しており、書いてあるままに読めばいい(これは近現代になってから発音と乖離していた歴史的仮名遣いを現代の発音通りに書くよう変更したためである)。ただ、依然として漢字仮名混じり文という形態で使われる以上、書き言葉が難解な言語であることには違いない。
漢字仮名混じり文は、元々日本語を公式に表記していた漢文をより日本語にマッチした形に魔改造した結果生まれたものと言える。漢文は基本的に中国語に従って書かれるが、シナ・チベット語族に属する中国語は、文法的には何から何まで日本語とは異なっている。
中国語は単語の形が基本的に不変(格による変形や動詞の活用などがない)で、単語の追加や語順の入れ替えによってのみ意味を展開する「孤立語」というタイプの言語である。すなわち一文字ごとに意味を与えてそれらを並べるという漢文の文字体系は本来こういう言葉だから合理的なのであって、孤立語ではなく膠着語である日本語では単語に対して色々な接尾辞がくっつき、それによって単語も変形するため、漢字を並べただけでは効果的に書き記すことが困難である。さらにはSVOである中国語と語順自体が違うこともあり、結果として送り仮名やら順番をひっくり返すルールがあって初めて漢文は日本語の文として成立するのである。
結局、漢文そのままでは日本語という言語とあまりにも乖離しているため、文の主要な意味をなす部分は表語文字である漢字に担当させながら、音声だけを表示する補助的な部分を仮名として綴り、語順を日本語通りに入れ替えることでこうなった。
一応こういう経緯で書き言葉としての日本文は漢文をベースにした変化球と言うことができ、実際漢文が事実上の正書法だった時代もあることもあって、「国語」の古典と称して漢文教育がなされるのもあながち脈絡がないわけではない。
かつては朝鮮語やベトナム語でも似たように独自文字と漢字を混ぜる書き方をしていた。しかしながら、朝鮮語は全文ハングル化に踏み切ったため、漢字は人名や地名などの固有名詞として辛うじて生きながらえている程度となっている。
一方のベトナム語はベトナムがフランス領となった影響でラテン文字が普及し、漢字とチュノムを使う書き方は廃れてしまった。ベトナム本国ではなく中国領内に少数民族の一つとして分布する京族(≒ベトナム人)が操る京語(≒ベトナム語)は今でも漢字とチュノムを使うが、その人口は数万人であり、ベトナム語の中で主流なスタイルとは言えなくなっている。
というわけで朝鮮語・ベトナム語でも完全に漢字が姿を消したわけではないものの、標準的な言語の表記として漢字と独自文字を混ぜるスタイルを使っているのはやはり今では日本語だけである。
また、独自文字である仮名について言えば、当初はひらがな・カタカナともに一音に対して一通りの文字で対応していたわけではなく、異体字が複数あった(変体仮名)。カタカナの異体字は早い時期に姿を消したが、ひらがなの異体字も明治期に活版印刷が普及したために複数のかな書体を使う意味が薄れ、国語改革によって整理された。しかし、あえて古い雰囲気を出すために、日本料理店の看板などに使われることはある。
識字
日本語の複雑怪奇な表記体系は外国人にとっては難題であるが、古くから日本人の識字率は高かったことが知られている(このことから、「文字数が多い日本語は不合理」と考えていたGHQは、日本語のローマ字化を断念したという)。アルファベットを使用している人には馴染み深い「難読症」も日本ではかなり少ない(全くいないわけではない)。
文字は読めても、その意味を正確に理解することが出来ない、いわゆる「機能的非識字」は、それなりの数が存在する(一説には、日本の中学生の15%が、それに該当するという)。日本が他国に比べて、機能的非識字が多いわけではないが、少ないわけでもない。
一応、かな文字だけなら発音の乖離が少なく、拗音を除き一文字一モーラなので習得はさほど困難ではない。
なお、脳が外傷を負うことで文字が読めなくなる症例がある。アルファベットを使う言語の話者なら当然「文字が読めない」の1通りしかないが、日本語話者の場合は「漢字だけ読めない」「仮名だけ読めない」の2通りが加わる。このことから、漢字と仮名では脳が処理している場所が異なるとされている。この特性が、漫画の構成展開(吹き出し⇔仮名、絵⇔漢字)に良影響を及ぼしているという指摘があるとか。
表記方向
日本語は、縦書きと横書きの両方が使われている比較的珍しい言語である。類似例としては、同じ東アジアの言語である中国語や朝鮮語は、歴史的に縦書きで使われており、現代では縦書きと左横書きの両方を扱う。
しかし、現代の印刷物における中国語や朝鮮語は、圧倒的に左横書きが優勢であり、新聞や小説、漫画なども、横書きで書かれることが多い。縦書きの長文は、よほど改まった場に限られる。日本語のように今でも縦書きが大量に印刷される言語は、世界ではかなり珍しい。
分かち書き
日本語は、文の区切りにおいて空白で区切る、いわゆる「分かち書き」を基本的に行わない。
なお、分かち書きはあくまで記法であり、そこで区切って読むのは誤り。⇒リンキング
文の区切りは、「、」や「。」などの句読点で示す。文の終りを示す「。」は、かなり厳密に記されるが、文節の区切りを示す「、」は、特に決まったルールなどはなく、書いた本人の感性に委ねられる事が多い。
また、漢字、ひらがな、カタカナのような文字の種類の違いも、文の区切りとして機能する。
分かち書きをしない言語は世界的にみて少数派である。他の言語では、中国語やタイ語、ミャンマー語などが分かち書きをしない(タイ語では文章中に空白が入ることがあるが、これは日本語で言うところの句読点に近い。単語ごとに空白を入れる事はしないので、分かち書きとは言えない)。
ただし、昔のゲームなど、ピクセル数の問題で複雑な漢字が表示しづらく仮名だけで文章が打たれている場合には、ある程度スペースを入れることがある。
関連タグ
言語 言葉 会話 方言
日本 国語
ひらがな カタカナ
手話...日本のろう者の多くは日本語ではなく日本手話を母語とする
アイヌ語 かつて日本(の一部)で話されていた言語



















