概要
特徴を要約すると「高低アクセントを持つ非声調言語で、開音節が多く閉音節が極めて限定的にしか存在しない、膠着語である言語」である。日本の「国語」であり、「国文」という呼び方もなされる。
書き言葉は主に漢字と仮名(ひらがな・カタカナ)で構成される。先進国の言語にしては珍しく、原カナン文字やギリシア文字を由来としない文字を使用している。
話者人口はほぼ日本国の人口に等しく、1億3,000万人程度と見積もられ、統計にもよるが世界の言語で10位以内に入る。世界的にも十分な実用価値と影響力を持った言語の1つであり、日本で生活する分には日本語しかできなくても生活に困ることはほぼない。
日本国外に日本語話者がまとまって居住する地域はない(過去にはハワイなどの日本人移民の間でよく使われていたが、世代を重ねるごとに使われなくなった。パラオ独立国のアンガウル州は日本語が州憲法公認とされている1つであるが、日常的に日本語を使用する住民は皆無であるという)ものの、近隣の東アジア諸国を中心に日本語を操れる外国人も少なくないほか、アニメやマンガなどのサブカルチャー分野への関心の高まりから、日本語を母語としない外国人の日本語学習者は増加傾向にある。逆に日本人であっても、先天性のろう者(補聴器などをつけても音声を聞き取れない聴覚障害者)の多くは日本語ではなく日本手話を第一言語として習得する(日本手話は日本語とは文法などが異なり、言語学的に見ると異なる言語といえる)。そのため、「日本語話者=日本語を母語とする日本人」という図式は必ずしも成り立たないことに留意されたい。
起源と系統
日本語は言語系統としては孤立しており、起源については今のところ詳らかではない。韓国語(古代新羅語の末裔)とは発音の相違が大きいものの文法はよく似ており、両言語は朝鮮半島・満州で古代に話されていた百済語・高句麗語・扶余語などと同系統の可能性が高いと指摘される(扶余・新羅語族仮説)が、共有している固有語が皆無に近いことが問題で、日本語以外の古代言語資料の少なさにより真相解明は絶望視されている。
日本語は韓国・朝鮮語をはじめトルコ語(チュルク語族)、モンゴル語(モンゴル語族)、フィンランド語(ウラル語族)などのウラル・アルタイ諸語と同じ膠着語であり、文法的に似たところも多いので、これらと同系の言語であるという仮説(ウラル・アルタイ語族仮説)が古くからある。これらは日本語も含めて相互の系統関係が証明されていないが、少なくとも成立に当たって強い影響を受けているであろうとする見解は有力である。朝鮮半島由来のアルタイ諸語が日本列島に入り、縄文時代末期から弥生時代にかけて列島在来の言語(いわゆる「縄文語」)との接触の過程で日本語が形成されたと想像されるが、肝心の「縄文語」については何一つ分かっていることはない。「縄文語」の系統についても原アイヌ語説、オーストロネシア語説、これらのクレオール語説など諸説あるがいずれも憶測の域を出ず、列島全域にわたって同系の言語が話されていたかどうかも分からない。朝鮮半島で原日本語が形成され「縄文語」と言語交代を起こした可能性や、縄文時代後期より前に日本列島で原日本語が既に形成されていた可能性も否定はできない。
沖縄語など琉球諸島で話されていた言語(琉球諸語)と、本土日本語(狭義の日本語)との系統的関連は明らかである。上代日本語の段階で琉球諸語と共有していない変化がいくつかあることから、原日本語を復元する参考になっている。ただし、考古学の知見からは平安時代の前後に農耕技術を携えて南九州から琉球に移住した人々が貝塚時代の先住民を置き換えたことが知られており、いわゆる「縄文文化」とは直接のつながりはない(日本上代文化を介した間接的な関係はあるが、それは本土も同じである)。琉球人との遺伝的な類似性が指摘されるアイヌの言語(アイヌ語)との言語的共通点も特に無い。
文法
基本的に「主語 - 目的語 - 動詞」の順をとるSOV型の言語である。英語や中国語などメジャー言語にはSVOが多いものの、世界の言語の約半数がSOV型なので、これについては別段珍しい形ではない。
ただ、現在日本で教えられているいわゆる「学校文法」は体系の全く異なる英語を参考に組み立てられたもので、「主語」という概念はそもそも日本語には必要ないという者も少なくない。「僕はうなぎだ」に代表される「うなぎ構文」はそのいい例で、この文で喋っているのが人間であることを瞬時に理解するのは日本語を母語としない人々にとってかなり難しいと言われる。
印欧語をはじめとする世界の大多数の言語においては、形容詞は構文上述語名詞と同様の働きをする。例えば、「He is a teacher」同様に「He is handsome」とは言えるが、「He teaches」同様に「He handsomes」とは言えない。しかし、日本語は例外的に形容詞が構文上動詞と同等の働きをし、動詞同様に未然、連用、終止、連体、已然・仮定、命令の活用を行う。このため、対格言語でありながら本来の主語が埋没し、本来目的語であるはずのものが主語として暴れ出てくる能格言語的な表現が可能であり、また必要でもある。例として言えば、「ウサギは耳が長い」という一文が挙げられる。長いのは耳であってウサギではないが、構文上の主語は耳を押し退けてウサギが飛び出てきている。
この書籍によれば、「名詞文」(アウトだよ!等)、「形容詞文」(ちっちゃくないよ!等)、「動詞文」((3分間)待ってやる等)の3つとのことで、実際話す時は感動詞以外はこの3種類のうちいずれかを必ず使用していることが感じられるはず。
実際主語や目的語とされているものは順序関係なく使っても省いても違和感がないが、上記3文は最後に置かないと倒置的で、多用されると間違いなく違和感を覚えるだろう。日本語に限ったことではないが、現行の文法では不完全なため新たな総括が待たれる。
動詞に「た」を結びつけることで過去形、「たい」をつけることで願望、「れる」をつけることで受け身…のように、基本語彙に様々な語尾をくっつけることで意味を展開する「膠着語」というタイプの言葉である。膠着語には他にフィンランド語やハンガリー語などのウラル語族、トルコ語などのテュルク語族、モンゴル語、朝鮮語などがあり、上記のウラル・アルタイ語族仮説の根拠となっている。日本語における「動詞の活用」は非常に規則的であり、不規則動詞は少ない。英語の「現在形:go、過去形:went」のように、全く繋がりのない単語に変化する動詞はほぼ存在しない。
単語の借用では古代中国語から漢語の形で大量に単語を導入しており、漢語なしでは表現できる内容が限られる。とはいえ朝鮮語(同じく漢語を導入)や英語(フランス語由来の単語を多数取り入れた)等と異なり、固有名詞以外は借用語無しでも表現にある程度融通が利く(なるべく大和言葉だけで書かれたひらがなの記事を参照して欲しい)。もっとも、固有語とされる単語(大和言葉)でも中国語との類似が目立つことが指摘されており(例として「馬」や「梅」は元々日本にはなかったため、音読み「マ」「メ」がなまって訓読み「うま」「うめ」が発生したのではないかと言われている)、漢字伝来前にも中国大陸からかなりの語彙が入っているものと目されている。
発音
ほとんどの音節が母音で終わる開音節言語で、子音で終わる閉音節は「ん」と「っ」がつくもののみに限られる。このため、日本語の母語話者は子音を子音のみで発音することに不慣れな者が多く、外国語を喋っても通じないケースが多い一因となっている。
母音は(基本的に)5種類と多くはなく、子音も難解なものはあまりないので、発音はやさしい部類である。が、モーラ(拍)が極めて重要であり、これを苦手とする外国人は多い。モーラというのは「ん」や「っ」、長母音を含めてそれぞれを一拍とするリズムの取り方で、日本語ではこれを意識して重子音「っ」や長母音が含まれる言葉を正しいテンポで区別しなければならない。
日本の人気番組『笑点』でかつて、「世の中は 一つつまるの 違いにて おかずはアサリ 味はアッサリ」という川柳が紹介されたことがあるが、この「アサリ」と「アッサリ」は音が「A/SA/RI」と同一にも拘らずテンポが異なるため別の意味の言葉として処理される。日本語話者は全く気にせず使い分けているが、実はこのような単語の区別をする言語は少ない。例えば、英語では、「ミッキーマウス」を「ミキマウス」のように言っても通じるが、日本語ではあまり通じない。
だが、これがために外国語の音写の際に長音(「ー」)や促音(「ッ」)をどこに入れるか入れないか問題が発生している。同じ「spaghetti」に対して「スパゲティ」「スパゲッティ」「スパゲティー」「スパゲッティー」と、人によって音写が分かれてしまう。中には「スッパッゲッテイーッ」「スバゲーチー」などととんでもない音写をしてしまう人間もいたりする。
重子音や長母音を含んだモーラの概念が重要な言語としては他にウラル語族フィン・ウゴル語派のフィンランド語がある。日本語とフィンランド語は歴史上の接点がほとんどなく共通の語彙が少ない言語なのに響きが妙に似ており、「一見日本語のようだがわけのわからないことを話している」ように聞こえ、空耳のネタになることが多い。
子音の区別は極めて曖昧であり、L音とR音は区別せず、両者の中間的な音で発音される。特に「さ行」「た行」は、後ろに続く母音により「s」「sh」「t」「ch」「tz」が混じって使用され、なかなかのカオスぶりを発揮している。「じ」「ぢ」「ず」「づ」の四つ仮名の区別は特に混同しやすく、地域によりこれら全てを区別する「じぢずづ弁」の方言もないわけではないが(筑後弁、鹿児島弁など)、一般には「じ」と「ぢ」、「ず」と「づ」が同一化した「じじずず弁」か、これら全てが同一音と化した「ズーズー弁」のどちらかである。
「ワ行」の「ゐ」「ゑ」「を」は子音が発音されないため、実態として「あ行」と同一であり、一部の方言を除いてあくまで表記上の区別に名残をとどめるのみである。
声調は定義されているわけではないのでどのような抑揚をつけてもよいが、「日本語として響きが良い声調」は暗黙に存在する。例えば「雨」は先頭を強く読み、「飴」は後を強く読むのが普通。
同一単語でも場合によって響きが良い声調が異なり、例えば「長野」を単独語で用いる場合は後ろは下がり調子に呼んだ方がよく、「長野県」など後ろに接続させる場合であれば逆に先頭を下がり調子にした方がよいとされる。
ただ、方言によって、こういったルールは違いが生じてくる。地域によりアクセント差が著しく、大きく分けて「無アクセント」「一・二型アクセント」「東京式アクセント」「京阪・讃岐・垂井式アクセント」に分けられる。詳しくはアクセントを参照。
表記
文字表記では中国語と並び稀有な「多系統の文字を混ぜて書く言語」であり「漢字を使う言語」であることが大きな特徴といえる。ラテン文字とアラビア数字と他の文字体系の混用は他の言語でもよくあるが、日本語は固有文字である仮名(ひらがなとカタカナ)に中国から導入した漢字を混ぜる。韓国語でも昔は漢字を使っていたが、今ではほとんど使わない。ベトナム語も漢字表記が可能だが、今は通常ラテン文字表記である(中国国内の京族の間には漢字とチュノムを使う表記が残っている)。
もっとも、今のスタイルは色々な変遷を経て確立されたもので、かつては漢字のみで万葉仮名として表記したり、変体仮名や連綿体(続け書き)を用いたり、戦前くらいまでは「漢字+カタカナ」も広く使われていたなど、時代によって書き方はかなり変化している。また、かつては主に縦書きだったが、横書きにも対応したため、現在ではどちらでも使える珍しい言語の一つでもある。
文字の種類
日本語の表記は複雑である。文字は主に「ひらがな」「カタカナ」「漢字」という複数の文字を使い分ける必要がある。ひらがな、カタカナは合わせても100文字程度であるが、漢字は数が多い。日常的に必要な漢字の目安とされる常用漢字は2136字あり、その上、漢字には複数の読み方が存在する。中国の今昔の発音が共存し、訓読みもあって読み方が多数ある。
このため、日本語の漢字は漢字を使い慣れた中国人にとっても頭痛の種である。ひらがな、カタカナに限定すれば、いくつかの例外(「は」を、位置によって「わ」と読むなど)があるものの、基本的には1文字につき1発音である。しかし、漢字は、文字自体が多数あって習得が難しい上に、1つの文字につき、複数の読みがあるのが多く、非常に難解である。また、漢字のあとに付属させる「送りがな」も、特に決まったルールがなく、例えば「あかるい」は「明い」「明るい」「明かるい」の全てが、厳密に言えば間違いではない(学校のテストでは、正解は「明るい」となる場合が殆どだが)。
「うp主」等複数の種類の文字を一単語内に平然と織り交ぜ、一文字に2音節以上の発音を充てる言語は世界広しといえど日本語くらいしかない。(「志(こころざし)」一文字で訓読みには5音節もある)。かつて、朝鮮語やベトナム語などでは、似たような漢字の使い方をしていたが、これらの言語は漢字をほぼ廃している。またこれらの国の漢字にはほぼ音読みしかなかった。
古くはひらがな、カタカナともに異体字が複数あった(変体仮名)。カタカナの異体字は早い時期に姿を消したが、ひらがなの異体字も明治期に活版印刷が普及したために複数のかな書体を使う意味が薄れ、国語改革によって整理された。しかし、あえて古い雰囲気を出すために、日本料理店の看板などに使われることはある。
識字
日本語は、発音だと易しい部類に入る言語である(数学者であるピーター・フランクルは日本移住に際し「話すだけなら2年で十分」という前評判を聞いた上でマスターした)。また、かな文字だけなら発音の乖離が少なく、拗音を除き一文字一音節なので習得はさほど困難ではない。だが、実用的な日本語文の読解には漢字の理解が必要になってくる。日本語が母語であっても、学校のカリキュラムにおいて漢字の習得には9年以上かけていること、また日本国籍を取得する場合、小2レベルとかなりハードルを下げていることは難解さの表れとも言える。
このような日本語の複雑怪奇な表記体系は、外国人にとっては難題であるが、古くから日本人の識字率は高かったことが知られている。このことから、「文字数が多い日本語は不合理」と考え日本語改革を目論んでいたGHQは、最終的に日本語のローマ字化を断念したという。
アルファベットを使用している人には馴染み深い「難読症」は日本ではかなり少ない(全くいないわけではない)。ただし、文字は読めても、その意味を正確に理解することが出来ない、いわゆる「機能的非識字」は、それなりの数が存在する(一説には、日本の中学生の15%がそれに該当するという)。日本が他国に比べて機能的非識字が多くはないが、少ないわけでもない。
なお、脳が外傷を負うことで文字が読めなくなる症例がある。アルファベットを使う言語の話者なら当然「文字が読めない」の1通りしかないが、日本語話者の場合は「漢字だけ読めない」「仮名だけ読めない」の2通りが加わる。このことから、漢字と仮名では脳が処理している場所が異なるという仮説が立てられており、この特性が、漫画の構成展開(吹き出し⇔仮名、絵⇔漢字)に良影響を及ぼしているという指摘があるとか。恐らくは先述した「表音文字・表意文字の併用」がそのような影響を与えているものと思われる。
分かち書き
日本語は、文の区切りにおいて空白で区切る、いわゆる「分かち書き」を基本的に行わない。なお、分かち書きはあくまで記法であり、そこで区切って読むのは誤り。⇒リンキング
文の終わりは句点「。」で示し、文中の区切りには読点「、」を入れる。句点は(少なくとも正式な出版物では)厳密に記される事が多いが、読点の入れ方には厳密なルールがなく、書いた本人の感性に委ねられる部分も大きい。しかし、読点には論理の区切りを示す働きがあるので、極端に「、」が少なかったり、あまりにも定型から外れた「、」の入れ方をしたりすると、文中の論理の筋道が辿りにくくなり読みづらい(大江健三郎の文章などがその例)。
なお、句読点は明治になって一般化したものであり、それ以前の文章は句読点も無しに延々と書かれていた。文章の区切りを示す「、」や「・」の使用例は江戸時代以前からあるが、一般的な書式ではなかった。現代では区切りを分かりやすくするために古文に句読点がつけられることがある。句点が厳密なのは、そこに「終止形」と呼ばれる文末特有の語句形態がつくからであり、古文に便宜的に句読点がつけられるのもこの終止形の存在があってこそである。つまり、日本語は空白ではなく語形で文末を規定する言語だと言える。
また、漢字、ひらがな、カタカナのような文字の種類の違いも文の区切りとして機能するので、日本語文は空白を入れる必要がない。
分かち書きをしない言語は、世界的にみて少数派である。他の言語では、中国語やタイ語、ミャンマー語などが分かち書きをしない。タイ語では文章中に空白が入ることがあるが、これは日本語で言うところの句読点に近い。単語ごとに空白を入れる事はしないので、分かち書きとは言えない。
単語の区切りが空白で区切られないため、日本語をインプットメソッドやAIなどに理解させる形態素解析には、特別なアルゴリズムが必要となってくる。
役割語
日本語の文章で表記された台詞には、「一文だけで話者の身分や年齢、性別、状況まで推測できる」という特徴がある。一人称の多さ(私、僕、俺、おいらなど)もさることながら、敬語を使っているのであれば生真面目だったり気の小さい性格、尊大な喋り方をしているのであれば自信家の性格、といったことを簡単に表現できる。
さらに、語尾に「わ」や「よ」などがついていれば女性、「じゃ」や「ぬ」がついていれば老人、「ぞ」や「ぜ」などがついていれば少年や青年のキャラクターの可能性が高い。現実には老人らしい言葉遣いをする高齢者はあまりいないし、男性的な言葉遣いをする女性も多いのだが、フィクションではわざとステレオタイプな喋り方をさせることで人物像を表現しているのである。これを役割語という。
関連タグ
方言:主に日本語の方言について記述している。