昨日の話題 ([2012-03-25-1]) の続きで,言語はなぜ音声に依存しているのか,という問題を考えたい.まず,音声依存の長所は何か.1つには,発信者にとって発信が楽だということが挙げられる.人間には発音のための器官が適切に備わっているということは昨日の記事でも触れた(他に ##160,544 の記事も参照).だが,そのこと以上に,あまり余計なエネルギーを使わず,それでいて意のままに発音できるということが重要である.人間にとって,匂いや味を意のままに生み出すことは難しいが,音を生み出すことは容易である.容易さという点では,確かに,触覚に訴える「さすり」や「たたき」,視覚に訴える身振りや表情を作り出すのも同じくらい造作ないように思われるかもしれないが,いずれも発音に比べればエネルギー消費は大きい.一方,発音は,鈴木 (25) のいうように「廃物利用」の上に成り立っているという特徴を有する.発音に用いる呼気は,生存に必要な本能としての呼吸活動の一環として実現できるし,調音に用いる唇,舌,歯などの運動も,やはり生存に必要な本能としての摂食活動の一環として実現できる.「ついで」の利用なので,無駄がないし,減りもしない.通常,物理信号を発するには相当のエネルギーが必要とされるものだが,最小限の追加的なエネルギーのみで発することができる音声というものを信号として選んだのは,人間の賢い選択,いや必然的な選択だったのかもしれない.
音声依存の長所の2つ目は,嗅覚や味覚の場合に起こりうる「混じり合い」の心配が少ないことだ.匂いや味は,放っておけばその場に停滞するために,2種類,3種類と混じり合ってしまい,それぞれを区別することが難しくなる.したがって,複数の匂いメッセージ,味メッセージが混じり合わないようにするには,逐一,場所を替えて発信しなければならない.これでは面倒だし,意思疎通の即時性が損なわれる.では,それだからといって,匂いや味の停滞しにくい風通しの良い場所を選ぶと,今度は匂いや味が受信者に届く前に風に吹き払われてしまうという不便が生じる.
ところが,音声は空気中に停滞するものでもないし,多少の風であれば吹き飛ばされることもないという両方の利点がある.ラテン語で uerba uolant, scripta manent 「話し言葉は飛び去り,書き言葉は残る」という通り,音声言語は放たれたそばから消えて行くため,その場に停滞もしなければ混じり合いもしないと同時に,風に吹き飛ばされるほど頼りない存在でもない.場所を替えずに機関銃のように話し続けることができるのは,言語が音声を用いているからだ.
音声依存の言語は,上記のように大きな長所をもつが,欠点もある.2つ目の長所の裏返しなのだが,メッセージを持続させたい場合には,音の即座に消えゆく性質は仇となる.繰り返し同じことを言い続けるというような解決策が考えられるが,5分間ならともかく,5年間は続けていられない.しかし,文明は文字という視覚に訴える重要な補助手段を生みだし,音声言語の欠点を見事に補ってきたことは注目に値するだろう.
また,音声依存の言語は,音声の発信が不可能だったり,音声信号がかき乱されたりするような物理的な状況においては,機能しないという欠点もある.例えばスキューバダイビング中には音声メッセージを発しにくいし,発したとしても相手に届きにくいので,有効な伝達手段とはならない.身振りや筆談のほうが適切である.同じく,騒音のやかましい地下鉄内や,雑踏のパーティにおいては,音声言語はしばしば非力である ([2009-07-17-1]の記事「#80. 地下鉄内のコミュニケーションには手話が最適かも」を参照).このような状況で頑張って声を張り上げる様子は,嗅覚に訴えかける言語の発信者が,頑張って作り出した匂いが風に吹き払われそうになる危機に際して,もっと頑張って強いにおいを発しようと力む姿に比較される.
音声依存のもう1つの欠点としては,人間の発音器官の構造上,発音の音源が1つに限られるという事実がある.もっとも音源が複数あればあったで,複雑な音声の組み合わせが実現できるかもしれないが,受信側にとってみれば,さすがの人間の聴覚でも複数音源の聞き取りに対応するのは負担が大きいだろう.したがって,発音の音源が1つであること自体が欠点というわけではない.音源が1つであることによって必然的に生じる音の特性,宿命としての線状性 (linearity) のもたらす欠点が,ここでの問題である(「#766. 言語の線状性」については[2011-06-02-1]の記事を参照).言語の線上性とは言語記号が時間軸に沿って線上に並ばざるを得ないという言語に働く重力のようなもので,これにより,発信者も受信者も,継起する記号と記号のあいだの関係を常に記憶していなければならないという記憶上の負担を強いられる.時間軸に沿って発せられた複数の記号は,決して一望することはできず,1つ1つ順番に記憶して,脳内で処理するほかない.複雑な入れ子型の統語構造が理解されにくいということはよく知られているが,それは主として音声言語による聴解の話しで,文字で表わされれば,あるいは統語ツリーで関係が視覚的に示されれば,一目瞭然ということも多い.
音声依存の言語の長所と欠点はそれぞれコインの表裏であるという側面はあるが,天秤にかければ長所のほうが断然に大きいと考えられる.細かく分化された音声信号を楽に産出することができ,それを高い精度で聴解することができ,かつメッセージの連続的な即時伝達という要求を満たすことができる.原理的には接触や身振りでも同様の機能を果たすことができるかもしれないが,効率の点からは,音声に圧倒的に分がある.音声を土台として文字や手話が派生し,音声言語を補助するものとして接触や身振りが用いられることからも示唆される通り,音声は人間にとって唯一絶対の伝達手段ではないものの,多くの点で他の手段の上に立つ有効な意思疎通の方式なのである.
・ 鈴木 孝夫 『教養としての言語学』 岩波書店,1996年.
言語は音声に基づいている.文明においては文字が重視されるが,言語の基本が音声であることは間違いない.このことは[2011-05-15-1]の記事「#748. 話し言葉と書き言葉」で論じているので,繰り返さない.今回は,言語という記号体系がなぜ音声に基づいているのか,なぜ音声に基づいていなければならないのかという問題について考える.
まず,意思疎通のためには,テレパシーのような超自然の手段に訴えるのでないかぎり,何らかの物理的手段に訴えざるをえない.ところが,人間の生物としての能力には限界があるため,人間が発信かつ受信することのできる物理的な信号の種類は,おのずから限られている.具体的には,受信者の立場からすれば,視・聴・嗅・味・触の五感のいずれか,あるいはその組み合わせに訴えかけてくる物理信号でなければならない.発信者の立場からすれば,五感に刺激を与える物理信号を産出しなければならない.当然,後者のほうが負担は重い.
さて,嗅覚に訴える言語というものを想像してみよう.発信者は意思疎通のたびに匂いを作り出す必要があるが,人間は意志によって匂いを作り出すことは得意ではないし,作り出せたとしても時間がかかるだろう.あまり時間がかかるようだと即時的な意思疎通は不可能であり,「会話」のキャッチボールは望めない.また,匂いを作り出せたとしても,その種類は限られているだろう.手にニンニク,魚,納豆を常にたずさえているという方法はあるが,それならばニンニク,魚,納豆の現物をそのまま記号として用いるほうが早い.仮に頑張って3種類の匂いを作り出すことができたと仮定しても,それはちょうどワー,オー,キャーの3語しか備わっていない言語と同じことであり,複雑な意志疎通は不可能である.3種類を組み合わせれば複雑な意思疎通が可能になるかもしれないが,匂いは互いに混じり合ってしまうという大きな欠点がある.受信者の側にそれを嗅ぎ分ける能力があればよいが,受信者は残念ながら犬ではなく人間であり,嗅ぎ分けは難しいと言わざるを得ない.風が吹かずに空気が停滞している場所で,古い匂いメッセージと区別して新しい匂いメッセージを送りたいとき,発信者・受信者ともに匂いの混じらない安全な場所に移動しなければならないという不便もある(だが,逆にメッセージを残存させたいときには,匂いの残存しやすい性質はメリットとなる).風が吹いていれば,それはそれで問題で,受信者が感じ取るより先ににおいが流されてしまう恐れがある.発信者が体調不良で匂いを発することができない場合や,受信者が風邪で鼻がつまっている場合には,匂いによる「会話」は不可能である(もっとも,類似した事情は音声言語にもあり,声帯が炎症を起こしている場合や,耳が何らかの事情で聞こえない場合には機能しない).人間にとって,嗅覚に訴えかける言語というものは発達しそうにない.
次に味覚である.こちらも産出が難しいという点では,嗅覚に匹敵する.発信者が意志によって体から辛み成分や苦み成分を分泌し,受信者に「ほれ,なめろ」とかいうことは考えにくい.激しい運動により体に汗をかかせて塩気を帯びさせるなどという方法は可能かもしれないが,即時性の点で不満が残るし,不当に体力を消耗するだろう.受信者の側でも,味覚により何種類の記号を識別できるかという問題が残る.味覚は個人差が大きいし,体調に影響されやすいことも,経験から知られている.さらに,匂いの場合と同様に,味は混じりやすいという欠点がある.味覚依存の言語も,効率という点では採用できないだろう.
触覚.これは嗅覚や味覚に比べれば期待がもてる.触るという行為は,発信も受信も容易だ.発信者は,触り方(さする,突く,掻く,たたく,つねる等々),触る強度,触る持続時間,触る体の部位などを選ぶことができ,それぞれのパラメータの組み合わせによって複雑な記号表現を作り出すことができそうだ.たたくリズムやテンポを体系化すれば,音楽に匹敵する表現力を得ることもできるかもしれない.複数部位の同時タッチも可能である.ただし,受信者側にとっては触覚の感度が問題になる.人間の識別できるタッチの種類には限界があるし,掻く,たたく,つねるなどの結果,痛くなったり痒くなったりしては困る.痛みや痒みは持続するので,匂いの残存と同じような不都合も生じかねない.触覚に依存する言語というものは十分に考えられるが,より効率の良い手段が手に入るのであれば,積極的に採用されることはないのではないか.さする,なでる,握手する,抱き合うなどのスキンシップは実際に人間のコミュニケーションの一種ではあるが,複雑な記号体系を構成しているわけではなく,主役の音声言語に対して補助的に機能することが多い.
人間において触覚よりもよく発達しており,意思伝達におおいに利用できそうな感覚は,視覚である.実際に有効に機能している視覚記号として,身振りや絵画がある.特に身振りは発信が容易であり,即時性もある.文字や手話も視覚に訴える有効な手段だが,これらは身振りと異なり,原則として音声言語を視覚へ写し取ったものである.あくまで派生的な手段であり,補助や代役とみなすべきものだ.しかし,補助や代役とはいえ,いくつかの点で,音声言語の限界を超える働きすら示すことも確かである(##748,849,1001).このように音声言語の補助や代役として視覚が選ばれているのは,人間の視覚がことに鋭敏であるからであり,偶然ではない.視覚依存の欠点として,目の利かない暗闇や濃霧のなかでは利用できないことなどが挙げられるが,他の感覚に比べて欠点は少なく,長所は多い.[2009-07-16-1]の記事「#79. 手話言語学からの inspiration 」も参照.
最後に残ったのが,人間の実際の言語が依存している聴覚である.聴覚に訴えるということは,受信者は音声を聴解する必要があり,発信者は音声を産出する必要があるということである.まず受信者の立場を考えてみよう.人間の聴覚は視覚と同様に非常に鋭敏であり,他の感覚よりも優れている.したがって,この感覚を複雑な意思疎通の手段のために利用するというのは,能力的には理にかなっている.音の質や量の微妙な違いを聞き分けられるのであるから,それを記号間の差に対応させることで膨大な情報を区別できるこはずだからだ.
次に発信者の立場を考えてみよう.発信者は多様な音声を産出する必要があるが,人間にはそのために必要な器官が進化の過程で適切に備わってきた([2009-10-04-1]の記事「#160. Ardi はまだ言語を話さないけれど」,[2010-10-23-1]の記事「#544. ヒトの発音器官の進化と前適応理論」を参照).人間の唇,歯,舌,声帯,肺などの発音に関わる器官がこのような状態で備わっているのは,言語の発達にとって理想であったし,奇跡とすらいえる.これにより,微妙な音の差を識別できる聴覚のきめ細かさに対応する,きめ細かな発音が可能になったのである.音声に依存する言語が発達する条件は,進化の過程で整えられてきた.
では,他の感覚ではなく聴覚に訴える手段が,音声に依存する言語が,特に発達してきたのはなぜだろうか.それは,上で各感覚について述べてきたように,聴覚依存,音声依存の伝達の長所と欠点を天秤にかけたとき,長所が欠点を補って余りあるからである.その各点については,明日の記事で.
よく知られているように,ヒトの言語の発音器官 ( speech organ ) は言語のために進化してきたわけではない.いずれも主たる機能は生存のための生理的機能である.調音機能はあくまで副次的なものであり,だからこそヒトの言語の獲得は余計に不思議に思われるのである.
以下は O'Grady (2) より,発音器官の2重機能(生理機能と発音機能)を示す表である.
| Organ | Survival function | Speech function |
|---|---|---|
| Lungs | to exchange CO2 and oxygen | to supply air for speech |
| Vocal cords | to create seal over passage to lungs | to produce vibrations for speech sounds |
| Tongue | to move food to teeth and back into throat | to articulate vowels and consonants |
| Teeth | to break up food | to provide place of articulation for consonants |
| Lips | to seal oral cavity | to articulate vowels and consonants |
| Nose | to assist in breathing | to provide nasal resonance during speech |
東京大学やカリフォルニア大学などの国際チームが,エチオピアで440万年前とされる最古の人類の全身骨格を化石から復元した.この最古の人類は Ardipithecus ramidus 「ラミダス猿人」という種類の人類で,この化石の女性は Ardi と愛称で呼ばれる.人類がチンパンジーから分かれたのは約700万年前とされ,分かれた後の人類の最初の証拠がアルディということになる.人類の起源の研究が新しい段階に入ったとして,米科学誌『サイエンス』が異例の特集を組んでいる.
[2009-06-08-1]の記事で見たとおり,人類の起源から人類の言語の起源までには,相当な時間的な隔たりがある.言語は長く見積もっても数十万年の歴史をもつに過ぎない.人類は長い間「無言」だったわけだが,進化の過程では言語を獲得するための準備を着々と進めていったことも事実である.
その準備の一つに,脳の発達がある.言語を操るためには相応の脳の発達が必要だったことは間違いない.ちなみに,アルディの脳は300ccくらいで,まだチンパンジーと同じくらいだったという.
脳の発達以外にも言語の起源につながるもう一つの重要な準備があった.喉頭 ( larynx ) の発達である.アルディはすでに直立歩行していたようだが,直立することにより喉の空間が縦に長くなり,声帯 ( glottis ) で発せられた音が喉頭で共鳴することができるようになった.これにより,ヒトは音の高さや大きさを調整することができるようになり,そこに感情を載せるなど精妙な表現の手段を獲得したのである.さらに,共鳴器で響いた音が,舌や歯などのより上部の器官で調音され,複雑多岐な子音や母音が発せられるようにになった.
いくら脳が発達して言語能力が高まったとしても,それを表現する手段である声や音の調整が不可能であれば,言語行動 ( speech ) は成り立たなかっただろう.
現代でも,脳(=表現する内容)と喉頭(=表現する手段)がセットになっていないと言語コミュニケーションは成り立たない.英語という手段だけ身につけようと頑張っても,伝える内容がお粗末ではしかたがない.自戒を込めて,アルディからの教訓.
Powered by WinChalow1.0rc4 based on chalow