ISO 639-3:2007 Codes for the representation of names of languages — Part 3:Alpha-3 code for comprehensive coverage of languages は、国際規格 ISO 639 言語コードのひとつであり、国際標準化機構によって2007年2月5日に公刊された。
ISO 639-3 は ISO 639-2 3文字コードの拡張で、知られるすべての自然言語をカバーすることを目的とする。拡張された言語の範囲は主に ISO 639-3 の登録主体になっている国際SILの出版物であるエスノローグの言語コードを元にしている。ISO 639-3 は、その言語が現存の言語であるか消滅言語・古代語・人工言語であるかを問わず、使用者の数を問わず、書かれた記録があるかどうかを問わず、可能なかぎり完全な言語の一覧を提供する。ただし、インド・ヨーロッパ祖語のような再建された言語は含まない。
ISO 639-3 はさまざまな応用に供することを目的とする。計算機と情報システムでは、インターネットのように多言語を支援する必要があるため、広く使われる。また、言語学の文献その他において、言語名では不明瞭であったり多義的であったりする場合に、それを補うために使われる。
ISO 639-3 は言語を包括的にカバーし、すべての言語に等しい機会を与え、情報技術で広く採用されているため、情報格差の問題に対応するための重要な技術を提供する。
ISO 639-3 は、ISO 639-1 で定義されている(世界の文献でもっとも頻繁に使われる )すべての言語を含んでいる。ISO 639-2 は言語だけでなく複数の言語グループにもコードを与えているが、ISO 639-3 はそうではないため、ISO 639-3 は ISO 639-2 の上位集合ではない。また、ISO 639-2 にはBコードとTコードの2種類があるが、ISO 639-3 はTコードを使用している。
例:
【言語】en
| eng
| individual
| eng
de
| ger
、deu
| individual
| deu
ar
| ara
| macro
| ara
individual
| arb
、その他
zh
| chi
、zho
· | macro
| zho
individual
| cmn
individual
| yue
individual
| nan
2012年4月の段階で、ISO 639-3 には 7,776 の言語を含んでいる。
ISO 639-3 に含まれる言語には以下のものを含む:639-2 の単独の言語、エスノローグに記述された現代語、Linguist Listに記述された歴史的な変種・古代語・人工言語、および毎年のコメント期間中に推奨された言語。
機械可読なデータファイルが登録主体によって提供されている。このデータファイルを使用して ISO 639-1 または ISO 639-2 から ISO 639-3 への変換を行うことができる。
ISO 639-3 は原則として、主観的でない基準に従って言語の区別を行う。方言その他の言語未満の変種について識別子を与えることを目的としない。しかし言語の区別には主観がはいりこみ得る。とくに文字で書かれたり教育やメディアで使用されたりすることによる様式化が進んでいない口頭言語の変種の場合は特にその傾向が高い。
ISO 639-3 のコードはアルファベット3文字であるため、格納できる言語の最大値は 26 × 26 × 26=17576 である。ISO 639-2 は4つの特殊コード・520の予備コード・23のBのみのコードを含んでいるため、ISO 639-3 では 547 のコードを使用することができない。したがって、17576 - 547=17030 が最大値となる。
ISO 639-2 の言語グループ名のうち ISO 639-5 に定義されていないものを除くと、さらにその数は少なくなる。
ISO 639-2 のうち56の言語は、ISO 639-3 では標準の目的において「マクロランゲージ」と考えられている。
これらのマクロランゲージのうち、いくつかは ISO 639-2 のうちに個別言語を全く含んでおらず(例:ara
アラビア語)、ISO 639-3 で新たに定義された。他のマクロランゲージである nor
(ノルウェー語)については、ISO 639-2 のうちにすでに2つの個別言語を含んでいる(nno
ニーノシュク および nob
ブークモール)。
このことは、ISO 639-2 である言語(例:ara
、アラビア語)の方言と見なされていた言語(例:arb
、標準アラビア語)が、ISO 639-3 では個別言語と見なされることがあることを意味する。
マクロランゲージは、言語学的には異なる言語であるが、話者にとっては同じ言語の2つの変種として扱われる場合(例:ダイグロシアの場合)を扱うための試みである。
例:
完全なマクロ言語の一覧は以下を参照:“Macrolanguage Mappings”. sil.org. 2012年6月14日閲覧。
集合的言語コード要素とは、いかなる文脈においても単一の言語と考えられない、個別言語のグループを表す識別子である 。これらのコードは個別言語でもマクロランゲージでもない。
ISO 639-2 には集合的言語のための3文字識別子が含まれるが、ISO 639-3 からは除外されている。したがって、ISO 639-3 は ISO 639-2 の上位集合ではない。
ISO 639-5 は語族や語派のための集合的コードを定義している。
特定のコードのいずれも妥当でない場合のために、4つのコードが定義されている。これらのコードは、主にデータベースのように、ISO コードが存在しなくても指定しなければならない場合に使用することを目的とする。
【コード】mis
| その他の言語
mul
| 複数言語
und
| 不明言語
zxx
| 言語ではない
mis
は、ISO標準に(まだ)含まれていない言語のために用いる。
mul
は、データが複数の言語からなるが、データベースが単一のISOコードを指定することを要求しているときに用いる。
und
は、データに使用されている言語名が不明である(誤ってラベルづけされている、ラベルづけされていないなど)場合に用いる。トロイ語のように、言語名は存在するが言語そのものが不明である場合に使用することは目的としていない。
zxx
は、データが言語でない場合(動物の鳴き声など)に用いる。
以上に加えて、qaa
から qtz
までの範囲はローカルに使用する場合のために予約されている。たとえばLinguist List で消滅した言語のために用いる。Linguist List ではこのうちひとつに汎用の値を割りあてている。
qnp
| 名前のない祖語
このコードは、言語系統図において名前のない節点を表すのに使われる。
ISO 639-3 のコード表は変更可能であるが、すでに使われているコードを守るため、変更が許されるのは以下の場合に限られる:
変更は年1回行われる。各変更要求は最低3か月の公開レビュー期間が与えられる。
ISO 639-3 のサイトの「命名の範囲」 およびSILの言語の型において、コードを与える範囲と、どのような条件を満たさなければならないかを説明している。たとえば、人工言語に識別子を与えることはできるが、それが人間のコミュニケーションのために設計されており、かつ文献がある場合に限られる。この制約は個々人の発明に対する要求がなされることを防ぐためにある。
登録主体のWebサイトでは、ISO 639-3 のコード表がどのように保守されるかついて説明している。同時に、変更要求を受けとり処理するためのプロセスも記述している。
このWebサイトでは変更要求の書式と、追加提案に関する情報を収集するための第二の書式が提供されている。任意の団体が変更要求を提出できる。提出された要求はまず登録主体によって不備がないかレビューされる。
不備のない文書による要求を受けとった場合、その要求が公開されている「変更要求インデックス」に加えられる。同時に「Lingust List」の「LINGUIST」ディスカッション・リストおよび関連すると登録主体がみなしている他のリストに告知がなされ、変更要求に対する公開レビューに招待する。どのリストのオーナーおよび個人も特定の地域や語族に関する変更要求に関する通知を受け取ることができる。受け取ったコメントは他の団体がレビューするために公開される。コメントの総意にもとづいて、変更要求は撤回されるか、または「候補状態」に昇格する。
毎年のレビュー期間が終了する3か月前に、LINGUIST のディスカッション・リストおよび他のリストに、「候補状態の変更要求」に関する告知がなされる。すべての要求は、レビュー期間が終了するまでレビュー・コメントが可能である。
毎年のレビュー期間の終了時に決定がなされる。要求は全体あるいは一部が採用されるか、修正されて翌年に持ちこされるか、または検討が撤回される。各変更要求と、それに対する決定・決定の根拠の公開アーカイブが保守されている。
言語学者のモーリー、ポストおよびフリードマンは ISO 639-3 に対してさまざまな批判を提起している。
jnj
が割りあてられているが、これは差別語の「Janejero」に由来する。これらのコードはその言語の話者を侮辱するものであるが、標準において割り当てを変更することができない。マルティン・ハスペルマート はこの指摘のうちの4つを認めたが、言語変化については認めなかった。ハスペルマートによれば、どのような言語の記述もそれが何の言語であるかを同定することが必要であるし、言語の異なる段階を区別するのは容易であるから、言語変化に関する指摘は不当なものである。ハスペルマートは、言語学者は languoid レベルのコード化を行うことを好むだろうとする。「言語学者にとって、それが言語であるか、方言であるか、緊密な関係にある複数の言語であるかが意味を持つことはほとんどない」ためである。ハスペルマートはまた、ISO が言語の同定を行うことが妥当かにも疑問を投げかける。ISO は工業規格の機関であるが、言語の文献と用語は科学的な努力であるとする。ハスペルマートは言語コードの本来の必要性は「翻訳とローカライズの経済的重要性」にあり、ISO 639-1 と ISO 639-2 はそのために作られたことを指摘する。しかし ISO 639-3 によって提供されるような「狭いコミュニティーで使われ、全くないしほとんど書かれることのない、しばしば絶滅の危機にある、ほとんど知られていない言語」を含む包括的なコードが工業的に必要かどうかは疑問とする。
ain
| アイヌ語
jpn
| 日本語
ryn
| 北奄美大島語
ams
| 南奄美大島語
kzg
| 喜界語
tkn
| 徳之島語
okn
| 沖永良部語
yox
| 与論語
xug
| 国頭語
ryu
| 沖縄語
mvi
| 宮古語
rys
| 八重山語
yoi
| 与那国語
jsl
| 日本手話
以上のうち日本語は ISO 639-1 と ISO 639-2 の両方で、アイヌ語は ISO 639-2 でコード化されている。
ISO 639-3
コード一覧
ISO 639-5
コード一覧