このキーワード
友達に教える
URLをコピー

UTF-EBCDICとは?

移動先: 案内検索
Unicode

文字符号化スキーム

UTF-7
UTF-8
CESU-8
UTF-16
UTF-32
UTF-EBCDIC
SCSU
Punycode (IDN/IDNA)
GB 18030
【その他】

UCS
マッピング
書字方向
BOM
漢字統合
UnicodeとHTML
Unicodeと電子メール
Unicodeフォント

UTF-EBCDICUnicode文字の表現に使われる文字コードである。EBCDICと親和性があり、メインフレーム上で動作する従来のEBCDICアプリケーションが大きな困難なしに文字を処理できるようにすることを意図している。既存のEBCDICベースのシステムにとっての利点は、既存のASCIIベースシステムにとってのUTF-8の利点に類似する。UTF-EBCDICの詳細はUnicode技術報告 #16で定義されている。

UTF-EBCDICで符号化されたUnicode符号位置の並びを得るには、UTF-8に基づいた符号化 (UTF-8-Modと呼ばれる仕様) をまず適用する。この符号化がUTF-8と主に異なる点は、Unicode符号位置のU+0080からU+009Fまで (C1制御文字) を、後で対応するEBCDICの制御文字へマップするため1バイトで表現できるようにしている点である。これを達成するため、10XXXXXXの代わりに101XXXXXがマルチバイトシーケンスにおける後続バイトの形式として使われる。これは1バイトあたり6ビット保持できるUTF-8と異なり5ビットしか保持できないため、一般にUTF-EBCDICは同じ入力データに対してUTF-8よりも大きな出力を生成する。

この変換ではデータはまだASCIIベースの形式であるため、表索引を用いて可逆なバイト単位の変換をこのデータに適用し、可能な限り通常のEBCDICコードページに近づける。これらの手順を逆にたどることにより容易にUnicode符号位置へ復元できる。

一般に、設計対象であったEBCDICベースのメインフレームにおいてさえ、この符号化形式は滅多に使われない。z/OSのような、IBM製のEBCDICベースのメインフレームのオペレーティングシステムは、通常完全なUnicodeサポートにUTF-16を使用する。たとえば、DB2 UDB、COBOLPL/IJavaおよびIBM XMLツールキットはIBMのメインフレーム上でUTF-16をサポートする。

参考資料

用語の日本語表記は原則として次にならった。Unicode Terminology English - Japanese”. Unicode, Inc. 2010年1月1日閲覧。

外部リンク

・・・・・・・・・・・・・・・・・・
出典:wikipedia
2018/01/14 15:46

HAPPY Wikipedia

あなたの考える「UTF-EBCDIC」の意味を投稿しよう
「UTF-EBCDIC」のコンテンツはまだ投稿されていません。
全部読む・投稿 

UTF-EBCDICスレッド一覧

・・・・・・・・・・・・・・・・・・
「UTF-EBCDIC」のスレッドを作成する
UTF-EBCDICの」
友達を探す
掲示板を探す
このページ
友達に教える
URLをコピー

注目のキーワード

錦織圭/北島康介/2014_FIFAワールドカップ・アジア予選/サッカー日本女子代表/消費税/東京スカイツリー/ダルビッシュ有/イチロー/香川真司/野田内閣/復興庁/石川遼/HKT48/AKB48/ワールド・ベースボール・クラシック日本代表/黒田博樹/尖閣諸島/バレンタインデー/ONE_PIECE

キーワードで探す

 
友達を探す
掲示板を探す
無料コミックを探す
占い・診断
着メロを探す
GAMEを探す
デコメを探す
きせかえツールを探す
FLASH待ち受けを探す
ハッピーWiki
ハッピーメール
ハッピーランド
HAPPY NEWS
2010Happy Mail