このキーワード
友達に教える
URLをコピー

Portable_Document_Formatとは?

移動先: 案内検索
 | このページは「PDF規格の歴史」との間で記事内容の一部転記が提案されています。
議論は「このページのノート」を参照してください。(2018年1月)

Portable Document Format

拡張子
.pdf
MIMEタイプ
application/pdf
タイプコード
'PDF '(半角空白を含む)
UTI
com.adobe.pdf
マジック
ナンバー
%PDF-
【開発者】
ISO
【初版】
1993年6月15日 (1993-06-15)
最新版
2.0
(2017年7月28日 (2017-07-28))

【種別】
ページ記述言語
【派生元】
PostScript
【拡張】
PDF/X, PDF/A, PAdES など
国際標準
ISO 32000-2
【ウェブサイト】
www.iso.org/standard/63534.html

Portable Document Format(ポータブル・ドキュメント・フォーマット、略称:PDF)は、アドビシステムズが開発および提唱する、電子上の文書に関するファイルフォーマットである。1993年に発売されたAdobe Acrobatで採用された。

特定の環境に左右されずに全ての環境でほぼ同様の状態で文章や画像等を閲覧できる特性を持っている。

アドビシステムズはPDF仕様を1993年より無償で公開していたが、それでもPDF規格はAdobeが策定するプロプライエタリなフォーマットであった。2008年7月には国際標準化機構によってISO 32000-1として標準化された。アドビはISO 32000-1 についての特許を無償で利用できるようにしたが、XFA (Adobe XML Forms Architecture) やAdobe JavaScriptなどはアドビのプロプライエタリな部分として残っている。

目次

  • 1 PDFの特徴
    • 1.1 レイアウトの保持
  • 2 PDFの利用場面
    • 2.1 電子ドキュメントの公開・配布
    • 2.2 印刷物として制作したドキュメントのPDF化
    • 2.3 PDF入稿
    • 2.4 データの入力と収集
  • 3 PDFの歴史
    • 3.1 アドビによる仕様定義
    • 3.2 ISO規格化
      • 3.2.1 PDFの関連規格
      • 3.2.2 PDF 1.7
      • 3.2.3 PDF 2.0
        • 3.2.3.1 新機能
        • 3.2.3.2 拡張された機能
        • 3.2.3.3 廃止された機能
      • 3.2.4 ISO TC 171 SC 2 WG 8
  • 4 技術的な基盤
    • 4.1 PDFとPostScript
  • 5 技術概要
    • 5.1 ファイル構造
    • 5.2 イメージモデル
      • 5.2.1 ベクター画像
      • 5.2.2 ラスター画像
      • 5.2.3 テキスト
      • 5.2.4 フォント
      • 5.2.5 標準Type1フォント(標準14書体)
        • 5.2.5.1 フォントの埋め込みの注意
      • 5.2.6 エンコーディング
        • 5.2.6.1 日本語のエンコード
    • 5.3 インタラクティブ性
      • 5.3.1 AcroForms
        • 5.3.1.1 Forms Data Format (FDF)
      • 5.3.2 XML Forms Data Format (XFDF)
      • 5.3.3 Adobe XML Forms Architecture (XFA)
    • 5.4 論理構造とアクセシビリティ
  • 6 技術の特筆点
    • 6.1 スキャンしたドキュメント
    • 6.2 アクセシビリティ
    • 6.3 ウイルスと脆弱性
      • 6.3.1 閲覧に使用したコンピュータのウイルス感染
    • 6.4 権利コントロール
      • 6.4.1 セキュリティと電子署名
      • 6.4.2 DRM
    • 6.5 デフォルトの画面設定
  • 7 ソフトウェア
    • 7.1 PDFファイルの閲覧と印刷
      • 7.1.1 PDFファイルの検索
    • 7.2 PDFファイルの作成と編集
      • 7.2.1 Acrobat
      • 7.2.2 様々な文書データのPDF化
      • 7.2.3 LaTeXとPDF
      • 7.2.4 XMLドキュメントのPDF化
  • 8 PDFの短所
    • 8.1 仕様が複雑
    • 8.2 再利用が困難
    • 8.3 画面で見るには不向き
  • 9 関連項目
    • 9.1 PDFソフトウェアの一覧
    • 9.2 PDFの競合規格
  • 10 脚注
  • 11 参考文献
  • 12 外部リンク

PDFの特徴

PDFファイルは 印刷可能なあらゆるドキュメントから生成でき、表示や印刷はアドビシステムズが無料で配布しているAcrobat Reader(旧Adobe Reader)またはサードパーティー製品を利用する。

PDFには、次の特長がある。

  • 作成したドキュメントを異なる環境のコンピュータで元のレイアウトどおりに表示・印刷できる
  • ドキュメントのセキュリティを設定できる
  • 圧縮してデータを格納することで、ファイルサイズを小さくできる
  • しおり・リンク・コメント・注釈といった、ドキュメントを画面に表示するときに便利な機能を設定できる
  • フォーム機能を使って、利用者の入力欄を受け取るような書式設定済み文書を作成できる
  • 音声化などアクセシビリティに配慮したドキュメントを作成できる
  • マルチメディアに対応している

レイアウトの保持

PDFのドキュメントは、Adobe Acrobat Readerに代表されるPDFビューアーがインストールされているコンピュータであれば元のレイアウトどおりに表示・印刷できる。Acrobat ReaderはWindowsmacOSLinuxなど各種オペレーティングシステム (OS) に対応したものが無償で配布されており、他のPDF閲覧ソフトも数多く存在するため、PDFファイルは多くの環境で閲覧・印刷できる。

PDF以外の電子ドキュメントは、ほかのコンピュータ上で元のレイアウトを保持したまま表示・印刷するのは難しい。例えば、WordExcelなどMicrosoft Officeのドキュメントは、対応するソフトウェアもしくは無料のビューワーをインストールすれば閲覧することは可能だが、バージョンや設定が違っていたり、フォントの有無が原因で編集者が意図した通りのレイアウトを保てない場合がある。HTML のドキュメントは多くのコンピュータで閲覧できる。しかし、レイアウトの制限が大きい上、OSやウェブブラウザ(HTMLレンダリングエンジン)の種類・設定でレイアウトが変わりやすい。

そのため、厳密にレイアウトを保持する必要のあるドキュメントはPDF化することが多い。ただし、フォントの設定によっては、PDFでも元のレイアウトを保持できない場合がある。この問題は、フォントを埋め込むことで回避できる。

PDFの利用場面

電子ドキュメントの公開・配布

PDFの特長は、PDFファイル作成元と異なるコンピュータ環境において、作成元ドキュメントのレイアウトや書式を忠実に再現した表示・印刷ができることにある。その性質を好んで、Webページ上のドキュメントやソフトウエアの説明書などの広く公開・頒布する形態で多く利用される。また、同様の理由から、将来のコンピュータの環境変化を想定した長期保存向け文書 (PDF/A) や、 DTP の過程でPDFファイルを作成・利用する (PDF/X) 用途も多くなっている。

印刷物として制作したドキュメントのPDF化

Quark XPressAdobe InDesignなどのDTPソフトウェアで組版した結果のデータは、しばしばPDFファイルとして出力される。こうして作成されたPDFファイルは、印刷物と同じレイアウトの電子ドキュメントとなる。一般に、PDFファイルの公開・配布は印刷物を配布するのに比べて低コストである。

そのためPDFを利用して例えば、カタログやパンフレットなどをインターネット上で公開したり、マニュアルや雑誌の収録記事をCD-ROMで配布することが多くなっている。

PDF入稿

印刷物制作時の入稿をPDFですることも増えてきている。従来は、QuarkXPress などで組版した結果のデータをそのまま入稿することが多かった。

PDF入稿には、

  • 原稿作成方法の制限が小さくなる
  • 画像ファイルの添付し忘れやエラーの発生を少なくできる
  • データサイズをコンパクトにすることができる

などといった利点がある。

ただし作成方法によっては、商業印刷には使えないPDFファイルが生成されることもある。たとえば、紙資料をスキャンして作成したPDFファイルから商業印刷に要求される結果を得るのは難しい。目的とする印刷品質を得るためには、フォントの埋め込みや印刷時に使用する色の情報、画像解像度などをPDFファイル作成時に適切に設定する必要がある。この設定を行うにはコンピュータの操作方法ならびに印刷物とその製造工程を的確に理解していることが必須であるため、誰でも確実に行うことができるとは言い難い。PDF/Xは、こうした問題を回避するために用いられる。

データの入力と収集

Acrobatは「フォーム」機能を利用し、文書入力のインターフェースとしても利用される。フォームとは記入用紙のことで、PDF内に記入欄を設け、エンドユーザーに入力させてメールで送付させる、あるいはPDFのインタラクティブ機能を使ってサーバに送信させることでデータを収集することができる。

またPDFファイルにはJavaScriptを埋め込むことができる。これにより入力のナビゲーションや入力時の値チェックなどが可能になる。

PDFの歴史

PDFは 1990 年代初めに、文書共有を目的として開発された。文書の書式とインラインの図表を保持し、異なるプラットフォームのコンピュータのユーザー間で文書を閲覧するために互換性のあるアプリケーションを利用できない場合にも文書を共有できる。競合としてDjVu (開発続行中)、Envoy、Common Ground社の DigitalPaper, Farallon Replicaのほかにアドビシステムズ自身が推進するPostScript format (.ps) がある。初期、 World Wide WebとHTMLが興隆する以前のPDFの主要な用途はデスクトップパブリッシングワークフローであった。

PDFの初期の普及の足取りはゆっくりしたものであった。アドビのPDF閲覧・作成ソフトAdobe Acrobatは無償ではなく、また初代バージョンのPDFは文書外部へのハイパーリンクを提供しないためインターネットの特長を活かしていなかった。またプレーンテキストと比べてサイズは大きいためモデムによるダウンロードは時間がかかり、また当時ハイスペックだったPCでも表示は遅かった。

バージョン 2.0より、アドビはAcrobat Reader (現在は Adobe Reader) を無償配布するようになった。初代バージョンとの互換性は保たれており次第に書式を固定した電子文書デファクトスタンダードの地位を確立した。

2008年にアドビのPDF Reference 1.7はISO 32000:1:2008として策定された。以後のPDF(PDF 2.0を含む)開発はIS のTC 171 SC 2 WG 8においてアドビと専門家らの協力により進められている。

【時】
【出来事】

1993年 | アドビシステムズ、PDF1.0とAcrobat 1.0をリリース。
1994年 | アドビシステムズ、Acrobat Readerの無償配布開始。この無償配布が、PDF普及の大きな要因となった。
1995年 | アドビシステムズ、Netscape Navigator用のAcrobatプラグインを公開。Web上でのPDF利用を促進した。
1996年 | アドビシステムズ、PDF 1.2とAcrobat 3.0をリリース。このバージョンからPDFとAcrobatが日本語に対応。
1999年 | アップルMac OS Xをリリース。Quartzを採用し、OSレベルでPDFへ対応。
アドビシステムズ、PDF 1.3とAcrobat 4.0をリリース。
2001年 | アドビシステムズ、PDF 1.4とAcrobat 5.0をリリース。
2003年 | アドビシステムズ、PDF 1.5とAcrobat 6.0をリリース。
2004年 | ソースネクスト、日本国内で「いきなりPDF」シリーズを発売開始。低価格のPDF作成ソフトということで注目を集めた。
アドビシステムズ、PDF 1.6とAcrobat 7.0をリリース。
2005年 | アドビシステムズ、マクロメディアを買収。PDFとFlashの統合が開始された。
2006年 | アドビシステムズ、PDF 1.7とAcrobat 8.0をリリース。
2008年7月2日 | ISOの管理規格となる。ISO 32000-1。
2008年 | アドビシステムズ、PDF 1.7, Adobe Extension Level 3とAcrobat 9.0をリリース。
2010年 | アドビシステムズ、PDF 1.7, Adobe Extension Level 8とAcrobat X(10.0)をリリース。

アドビによる仕様定義

1993-2006年にかけてアドビはPDFの仕様を数回改訂して新機能を追加している。

PDF 1.7 (ISO 32000-1) が制定された2006年以降にアドビが定義した拡張 (Extension Levels) はISO 32000-2 (PDF 2.0) のドラフトにも一部取り込まれているものもあるが、開発者はアドビの拡張部分がPDFの標準でないことに注意する必要がある。

PDFのバージョンと仕様書(2014年4月現在)
【バージョン】
【仕様書】
【発行年】
【新機能】
【Acrobat Reader のバージョン】

1.0 | Portable Document Format Reference Manual | 1993 |  | Carousel
1.1 | First, revised | 1996 | パスワード、暗号化(MD5, RC4 40ビット)、device-independent color、スレッドおよびリンク | 2.0
1.2 | First, revised | 1996 | インタラクティブなページ部品(ラジオボタン, チェックボックス等)

インタラクティブ、記入フォーム (AcroForm)
Forms Data Format (FDF) により記入内容のインポート、エクスポートをWeb経由で行えるようになった
マウスのイベント
外部ムービーの再生
外部または添付の音声の再生
zlib/deflateによるテキストと画像の圧縮
Unicode対応
色管理と代替画像のサポート

 | 3.0
1.3 | Second
 | 2000 | 

日本語フォントの埋め込み
電子署名
ICCおよびDeviceN色空間
JavaScript
各種ファイルストリームの添付 (ファイル添付)
注釈種類の追加
Adobe PostScript Language Level 3 imaging modelで追加された機能のサポート
イメージのマスク
代替イメージ
スムージング
ページ番号付けの強化
Webキャプチャ
表示順以外に論理構造表現のサポート
CIDフォントのサポート強化
data structures for mapping strings and numbers to PDF objects
プリプレス分野のワークフローのサポート
new functions for several function object types that represent parameterized classes of functions Acrobat JavaScript Object Specification Version 4.05

 | 4.0
1.4 | Third | 2001 | JBIG2画像圧縮

透明効果
OpenTypeフォント対応
RC4暗号化のキー長が40ビットから128ビットまでに拡張
入力フォームのインタラクティブ性の強化 (FDF)、XMLフォーム投稿、FDFファイルの添付、エクスポート時のUnicode対応、FDFファイルの共同編集と署名の追加
障碍者向けアクセシビリティ機能
Extensible Metadata Platform (XMP) によるメタデータストリーム
タグ付きPDF
inclusion of printer’s marks
編集時のページ境界の表示
CMaps(フォント対応表)の拡充
alternate presentations
PDFファイル間のインポート
データ添付のディクショナリのサポート
Acrobat JavaScript Object Specification Version 5.1

 | 5.0
1.5 | Fourth | 2003 | JPEG 2000画像圧縮

マルチメディアの添付と再生の強化
object streams
cross reference streams
フォーム入力の XML Forms Data Format (XFDF) 対応(PDF 1.4のXML対応を代替)
フォーム、リッチテキスト、属性をXML Forms Architecture (XFA) 2.02で記述できるようになった(静的XFAフォームのみ対応)
PKCS#7公開鍵のサポート(PDF 1.3で追加されたが1.5のリファレンスに初めて記載された)、公開鍵による暗号化、アクセス許可、ユーザー権限の署名(本文を暗号化する必要がなくなった)、SHA-1、RSA鍵の4096ビットサポート
独自の暗号化、復号を実装できるようになった
ドキュメントの一部を可視、不可視にする (CADlayered図画、地図、多言語文書などに対応)
JavaScriptで実装するスライドショー表示をサポート(Adobe Reader はScalable Vector Graphics|SVG 1.0のみ対応)
Acrobat JavaScript Scripting Reference, Version 6.0
Windows 98サポートの廃止

 | 6.0
1.6 | Fifth | 2004 | 3D アートワーク( Universal 3D ファイル形式)のサポート

OpenTypeフォントの埋め込み
XFA 2.2 によるリッチテキストと属性のサポート (XFA 2.1 および 2.2 では以下のような分野向けに定義されている: 動的な XFA フォーム, XFA 用の W3C XML 電子署名, Web サービス, XFA 'doc-literal' HTTP 経由のSOAP対応, SOAPによるWebサービスのための WSDL 定義, 等)
AES 暗号化
PKCS#7 電子署名の SHA256対応,4096ビットまでの DSA 対応
Nチャンネルの色空間サポート
ファイル添付の強化, 添付ファイルとの間の相互参照
電子署名による権利管理と改竄検出
Acrobat JavaScript Scripting Reference, Version 7.0

 | 7.0
1.7
(ISO 32000-1:2008) | Sixth (ISO first) | 2006 (ISO 2008) | 

3Dアートワークへの対応強化
XFA 2.4によるリッチテキストと属性のサポート
複数ファイルの添付 (portable collections)
document requirements for a PDF consumer application
新しい文字列形式: PDFDocEncoded 文字列、ASCII文字列、byte文字列
PKCS#7電子署名のSHA384、SHA512、RIPEMD160対応
JavaScript for Acrobat API Reference Version 8.0

(Adobe Acrobat Professional, Acrobat Standard, Reader にてAdobeが拡張した オブジェクト、プロパティについてのリファレンス)

 | 8
1.7 Adobe Extension Level 1 |  | 2008 | XFA 2.5 (Extensions Level 1) およびXFA 2.6 (Extensions Level 2) サポート(XFA 2.6は以下のような分野向けに定義されている: XFA のセキュアな投稿、XFA Foreground (XFAF) 形式のサポート) | 8.1
1.7 Adobe Extension Level 3 | Adobe Supplement to the ISO 32000, BaseVersion 1.7, ExtensionLevel 3 | 2008 | 256-bit AES 暗号化

PDF/A-2 向けXFA データセットの取り込み
Adobe Flashアプリ (SWF)、ビデオ(H.264 形式Flashを含む)の再生、音声その他マルチメディア埋め込みの改良。Flash playerとの双方向スクリプティングの実装により、ナビゲーターSWFファイルはAdobe Flex2 モジュールから普通のSWFとして認識されるようになった。
XFA 2.5および 2.6 によるリッチテキスト対応, XFA 2.7 および 2.8対応(XFA 2.7および2.8は以下のような分野向けに定義されている: Webサービスの認証ポリシー設定、WSDL/SOAP経由での投稿、タイプフェースの各国ロケール対応等)

 | 9
1.7 Adobe Extension Level 5 | Adobe Supplement to ISO 32000-1, BaseVersion: 1.7 ExtensionLevel: 5 | 2009 | XFA 3.0 | 9.1
1.7 Adobe Extension Level 6 |  | 2009 | XFA 3.1 | 9.1
1.7 Adobe Extension Level 8 |  | 2011 | XFA 3.3 (Flash/SWF と XFA の統合),
AES-256によるパスワード暗号化方式をExtension Level 3から変更。チェックのアルゴリズムに弱点が見つかったことへの対応。

仕様書は 2014年4月現在公開されていない。

 | X (10) , XI (11)

ISO規格化

国際標準化機構 (ISO) によるPDF 1.7の標準化以降、仕様の改訂はISOが預かるところとなった。アドビ独自のバージョンアップは、ベースとなるバージョン (1.7) に対する "Adobe Extensions" という形で行われている。

PDFの関連規格

PDF/X(2001年策定 - ISO 15929 および ISO 15930 標準)
PDFを元に策定された、印刷用途を目的としたファイル形式。印刷時のデータ交換をスムーズにするため、通常のPDFで使える機能を一部制限している。ISO15930として標準規格化されている。
PDF/A (2005年策定 - 一連のISO 19005 標準)
PDFを元に策定された、電子ドキュメントの長期保存を目的としたファイル形式。ISO19005として標準規格化されている。主に印刷目的として利用されていたPDFを、長期保存用に特化させたもの。PDF/Aは特に欧州を中心に使われており、対応するソフトウェアも欧州製のものが多い。現在、PDF/A-1(ISO19005-1)が主流だが、PDF/A-2もISOで策定中である。
PDF/E (2008年策定 - ISO 24517)
PDFを元に策定された、エンジニアリングワークフローにおける使用を目的としたファイル形式。ISO24517として標準規格化されている。知的権利の安全な配布やCADデータなどの複雑な3次元データなどをPDFに組み込むことを目標にしている。
PDF/H
ISO未策定。ヘルスケアに関するデータを交換、保存するのを目的としたファイル。
PDF/UA (2012年策定 - ISO 14289-1)
ユニバーサルアクセスへの対応を目的としたファイル形式。視力や運動能力に障害のある人にも利用できるように特化させたもの。ISO 14289-1:2012 (PDF/UA) が2012年8月に出版された。
PDF/VT (2010年策定 - ISO 16612-2)
可変データやトランザクション文書を扱うのを目的としたファイル。
2010年8月にISO より ISO 16612-2 として出版された。
PAdES
ISO32000-2に含まれる予定。PDF文書の長期保管を目的としたPDFの拡張。欧州電気通信標準化機構 (ETSI) により策定ならびに公開され、ISO32000-2に反映される予定。

PDF 1.7

PDF 1.7の仕様書の最終版は 2008年1月に ISO Technical Committee 171にて採択され,2008年7月1日にISO 32000-1:2008 Document management – Portable document format – Part 1: PDF 1.7として公開された。

ISO 32000-1:2008 はPDFの機能を全て定義した初の規格である。それ以前にISO PDF規格になったもの (PDF/A, PDF/X, 等) は特定分野に適用される物である。ISO 32000-1はAdobe PDF仕様1.0から1.6で定められた物を網羅しているが、以前のバージョンの一部の機能はアドビにより削除されており、PDF 1.7についても同様である。

ISO 32000-1のドキュメントはアドビのPDF Reference, sixth edition, Adobe Portable Document Format version 1.7, November 2006をベースにしており、ISO Technical Committee 171 (ISO/TC 171), Document management application, Subcommittee SC 2, Application issuesによるファストトラック (Fast-track procedure) 制度により審査された。

ISO PDF 規格の要約 (abstract) には以下のように記述されている。:

ISO 32000-1:2008 は電子文書のユーザーが交換と閲覧を行うにあたり、作成した環境に依存することなく再現し、閲覧および印刷するための形式を定義する。その目的とするところはPDFファイルを作成するソフトウェア、既存のPDFファイルを閲覧およびコンテンツを画面に表示するよう解釈しユーザーと対話するソフトウェア、またその他の用途のためにPDFファイルを読み書きする各種製品の開発者に供するものである。

ISO 32000-1 の中にはアドビのプロプライエタリな仕様の部分がいくつか引用規格とされており、(Adobe Acrobat JavaScriptやXFA (XML Forms Architecture) など) ISO 32000-1に準拠するためにはこれらが不可欠となっている。

PDF 2.0

新しいバージョンのPDF規格はISO/CD 32000-2 - Document management – Portable document format – Part 2: PDF 2.0として策定され、2017年7月に公開された。

新機能

新機能としては以下のようなものが紹介されている。

  • 暗号化されたドキュメントを非暗号化されたドキュメントでラップできる。すなわち、だれにでも読める表紙ページが付いたセキュアなPDFドキュメントを作成できる
  • リッチメディア注釈の導入。地理情報やPRC(3Dフォーマット)のサポート
  • PDF/A-3にて最初に導入された、添付ファイルについての機械解釈可能なメタデータが付加できるようになった
  • タグ付きPDFに関する14.8章の完全な作り直し。タグセットの見直し、名前空間の導入、MathMLのサポートと発音ヒントの導入など。アクセシビリティの向上に伴いテキスト抽出や軽量デバイス向けのHTMLにコンバートするのが容易になるなど。
  • デジタル署名が最新の規格に適合するようアップデートされた。ユーザーにデジタル署名されたPDFの検証が可能になった。
  • 現時点でのスタンダードであるAES-256暗号化のサポート
拡張された機能

既存の仕様から改良されたものは以下の通り。

  • 注釈について透過、合成モード属性の追加
  • Polygon/Polyline real paths
  • 256bit AES暗号化
  • ECC 準拠の証明書
  • Unicode準拠のパスワード
  • Document requirement extensions
  • ページ単位、および外部から指定可能な出力インテント
  • 添付ファイルのサムネイル
  • 画像、フォームのXObjects に対するMeasurement & Point Data
  • ビュワーに対し印刷倍率の設定を強制できる
  • GoToDp および RichMediaExecute アクション
  • GoTo および GoToR を拡張して一部の構造化エレメントへのリンクが可能に
  • 署名フィールドのロックと署名シード値の拡張
  • 三次元寸法および3D表示条件の拡張(透過を含む)
  • 構造化エレメントの追加。DocumentFragment, Hn(レベル6以上の見出し),Title, FENote, SUb, Em, Strong,Artifact の構造エレメント
  • 出力インテントの拡張 (MixingHints および SpectralData)
廃止された機能
  • XFA
  • ムービー、サウンド、(PDF/Xの)TrapNet 注釈(リッチメディア注釈により代替)
  • ムービー、サウンド アクション
  • Info辞書
  • DRMについての制限
  • ProcSet(PDFページ記述演算子)
  • ファイル仕様とLaunch アクションに関するOS依存の仕様部分
  • XObjectsとフォント の名前
  • 合成モードのアレイ(配列)
  • 代替プレゼンテーション
  • Open prepress interface (OPI)
  • CharSet (For Type 1 fonts)
  • CIDSet (for CID fonts)
  • Prepress viewer preferences (ViewArea, ViewClip, etc.)
  • NeedAppearances (フォームの見え方についての指定)
  • adbe.pkcs7.sha1 および adbe.x509.rsa_sha1 署名ハンドラ
  • FDF ファイルの暗号化
  • Suspects flag in MarkInfo dictionary
  • UR signature


PDF 2.0の提案は2009年にISOに受理された。(ISO/NP 32000-2) TC 171 SC 2 WG 8 委員会はドキュメントの作成のほか、寄せられる多数の技術的、編集面のコメントへの対応、各種課題ごとに関心を寄せる組織たちで構成されるアドホックな下位委員会8つの運営などのために活動している。 規格の開発は"照会段階"/"国際規格案"の段階まで進んでいたが、ドキュメントの整備に本プロジェクトはキャンセルされ、新しいプロジェクトが立ち上げられた。2014年中に2つめの"委員会原案"が提出される予定である。

AdobeはAdobe Extension Level 5Adobe Extension Level 3 をISO 32000-2 に盛り込もうとしたが、そのうち一部の機能だけが採用されている。

ISO委員会のPDF 2.0開発の目標には、機能の進化的な拡張のほかに、PDF言語のリファインや現在使われなくなっている機能(例:フォームのXObject names等)の廃止による、またアドビのプロプライエタリな仕様(例: Adobe JavaScript、リッチテキスト等)の標準化が含まれている。

PDF 2.0ではアドビの XML Forms Architecture 3.1 を参照しようとしており、2011年にISOの委員会はアドビにXFA仕様書の提出を求め、またXFA仕様を安定化させるよう求めている。

ISO TC 171 SC 2 WG 8

(TCは「専門委員会」、SCは「分化委員会」、WGは「作業グループ」の略。ISOの組織については国際標準化機構を参照)

2008年にISO標準を策定するために設置された。作業グループ8は年に二度会合を開き、10カ国以上より参加者が集まる。ISO 32000の委員会のミーティングは認定された主題専門家に対しオープンとされている。関心を持つ団体は、ISOの会員団体に参加について問い合わせる。

現在のプロジェクトのリーダーシップはCherie Ekholm(マイクロソフト) 、副リーダーはDuff Johnson(独立コンサルタント)が担当している。 以前のリーダーは 2008年より2011までJames King 博士(アドビシステムズ)が担当した。ISO幹事はBetsy Fanning (AIIM)。

技術的な基盤

PDFの読み書きを行うソフトウェアは誰でも開発することができ、アドビシステムズにライセンス料などを支払う必要はない。アドビはPDFについて特許を保有しているが、仕様は無料で自由に参照することが出来る。

PDFは3つの技術的な柱から成り立っている。

  • レイアウトとグラフィックを生成するためのPostScriptページ記述言語のサブセット
  • 異環境での表示のためのフォントの埋め込み、代替の仕組み
  • 文書、グラフィック、添付ファイルを単一ファイルにまとめて圧縮する構造化ストレージ

PDFとPostScript

PDFは、アドビシステムズが開発し印刷業界の標準として普及していたページ記述言語PostScriptを元に策定された。

PDFでは、コンピュータ上でのデータ交換のために次の機能が追加されている。

  • ファイルに含まれる各ページへのランダムアクセスに対応。この機能により、必要なページをすばやく表示できる。PostScriptでは前のページの処理結果がないと現在ページの描画が出来ない場合があるが、PDFでは各ページで完結したコンテンツにされる。
  • フォントの埋め込み
  • 文書情報など、本文以外の情報を入力できる。PDFではしおり・リンク・注釈なども本文とは別の情報として扱われる
  • 透明の概念(後にバージョン1.4で追加)

PDFには、PostScriptの持っているプログラミング言語としての機能はなく、HTMLなどと同様のデータ記述言語となっている。 たとえばPostScriptのifloopといったプログラム用命令は取り除かれている。一方linetoなどは残されている。 これはファイルを開いた場合にエラーが発生する可能性を小さくし信頼性を高めるためという事と同時に、PostScriptが持つ特徴の一つである、インタープリタによる実行環境への依存性を極力排除していく方向性からである。

このように元々PDFはPostScriptから発展・派生したという経緯を持つため、PostScriptとPDFは似た特性を持っており、相互の変換は比較的容易である。実際、Acrobatに含まれるDistillerでは、各種アプリケーションのデータをいったんPostScriptファイルに変換(WindowsやMacintoshではプリンタードライバを経由する形で行われる)し、それを元にPDFを生成している。しかし、PDFを作成するには、必ずしもPostScriptを経由する必要はなく、例えばGDI経由で直接PDFを作成することも可能であり、実際にそういった形で動作(GDI→PDF)する製品は多数存在する(「いきなりPDF」もこのタイプである)。

旧バージョンのQuark XPressなどからPDFファイルを作成するには、PostScriptファイルを生成したうえで"Distiller"というAdobe Acrobatに添付のソフトを使ってPDFファイルに変換するのが一般的である。また、Adobe InDesign、Illustrator、PhotoshopやQuark XPress(バージョン6以降)を使うと、Acrobatなどは使わずに直接PDFファイルを作成できる。

技術概要

PDFドキュメントは1以上のページで構成され、各ページにはテキスト画像図形が含まれる。

PDFファイルの生成には、アドビシステムズ社純正の「Adobe Acrobat」やサードパーティー製品を利用する方法がもっとも基礎的である。さらに、クラウド形態などによりサーバサイドでPDFファイルを作成するシステムや、PDFファイル生成とは異なる主目的をもつソフトウエアが PDFファイルを生成する補助機能を搭載している場合もある。

PDFファイルの表示や印刷は、第一にAdobe Readerなどの専用のビューアーアプリケーションを用いる方法がある。ウェブ上で公開されているPDFファイルについては、パソコンのウェブブラウザ上で閲覧できることがある。当初はAdobe Readerのプラグインを用いていたが、現在Google ChromeMozilla FirefoxMicrosoft Edgeなど、PDF表示機能を内蔵する製品も登場している。しかし、これらの製品でも、スマートフォン向けでは、PDF表示機能が除外されている。

PDFの仕様は、ISOで標準化される以前からアドビシステムズから公開されてきている。そのため、アドビシステムズ以外のさまざまな企業・団体や有志が、PDF関連のソフトウェアを開発・公開しており、オープンソースソフトウェアフリーウェアも数多い。

ファイル構造

PDFファイルはCOS ("Carousel" Object Structure) のサブセットである。COSのツリー構造は以下の8種のオブジェクトで構成される。

  • ブーリアン値
  • 数値
  • 文字列
  • 名前
  • 配列: オブジェクトに順序を与えた集合
  • 辞書: オブジェクトに名前を与えた集合
  • ストリーム: 大きなデータに使われる
  • ヌルオブジェクト

オブジェクトはobject numbergeneration bumberで番号付けされ、xref table表が各オブジェクトのファイル先頭からのオフセットを記述する。

この利点はファイル内のランダムアクセスを容易にすることで、またファイルの変更があった際に変更点を追記するだけでファイル全体の書き直しを行わなくてよくなる。 PDFのデータ配置は リニア(最適化)とノンリニア(最適化なし)の2種類がある。最適化なしは、PDFの変更箇所がファイル末尾に追記された状態であり、デメリットはファイル全体をダウンロードしてからでなければファイルの表示内容を確定できないことである。最適化された場合は、末尾にあった変更点が各ページに適用されて、Webで表示させる場合などに好きなページから表示させられるメリットがある。

イメージモデル

PDF内の画像の記述方法はPostScriptに近く、相違箇所は透明の有無である。透明はPDF 1.4で追加された。

ベクター画像

ベクター画像はパスで記述された物で、直線、方形、ベジエ曲線で構成される。 図形を記述するだけでなく、文字のアウトラインを記述する場合もある。 パスはストローク、塗りつぶし、クリッピング(切り抜き)に使われる。ストロークと塗りつぶしは自由な色、模様を指定できる。 模様はタイリング、色なしのタイリング、シェーディングを指定できる。

ラスター画像

ラスターイメージ(Image XObjectsと呼称)は、PDF内では辞書と、関連づけられたストリームで表現される。辞書には画像のプロパティが記述され、ストリームにはイメージデータが記述される。画像は複数の圧縮方式でフィルターされる。サポートされるフィルターは以下のものがあり、用途に応じて画質とサイズのバランスを選ぶことができる。

  • ASCII85Decode ストリームをASCIIの7ビットで表現するもの
  • ASCIIHexDecode ASCII85Decodeに近いがよりコンパクトになる
  • FlateDecode zlib/deflate(いわゆるgzip形式。zipではないので注意)アルゴリズムで圧縮するもの。; PDF 1.2より実装
  • LZWDecode LZWアルゴリズムで圧縮するもの。;
  • RunLengthDecode ランレングスアルゴリズムによるシンプルな圧縮
  • DCTDecode JPEGに採用された 非可逆圧縮
  • CCITTFaxDecode CCITT (ITU-T) faxで規定された 可逆 2値 (黒/白)圧縮。Group3とGroup 4がある
  • JBIG2Decode JBIG2標準で定義された黒白二値の形式。可逆、非可逆が選べる。PDF 1.4より実装
  • JPXDecode JPEG 2000標準で定義された形式。可逆、非可逆が選べる。PDF 1.5より実装

テキスト

テキストはPDF内のコンテント ストリーム内でテキスト エレメントとして記述される。テキストエレメントはどの文字がどの座標に表示されるかを定義し、どのフォントとエンコーディングを使うかも記述する。

フォント

フォントオブジェクトは、タイプフェースを記述する。どのフォントを使用するか記述するほかに、フォントファイルの埋め込みもできる。 埋め込めるフォントはType1、TrueType、OpenTypeがある。

標準Type1フォント(標準14書体)

以下の14書体については、ソフトウェアは必ず装備するか、同じ寸法の代替フォントを装備しなければならない。ソフトウェアは以下のフォントの寸法について情報を保持し、もしPDFに埋め込まれていない場合は同じ寸法の代替フォントで表示する。

  • Times (v3) (in regular, italic, bold, and bold italic)
  • Courier (in regular, oblique, bold and bold oblique)
  • Helvetica (v3) (in regular, oblique, bold and bold oblique)
  • Symbol
  • Zapf Dingbats
フォントの埋め込みの注意

電子ドキュメントを正しく表示するためには、フォントが正しく設定されている必要がある。一般に、ドキュメント作成時に使用されているフォントがインストールされていないコンピュータでは、ドキュメントを正しく表示・印刷できない。例えばヒラギノフォントを使って作成したドキュメントは、このフォントがインストールされていないコンピュータでは代替の日本語フォントで表示する必要がある。さらに、日本語フォントがインストールされていないコンピュータではエラーや文字化けが発生し、正しく表示できない。

PDFのドキュメントでは、使用しているフォントを埋め込むことで、そのフォントがインストールされていないコンピュータでも正しく表示・印刷できる。フォントを埋め込む方法は2つあり、当該フォントに含まれているすべてのグリフ(字形)を埋め込む方法と、文章に使用されているグリフのみを埋め込む方法である。これらの選択は、PDFを作成する際に行う。フォントを埋め込んで作成したPDFの日本語ドキュメントは、日本語フォントがインストールされていないコンピュータでも正しく表示できる。

ただし、フォントを埋め込んだPDFファイルはファイルサイズが大きくなるという問題がある。また、フォントを埋め込む場合は、フォントのライセンスにも注意する必要がある。

エンコーディング

テキストストリーム内では、文字は文字コード(番号)によって記述される。WinAnsi、MacRomanのほか東アジアの各種言語のエンコーディングが定義されているほかに、フォント自身に独自のエンコーディングを持つことも出来る。 基礎がType1フォントを前提に作られたので、TrueTypeフォントなどを記述する場合は、非常に複雑な記述になる。

日本語のエンコード

文字コードについては、全ての文字列が独自のルールで英数字にエンコードされる。英語文書の場合はある程度解読できるが、多バイト文字になると非常に複雑なルールでエンコードしなければならない。

それで得られるメリットは、処理系にかかわらず文字を正確に区別できることで、例えばJIS90形式の文字とJIS2004形式の文字はJIS、Unicode上では同じ文字コードでありながら字形が異なる文字があり、普通の処理系ではどちらかのフォントしか表示できないが、PDF上では一緒に記述できることが挙げられる。

しかしながら例えばWindows 2000とWindows Vista間ではMS明朝、MSゴシックのフォントのバージョンは異なり、フォントを埋め込まないようにPDFを作成すると、片方の環境では文字が全面的に文字化けするケースがある。

また、フォントが埋め込ま

・・・・・・・・・・・・・・・・・・
出典:wikipedia
2018/02/13 07:15

HAPPY Wikipedia

あなたの考える「Portable_Document…」の意味を投稿しよう
「Portable_Document_Format」のコンテンツはまだ投稿されていません。
全部読む・投稿 

Portable_Document_Formatスレッド一覧

・・・・・・・・・・・・・・・・・・
「Portable_Document_Format」のスレッドを作成する
Portable_Document_Formatの」
友達を探す
掲示板を探す
このページ
友達に教える
URLをコピー

注目のキーワード

錦織圭/北島康介/2014_FIFAワールドカップ・アジア予選/サッカー日本女子代表/消費税/東京スカイツリー/ダルビッシュ有/イチロー/香川真司/野田内閣/復興庁/石川遼/HKT48/AKB48/ワールド・ベースボール・クラシック日本代表/黒田博樹/尖閣諸島/バレンタインデー/ONE_PIECE

キーワードで探す

 
友達を探す
掲示板を探す
無料コミックを探す
占い・診断
着メロを探す
GAMEを探す
デコメを探す
きせかえツールを探す
FLASH待ち受けを探す
ハッピーWiki
ハッピーメール
ハッピーランド
HAPPY NEWS
2010Happy Mail