PrizmDoc

新着情報

製品に関する情報をはじめ、ホワイトペーパーやコラム記事、セミナー開催などの
イベント情報といったPrizmDocに関する最新情報をご案内します。

  • コラム

ファイル形式や拡張子とは?代表的なファイル形式についても解説

パソコンにはさまざまなソフトが存在しますが、ソフトは独自の形式でデータを保存するため、開くには各々のファイル形式に対応したソフトやビューアが必要です。

この記事では、そもそもファイル形式とは何か?から代表的なファイル形式、そしてさまざまなファイル形式に対応したおすすめのビューアを紹介します。

ファイル形式とは?

ファイル形式とは、ファイルフォーマットとも呼ばれ、コンピュータなどで利用するファイルがどのような規格(ルール)で記録されているか、を現しており、拡張子(.doc、.jpg、.gifなど)で判別できます。※拡張子については、本記事「ファイル拡張子とは?」で説明します。

ファイル形式には大きく分けて、テキスト形式とバイナリ形式があります。

テキスト形式は文字を格納しているファイル形式であり、テキストエディタで開くと人間が内容を理解することが可能です。これに対してバイナリ形式は人間ではなくコンピュータが理解するための形式であり、バイナリ形式のファイルをテキスト形式で開いても内容を人間が理解することはできません。

ファイルを開くにはファイル形式に対応したソフトが必要

ファイル形式ごとに、データを記録するためのロジックや方式が異なります。例えば、OSやソフトによって、データの構造や表現方法が異なるため、ファイルを開くにはそのファイル形式に対応したソフトが必要です。

さまざまなデータを扱う必要があるビジネスの現場では、その時々に応じて適切なソフトをインストールする必要があり、煩雑に感じる方もいるのではないでしょうか。
複数の形式に対応したソフトを用意すれば、そのような手間は軽減できるでしょう。


さまざまなファイル形式をWebビューアで閲覧可能にする開発ツール【PrizmDoc】はこちら

ファイル拡張子とは?

ファイル形式とともに知っておきたいのがファイル拡張子です。どのようなものなのかを解説します。

ファイルの形式を示す文字列

ファイル拡張子とは、ファイル名の末尾につけられた文字列であり、そのファイルのファイル形式を示すものです。

基本的にファイルには、拡張子を入れずに自由に名前が付けられますが、その状態ではコンピュータがファイル形式の解釈ができず、ファイルを開くことができません。実際に試してみるとわかると思いますが、「.gif」の拡張子を「.txt」に変えて開いてみるとできないことがわかるでしょう。人間も拡張子があれば、どのようなファイルであるか理解しやすいですよね。ファイル名の末尾にファイル形式を示す拡張子を入れることで、人間もコンピュータも容易にそれがどのファイル形式で作られたものなのか判断できるのです。

歴史的な理由から3文字が多い

拡張子として使われる文字列には、3文字のものが多いです。これは、昔のOSのなかには拡張として3文字までの文字列しか使えないという制限があり、その時代に作られた拡張子が多いためです。

現在ではそのような制限があるOSは少なくなりましたが、あまりにも長い拡張子は逆に見づらいため、現在は、短い拡張子がつけられる傾向にあります。

拡張子を変えてもファイル形式は変更されない

注意したいのは、拡張子を変えてもファイル形式は変更されないという点です。
拡張子はあくまでそのファイルのファイル形式が何であるかを示すヒントであって、ファイル形式を決めているわけではありません。このため、拡張子とファイル形式が合っていない場合、正しくファイルが開けない可能性があります。
ファイル形式を変更したい場合は拡張子だけでなく、ファイル形式そのものを変換するようにしましょう。

Windowsでは表示/非表示の変更が可能

Windowsでは拡張子を非表示にすることができます。これは、グラフィカルなOSではファイル形式をアイコンで示すことができるため、拡張子が必ずしも必要ではないということ、そして非表示にすれば画面をすっきりとさせることができるためです。

Windowsにおける拡張子の表示/非表示は、エクスプローラーから、表示→オプション→表示→詳細設定から変更できます。

代表的な拡張子とそのファイル形式

世の中で使われている拡張子にはどのようなものがあるのでしょうか。ここでは代表的なものを解説します。

ドキュメントフォーマット

まずはOffice系のソフトなどで使われるドキュメントフォーマットについて解説します。

・doc, docx, xls, xlsx, ppt, pptx

これらはMicrosoft Officeで使われるファイル形式であり、なじみがある方も多いのではないでしょうか。
doc、docxはWord、xls、xlsxはExcel、ppt、pptxはPowerPointで使われます。

・odt, ods, odp

これらはオープンドキュメント形式と呼ばれるもので、仕様が公開されているISO標準のファイル形式です。
odtがテキスト文書、odsが表計算ファイル、odpがプレゼンテーションファイル用の形式となっています。
これらはMicrosoft OfficeやGoogle Workspaceはもちろん、Office互換のソフトでも幅広くサポートされています。

・rtf

rtfはリッチテキストフォーマット(rich text format)の略であり、Microsoftが定めた文書を保存するためのファイル形式です。
その名の通り、単なる文字データだけのファイルよりも多彩な表現が可能であり、文字の大きさやフォント指定、表や画像の埋め込みなどが可能となっています。
一方、Wordなどのファイル形式に比べると、できることは限られるファイル形式です。

・pdf

pdfはPortable Document Formatの略であり、データを紙に印刷したときの状態をそのまま表示できるのが特徴のファイル形式です。パソコン、タブレット、スマホなどの端末を問わず、同じように表示できる点で重宝されます。
pdfはAcrobat Readerという無料ソフトで表示できるため、相手がどのような環境かわからない場合でも気にせず送ることができます。

・csv

csvはComma-Separated Valuesの略であり、値などをカンマ(,) で区切って書いたテキストファイルを指します。表計算ソフトやデータベースソフトを使ったデータ管理に適したファイル形式であるといえます。
Excelが扱うxls/xlsxに比べ、中身がただのテキストファイルなので開いたり編集したりするのが手軽なのが特徴です。ただ、Excelに比べると、表の色付けやグラフの作成など、できることに限りがあるものとなっています。

画像フォーマット

次は画像フォーマットです。画像フォーマットも様々なファイル形式が存在します。

・tiff, jpg, jp2, gif, png, bmp

これらは一般的に使われる画像のファイル形式です。それぞれ、圧縮/非圧縮の点や、圧縮形式が異なります。画像を扱えるソフトであれば、たいていこれらの形式には対応しているでしょう。

・ras

rasはSUN Rasterフォーマットで保存されたモノクロ画像のファイル形式です。一般的にUNIXで使われています。

・cal

calはGRAPHTEC社のスキャナで読み込んだラスター形式のデータファイルです。

・dib

dibはDevice Independent Bitmapの略であり、DTPの分野で良く使われる画像フォーマットです。本来は、メインメモリ上に画像データを置くための形式をdib、ファイル形式のことをbmpと呼んでいましたが、今ではファイル形式としてもdibが使われます。

・psd

psdはAdobe Photoshopで保存される画像形式です。画像情報だけでなく、レイヤー、解像度などの編集情報が保存されています。

・pct

pctはMacのQuickDrawで使用されるファイル形式です。昔のMac OSでは標準形式とされていました。

・pcx, dcx

pcxはゼットセット社のペイントソフトである「ペイントブラシ」で使用される画像フォーマットです。
dcxはpcxをマルチページファイルにしたファイルの拡張子となります。

・pcd

pcdはPhilipsとKodakが開発した、CDに写真を入れるための「Photo CD」規格で保存された画像ファイルに付く拡張子です。フィルムデータをデジタルデータに変換してCD-ROMに記録することができる点が特徴となっています。

・wmf

wmfはWindows Meta Fileの略であり、ベクター画像を格納しています。Windows標準の画像描画システムであるGDIに対する命令を列挙した形式です。

・emf

emfはwmfを拡張した形式であり、Windows 95で拡張された32ビットGDIの描画命令を記録することができるベクター画像の記録形式のことを指します。

・tga

tgaはTruevision社が開発したラスター画像のファイルフォーマットです。

Webフォーマット

Webブラウザで使われるファイル形式がWebフォーマットです。

・html

htmlはHyperText Markup Languageの略であり、ウェブページを記述するための言語です。
同じファイル形式に対してhtmという拡張子も使われます。

医療画像用フォーマット

医療用の分野で使われる画像フォーマットです。

・dcm

dcmはDigital Imaging and Communications in Medicineが正式名称でありDICOMという標準規格によって定められています。二次元だけでなく三次元画像を含むことがあるのが特徴です。

メールフォーマット

メーラーによって使われるファイルフォーマットです。

・eml

emlはテキスト形式で格納されている点が特徴のファイル形式です。さまざまなメーラーによって広くサポートされています。

・msg

msgはMicrosoft Outlookが使用するファイル形式です。テキスト形式ではなく、バイナリ形式で格納されています。

CADフォーマット

CADとはComputer-Aided Designの略で、コンピュータで設計や製図をおこなう際に使われるものです。

・dgn

dgnはベントレー・システムズのMicroStationで使われるファイル形式です。

・dwg

dwgはAutodesk社のCADソフトである「AutoCAD」における標準的なファイル形式です。

・dxf

dxfはDrawing Exchange Formatの略であり、Autodesk社がAutoCADの異なるバージョン間に互換性を持たせるために策定したファイル形式です。内部仕様が公開されており、多くのCADソフトでサポートされています。

ファイル形式の変換は面倒

基本的にファイル形式は固定のものではなく、変換することができます。
たとえば画像ファイルであれば、Windowsに標準でインストールされているペイントでも、開いて別の形式保存することにより変換することが可能です。
ただ、膨大なファイル形式のなかには、標準でインストールされているソフトでは変換できないものもあり、どのソフトで変換できるかすぐにはわからないものも存在します。
変換できたとしても手間がかかり、面倒に感じることも多いでしょう。

PrizmDocなら50種類以上の多彩なファイル形式に対応

本記事では数多くのファイル形式を紹介し、基本的にファイル形式毎にビューアが必要であるお話をしましたが、実はPrizmDocであれば50種類以上のファイル形式を閲覧することができ、アプリケーションコストを大幅に削減することが可能です。

PrizmDocはお手持ちのWebアプリケーションに組み込んでご利用いただくビューイングエンジンです。各ファイル形式をWebブラウザで標準的にサポートされているSVG形式に変換し、環境を問わず、高精細にさまざまな形式のファイルを閲覧することができます。
また、変換はサーバー側でおこなわれるため、元ファイルを閲覧する端末にダウンロードする必要がなく、セキュリティ面で優れているのも特徴の一つです。元ファイルを編集することなく注釈を入れることも可能なので、チーム内外でのコミュニケーションにも役立ちます。

PrizmDocには無料体験版が用意されておりますので、お気軽にお問い合わせください。


PrizmDocコラム一覧