5.書類の電子化
5-4.データ容量 (旧「ファイリングの部屋」アーカイブ)

ファイリングの部屋
HOMEへ

 

これまで hi-ho.ne.jp で公開していた「ファイリングの部屋」を、この新しいドメイン(filingroom..jp)にもコピーしました。不要と思われるページは削除していますが、内容はそのままです。
従来のアドレスにも、当面は残しておきますが、できるだけこちらを利用していただければ幸いです。

 

書類をスキャニングしてイメージファイルとすると、ファイルはどの程度の記憶容量が必要なのでしょうか。これはデータの保存形式や圧縮方法だけでなく、書類そのものの状態によっても、大きく変わってきます。
 
基本的なデータサイズ
 

A4の書類を200dpiでスキャニングした時の、取り込まれる画素数は計算することができます。
A4サイズの大きさは、210mm×297mmであり、これをインチで表すと 8.27in×11.7inとなります。200dpiですから画素数は 1654×2339ドットで、387万画素となります。モノクロ2値の画像では、それぞれの画素は1ビット(白か黒、すなわち0か1)で表すことができるため、データ容量は387万ビットとなります。コンピュータでは8ビット=1バイトで表すため、先ほどのデータは484キロバイトとなります。
実際にA4サイズの書類をスキャナーで取り込み、全く圧縮を行わないビットマップ形式(BMP)で保存すると 484KBのサイズとなります。400dpiでは、縦横ともに2倍の画素となるため、ファイルは4倍の大きさとなります。また、グレースケール(通常は16階調)では一つの画素を4ビット、256色カラーは8ビット、フルカラー(1600万色)では24ビットで表すため、データ容量もモノクロ2値の場合のそれぞれ4倍、8倍、24倍必要であり、カラー画像では、データサイズが非常に大きいことが理解できます。

   
データの圧縮(モノクロ画像)
 

圧縮しないデータファイルは非常に大きなサイズとなるため、通常はこれを圧縮できる形式にして保存します。
A4サイズの書類をモノクロ2値でスキャニングし、いろいろな圧縮方法で保存したときのファイルサイズを次に示します。圧縮後のファイルサイズは、書類の状態によっても大きく異なるため、例としてこのホームページのうち、「保存が必要な書類の増加」のページを Internet Explorerで、文字のサイズを「小」として印刷したものと、方眼紙(1mm)を用いました。保存形式は全てTIFF形式です。

原 稿
BMP
Fax G3
(CCITT 3)
Fax G4
(CCITT 4)
LZW
方眼紙
400dpi
1,933KB
606KB
308KB
541KB
200pdi
484KB
224KB
159KB
178KB
ホームページ
400dpi
1,933KB
219KB
100KB
286KB
200dpi
484KB
82KB
52KB
112KB

圧縮によりデータサイズは大きく変わることがわかります。この例ではG4圧縮が最も効率がよく、これが最適のように感じられますが、 画像表示ソフトには対応できないものがありますので、注意が必要です。
また、方眼紙とホームページの値を比べてみると、方眼紙の方が3倍近いファイルサイズとなっています。方眼紙は縦横ともに1mmごとに線が引かれており、全体に白の部分と黒の部分が細かく分散しており、データ圧縮には向いていないためです。
Fax G3とFax G4は、モノクロ2値のみに対応した形式ですが、LZWはグレースケールやカラーにも対応した形式で、適用範囲も大きいため、これらが混在した書類では、LZWを使うこともあります。


この方眼紙のイメージは全体に灰色のようになっていますが、実際は1mmの細かい模様です。
(画像をクリックすると、オリジナルイメージの一部が表示されます。)

   
データの圧縮(カラー画像)
 

カラー原稿の場合は、データサイズが大きくなるために、A4版の原稿を150dpiでスキャニングした場合と同じサイズ(1754t×1240dpi)のイメージデータを利用して、ファイル容量を求めて見ました。

原 稿
BMP
TIFF
(LZW)
GIF
JPEG
高画質
中画質
低画質
書類
フルカラー
6,375KB
385KB
502KB
261KB
174KB
256色
2,128KB
227KB
188KB
写真
フルカラー
6,375KB
3,621KB
341KB
144KB
89KB
256色
2,128KB
1,020KB
999KB

注)JPEG圧縮は、Paint Shop Pro8を用い、高画質は圧縮レベルを20に、中画質は40に、低画質は60に設定した。

カラー画像であるため、モノクロに比べて非常に大きなサイズとなっています。モノクロと同じように400dpiでスキャニングすると、A4の書類1ページだけで数メガの容量をとるため、多くのメモリを消費するだけでなく、メールでの情報交換などにも支障をきたします。

TIFF形式は、可逆圧縮であり元のデータは全て持っているのに対し、JPEGはデータの省略を行っている非可逆圧縮でもあることから、データサイズはかなり小さくすることができます。
元のデータサイズは同じでも、書類と写真では、データサイズが大きく異なっており、イメージデータの状態によって大きく異なることがかわります。
(書類でもスキャニングして得たデータの場合は、背景色の除去やノイズ除去などの処理を行っていない場合には、写真の場合と同程度のサイズになる場合が多いようです。)

  

テストに用いた書類と写真で、書類は第33回総合科学技術会議の配布資料のうち「資料1−5 平成16年度予算案における重点分野等に係る主な施策の位置付け」の2ページ目を利用し、PDFファイルから電子的にイメージファイル化したもので、スキャニングしたときのようにノイズは一切入っていません(もとのPDFファイルは28KBであり、イメージファイルとした場合、非常に大きくなることが分かります。)。写真は私が撮影したもので、太宰治の生家です。

   

 

| Topページ | 0.はじめに | 1.情報の記録 | 2.増加する書類 | 3.作成から廃棄まで |
| 4.書類の整理 | 5.書類の電子化 | 6.電子化書類の活用 |

backnext| 7.電子ファイルとファイリング | 8.LANの活用と問題点 | 9.ファイリング意識の向上 |
| 10.ファイリングを考慮した書類の作成 | 11.マネジメントシステム |
| 12.リスク管理 | 13.ファイリングに関する動き | 14.付録 | 15.編集雑記 |


Updated on 2013/09/28