ファイル形式識別の仕組み
すべてのファイルは「マジックナンバー」またはファイルシグネチャと呼ばれる固有のバイト列で始まります。PDFファイルは%PDF(16進数:25 50 44 46)で始まり、JPEG画像はFF D8 FFで始まり、ZIPアーカイブはPK(50 4B)で始まります。このツールは、ファイルの拡張子に関係なく、これらの先頭バイトを読み取って実際のファイル形式を判定します。
解析はすべてブラウザ内で行われ、ファイルはサーバーにアップロードされません。識別に必要な最初の64バイトのみを読み取るため、大きなファイルでも瞬時に検出できます。このツールは50種類以上の既知のファイルシグネチャと照合します。
ファイル形式を識別する理由
ファイル拡張子は変更、削除、または破損する可能性があります。「document.pdf」という名前のファイルが実際には画像や実行ファイルかもしれません。メールの添付ファイル、不明なソースからのダウンロード、拡張子のないファイルは、開く前に形式を確認することで安全性が高まります。
開発者やシステム管理者は、アップロードの検証、偽装されたマルウェアの検出、開けないファイルのトラブルシューティングに形式識別を使用します。正確なMIMEタイプを知ることで、適切なアプリケーションや変換ツールを選択できます。
対応形式
| カテゴリ | 検出可能な形式 |
|---|---|
| ドキュメント | PDF、DOC、DOCX、XLS、XLSX、PPT、PPTX、RTF、ODT |
| 画像 | JPEG、PNG、GIF、BMP、TIFF、WebP、ICO、SVG |
| 音声 | MP3、WAV、FLAC、OGG、AAC、M4A |
| 動画 | MP4、AVI、MKV、MOV、WebM、FLV |
| アーカイブ | ZIP、RAR、7Z、TAR、GZIP、BZIP2、XZ |
主な機能
- ファイルシグネチャ(マジックバイト)を読み取り即座に検出
- 全カテゴリで50種類以上の一般的なファイル形式を識別
- 拡張子の不一致を検出し、正しい拡張子を提案
- Web開発やプログラミング用にMIMEタイプを表示
- ブラウザベースの解析—ファイルはデバイスから離れません
一般的な使用例
ダウンロードしたファイルを開く前に確認できます。PDFドキュメントと称するファイルが実際には実行ファイルかもしれません。マジックバイトをチェックすることで、ファイル名や拡張子に関係なく真の形式が明らかになります。
拡張子が欠落または不正なファイルを復元できます。ファイルが拡張子を失ったり、誤って名前が変更されたりした場合、このツールで識別して正しい拡張子を復元し、適切なアプリケーションで開くことができます。
開発者はサーバー側でマジックバイトをチェックしてファイルアップロードを検証します。このツールは検証に使用されるシグネチャのテストと理解に役立ちます。システム管理者は不審なファイルを実行せずに調査できます。
関連ツール
- 画像DPIチェッカー — 印刷用の画像解像度を分析
- 画像EXIFビューア — 写真のメタデータとカメラ設定を表示
- アーカイブコンバーター — アーカイブ形式間の変換
- ZIP展開 — ZIPアーカイブをオンラインで解凍