ファイル形式識別

マジックバイト解析で不明なファイル形式をオンラインで識別。拡張子に関係なく真のファイル形式を検出。MIMEタイプ、正しい拡張子、ファイルシグネチャを確認できます。

FILE

tool.page.dragDrop

tool.formatIdentifier.anyFile

tool.trust.fasttool.trust.securetool.trust.noSignup

ファイル形式識別の仕組み

すべてのファイルは「マジックナンバー」またはファイルシグネチャと呼ばれる固有のバイト列で始まります。PDFファイルは%PDF(16進数:25 50 44 46)で始まり、JPEG画像はFF D8 FFで始まり、ZIPアーカイブはPK(50 4B)で始まります。このツールは、ファイルの拡張子に関係なく、これらの先頭バイトを読み取って実際のファイル形式を判定します。

解析はすべてブラウザ内で行われ、ファイルはサーバーにアップロードされません。識別に必要な最初の64バイトのみを読み取るため、大きなファイルでも瞬時に検出できます。このツールは50種類以上の既知のファイルシグネチャと照合します。

ファイル形式を識別する理由

ファイル拡張子は変更、削除、または破損する可能性があります。「document.pdf」という名前のファイルが実際には画像や実行ファイルかもしれません。メールの添付ファイル、不明なソースからのダウンロード、拡張子のないファイルは、開く前に形式を確認することで安全性が高まります。

開発者やシステム管理者は、アップロードの検証、偽装されたマルウェアの検出、開けないファイルのトラブルシューティングに形式識別を使用します。正確なMIMEタイプを知ることで、適切なアプリケーションや変換ツールを選択できます。

対応形式

カテゴリ検出可能な形式
ドキュメントPDF、DOC、DOCX、XLS、XLSX、PPT、PPTX、RTF、ODT
画像JPEG、PNG、GIF、BMP、TIFF、WebP、ICO、SVG
音声MP3、WAV、FLAC、OGG、AAC、M4A
動画MP4、AVI、MKV、MOV、WebM、FLV
アーカイブZIP、RAR、7Z、TAR、GZIP、BZIP2、XZ

主な機能

  • ファイルシグネチャ(マジックバイト)を読み取り即座に検出
  • 全カテゴリで50種類以上の一般的なファイル形式を識別
  • 拡張子の不一致を検出し、正しい拡張子を提案
  • Web開発やプログラミング用にMIMEタイプを表示
  • ブラウザベースの解析—ファイルはデバイスから離れません

一般的な使用例

ダウンロードしたファイルを開く前に確認できます。PDFドキュメントと称するファイルが実際には実行ファイルかもしれません。マジックバイトをチェックすることで、ファイル名や拡張子に関係なく真の形式が明らかになります。

拡張子が欠落または不正なファイルを復元できます。ファイルが拡張子を失ったり、誤って名前が変更されたりした場合、このツールで識別して正しい拡張子を復元し、適切なアプリケーションで開くことができます。

開発者はサーバー側でマジックバイトをチェックしてファイルアップロードを検証します。このツールは検証に使用されるシグネチャのテストと理解に役立ちます。システム管理者は不審なファイルを実行せずに調査できます。

関連ツール

ファイル形式識別FAQ

マジックバイトとは何ですか?

マジックバイト(ファイルシグネチャとも呼ばれます)は、ファイルの先頭にある特定のバイト列で、その形式を識別します。例えば、すべてのJPEGファイルはバイトFF D8 FFで始まり、すべてのPDFファイルは%PDF(16進数:25 50 44 46)で始まります。これにより、ファイル拡張子に関係なく確実な形式検出が可能です。

拡張子のないファイルを識別できますか?

はい、まさにこのツールの目的です。マジックバイトはファイル名ではなく、ファイル自体に埋め込まれています。拡張子の有無に関係なくファイルをアップロードすれば、ツールがファイルの内容に基づいて実際の形式を検出します。

なぜファイルが「ZIPアーカイブ / Office Open XML」と表示されるのですか?

最新のOfficeドキュメント(DOCX、XLSX、PPTX)は実際にはXMLファイルを含むZIPアーカイブです。同じマジックバイト(PKまたは50 4B)を共有しています。これらを区別するには、アーカイブの内容を調べる必要があります。ツールは正確性のために両方の可能性を表示します。

ファイルはサーバーにアップロードされますか?

いいえ。ファイル解析はJavaScriptを使用してブラウザ内で完全に行われます。シグネチャ検出に必要な最初の64バイトのみがローカルで読み取られます。ファイルがデバイスから離れることはありません。ツール改善のため、検出された形式に関する匿名の分析データのみを送信しています。

形式が検出されない場合はどうすればよいですか?

ツールが「不明な形式」と表示する場合、ファイルシグネチャが50種類以上の既知の形式データベースと一致しないことを意味します。ツールは先頭バイトを表示するので、手動でシグネチャを調査できます。一般的でない形式やプロプライエタリな形式は認識されない場合があります。

このツールでファイルが安全かどうか検出できますか?

このツールはファイル形式を識別するもので、安全性を判断するものではありません。「image.jpg」が実際には実行ファイル(EXE)であることを明らかにできますが、これは警戒すべきサインです。ただし、正しく識別された形式でもファイルの安全性は保証されません—正規の形式内に悪意のあるコンテンツが存在する可能性があります。ダウンロードしたファイルは必ずウイルス対策ソフトでスキャンしてください。

File Format Identifier | File Converter Lab