Пользователь
Сообщения: 121
Благодарности: 14
|
Профиль
|
Отправить PM
| Цитировать
Очевидно, что всегда найдется такой файл, содержимое которого невозможно будет определить. По первым 2-3 байтам тоже не всегда можно узнать тип файла, вообще куча программ создает бинарные файлы с понятной только им структурой, совершенно не заботясь об отличительных особенностях файла, в виде уникальных первых 2-4 байт, так что увы и ах.
Ну а вообще, тебе-то, наверное, нужны только какие-то определенные типы файлов? Вот возьми, например, десять разных *.zip файлов, сравни их в том же WinHex, найди общее, что их объединяет (для zip - это первые 6 байт), это и будет их сигнатурой - отличительной особенностью, по которой ты всегда сможешь их определить. Посмотри, например, первые 6 байтов в файле *.docx, ничего не напоминает? Ну вот, осталось определить сигнатуры всех нужных тебе файлов и дело в шляпе.
|