max3 Ну, самое простое. Что такое обычные

max3
Ну, самое простое. Что такое обычные документы пользователей? DOC, XLS и PPT файлы. Их легко восстановить даже сигнатурным поиском. Проверить работоспособность файла просто - надо определить версию программы, которой он открывается. Т.е. можно вообще втупую использовать последнюю версию пакета MS Office. Если файл открывается - целый. Не открывается - битый. Забудем о том, что DOC'овских формат сто и один...


Алгоритм примитивнейший. Но он работает для 70% файлов 70% пользователей. Фишка в том, что это все бинарные форматы. А теперь представь себе, что надо восстановить HTML, TXT, XML или еще какую-нибудь фигню, которая хранится в plain text. И получается все плохо, т.к. становится неясно - файл битый или он изначально был покореженный!
Вот. Это самые общие соображения.