Мне удалось скопировать необработанные данные с USB-накопителя, который иначе был бы недоступен, в монолитный файл размером около 250 МБ. Где-то в этом блоке байтов находится около 40 документов Word.
Где я могу найти документацию о внутренней структуре документов Word, чтобы я мог анализировать поток байтов, распознавать, где начинается и заканчивается документ Word, и извлекать копию?
Существуют ли какие-либо библиотеки на каком-либо языке программирования, специфичные для этой задачи?
Может ли кто-нибудь предложить уже существующее программное решение этой проблемы?