Я использую две разные библиотеки для генерации хэша SHA-1 для использования при проверке файлов — более старая версия Crypto++ и класс Digest::SHA1, реализованный Ruby. Хотя я видел и другие случаи несоответствия хэшей, вызванные различиями в кодировке, две библиотеки выдают хэши, которые почти идентичны.
Например, передача файла через каждый процесс приводит к следующим результатам:
Крипто++ 01c15e4f46d8181b984fa2a2c740f8f67130acac
Рубин: eac15e4f46d8181b984fa2a2c740f8f67130acac
Как видите, различаются только первые два символа хеш-строки, и такое поведение повторяется во многих файлах. Я просмотрел исходный код для каждой реализации, и единственное отличие, которое я обнаружил на первый взгляд, заключалось в шестнадцатеричном формате данных, который используется для 160-битного хеширования. Я понятия не имею, как этот шестнадцатеричный код используется в алгоритме, и я подумал, что мне, вероятно, будет быстрее задать вопрос, если кто-то сталкивался с этой проблемой раньше.
Я включил данные из соответствующих библиотек ниже. Я также включил значения из OpenSSL, так как каждая из трех библиотек имеет несколько разные значения.
Крипто++:
digest[0] = 0x67452301L;
digest[1] = 0xEFCDAB89L;
digest[2] = 0x98BADCFEL;
digest[3] = 0x10325476L;
digest[4] = 0xC3D2E1F0L;
Рубин:
context->state[0] = 0x67452301;
context->state[1] = 0xEFCDAB89;
context->state[2] = 0x98BADCFE;
context->state[3] = 0x10325476;
context->state[4] = 0xC3D2E1F0;
OpenSSL:
#define INIT_DATA_h0 0x67452301UL
#define INIT_DATA_h1 0xefcdab89UL
#define INIT_DATA_h2 0x98badcfeUL
#define INIT_DATA_h3 0x10325476UL
#define INIT_DATA_h4 0xc3d2e1f0UL
Кстати, вот код, используемый для генерации хеша в Ruby. У меня нет доступа к исходному коду реализации Crypto++.
File.class_eval do
def self.hash_digest filename, options = {}
opts = {:buffer_length => 1024, :method => :sha1}.update(options)
hash_func = (opts[:method].to_s == 'sha1') ? Digest::SHA1.new : Digest::MD5.new
open(filename, "r") do |f|
while !f.eof
b = f.read
hash_func.update(b)
end
end
hash_func.hexdigest
end
end