Криптовалюта Nodejs против хеш-библиотеки Python

Я пытаюсь заставить функцию python и функцию nodejs вычислить один и тот же хэш. Однако похоже, что выводимый двоичный файл отличается между nodejs crypto и python hashlib.

Питон, который я использую:

hash = hashlib.sha512()
hash.update(salt)
hash.update(password.encode('utf8'))
hash.digest()

Узел/coffeescript:

crypto.createHash('sha512').update(salt, 'binary').update(password, 'utf8').digest()

Эти строки должны давать одинаковый результат, но по какой-то причине этого не происходит. Помощь?


person Jon Chu    schedule 20.11.2012    source источник
comment
Не могли бы вы включить результаты, полученные в результате выполнения этих двух примеров, с примерами входных данных?   -  person Dan D.    schedule 20.11.2012
comment
Когда я запускаю точно такие же вещи, я получаю те же результаты, за исключением того, что coffeescript возвращает строку Unicode (очевидно, декодированную Latin-1?), а Python (по крайней мере 3.x) возвращает значение bytes. Итак, я получаю такие вещи, как '\u0006' против '\x06' для третьего символа.   -  person abarnert    schedule 20.11.2012
comment
После тестирования это верно и для Python 2.x.   -  person abarnert    schedule 20.11.2012


Ответы (1)


Кажется, что они дают один и тот же результат, но поскольку digest() узла возвращает строку Unicode, а Python возвращает объект bytes, это может быть не сразу очевидно:

CoffeeScript 1.4.0 на узле 0.8.11:

coffee> salt='abc'
'abc'
coffee> password='def'
'def'
coffee> d = crypto.createHash('sha512').update(salt, 'binary').update(password, 'utf8').digest()
'ã.ñ#èí&ezK=\u0007­»v\u0018\u0006CWEVNAP §\u0003¾*}¶\u001e=9\f+¹~-L1\u001fÜiÖ±&\u0005õ© ç'

Питон 3.3.0:

>>> salt, password=b'abc', 'def'
>>> hash = hashlib.sha512()
>>> hash.update(salt)
>>> hash.update(password.encode('utf8'))
>>> d = hash.digest()
>>> print(d)
b'\xe3.\xf1\x96#\xe8\xed\x9d&\x7fez\x81\x94K=\x07\xad\xbbv\x85\x18\x06\x8e\x88CWEVN\x8dAP\xa0\xa7\x03\xbe*}\x88\xb6\x1e=9\x0c+\xb9~-L1\x1f\xdci\xd6\xb1&\x7f\x05\xf5\x9a\xa9 \xe7'

Выглядит совсем иначе, правда? Но если приглядеться, печатные символы те же самые — этот CWEVN пробег довольно очевиден. И вы можете увидеть еще больше сходства, если расшифруете его как Latin-1…

>>> print(d.decode('latin1'))
ã.ñ#èí&ezK=­»vCWEVNAP §¾*}¶=9
                                   +¹~-L1ÜiÖ±&õ© ç

Совершенно очевидно, что это та же самая строка, просто Node экранирует непечатаемые символы.

И Python 2.7.2:

>>> salt, password='abc', u'def'
>>> hash = hashlib.sha512()
>>> hash.update(salt)
>>> hash.update(password.encode('utf8'))
>>> d = hash.digest()
>>> print(d)
?.?#??&ez??K=??v???CWEVN?AP???*}??=9
                                 +?~-L1?iֱ&? ?
>>> print(d.decode('latin1'))
ã.ñ#èí&ezK=­»vCWEVNAP §¾*}¶=9
                                   +¹~-L1ÜiÖ±&õ© ç

Опять же, та же самая строка.

Учитывая, что мой терминал, локаль C и т. д. - все UTF-8 (это OS X), я понятия не имею, почему CoffeeScript декодирует как Latin-1.

person abarnert    schedule 20.11.2012