Ошибка unicode шифрования Python при преобразовании из Python 2 в Python 3

Я нашел код, который хочу включить в свою программу шифрования Python. Он должен шифровать файлы в том же каталоге кода, и я хочу, чтобы он был нацелен на каталог. Но он написан на Python 2, и когда я меняю код, чтобы он соответствовал Python 3, я получаю следующую ошибку:

Traceback (most recent call last):
  File "/home/pi/Desktop/Projects/FyleCript/Dev Files/encryption.py", line 77, in <module>
    encrypt(SHA256.new(password).digest(), str(Tfiles))
  File "/usr/lib/python3/dist-packages/Crypto/Hash/SHA256.py", line 88, in new
    return SHA256Hash().new(data)
  File "/usr/lib/python3/dist-packages/Crypto/Hash/SHA256.py", line 75, in new
    return SHA256Hash(data)
  File "/usr/lib/python3/dist-packages/Crypto/Hash/SHA256.py", line 72, in __init__
    HashAlgo.__init__(self, hashFactory, data)
  File "/usr/lib/python3/dist-packages/Crypto/Hash/hashalgo.py", line 51, in __init__
    self.update(data)
  File "/usr/lib/python3/dist-packages/Crypto/Hash/hashalgo.py", line 69, in update
    return self._hash.update(data)
TypeError: Unicode-objects must be encoded before hashing

Но код отлично работает в Python 2. Я пытался найти похожие вопросы на SO и в Google, но безрезультатно.


Код:

def encrypt(key, filename):
        chunksize = 64 * 1024
        outFile = os.path.join(os.path.dirname(filename), "(encrypted)"+os.path.basename(filename))
        filesize = str(os.path.getsize(filename)).zfill(16)
        IV = ''
 
        for i in range(16):
                IV += chr(random.randint(0, 0xFF))
       
        encryptor = AES.new(key, AES.MODE_CBC, IV)
 
        with open(filename, "rb") as infile:
                with open(outFile, "wb") as outfile:
                        outfile.write(filesize)
                        outfile.write(IV)
                        while True:
                                chunk = infile.read(chunksize)
                               
                                if len(chunk) == 0:
                                        break
 
                                elif len(chunk) % 16 !=0:
                                        chunk += ' ' *  (16 - (len(chunk) % 16))
 
                                outfile.write(encryptor.encrypt(chunk))
 
 
def decrypt(key, filename):
        outFile = os.path.join(os.path.dirname(filename), os.path.basename(filename[11:]))
        chunksize = 64 * 1024
        with open(filename, "rb") as infile:
                filesize = infile.read(16)
                IV = infile.read(16)
 
                decryptor = AES.new(key, AES.MODE_CBC, IV)
               
                with open(outFile, "wb") as outfile:
                        while True:
                                chunk = infile.read(chunksize)
                                if len(chunk) == 0:
                                        break
 
                                outfile.write(decryptor.decrypt(chunk))
 
                        outfile.truncate(int(filesize))
       
def allfiles():
        allFiles = []
        for root, subfiles, files in os.walk(os.getcwd()):
                for names in files:
                        allFiles.append(os.path.join(root, names))
 
        return allFiles
 
       
choice = input("Do you want to (E)ncrypt or (D)ecrypt? ")
password = input("Enter the password: ") 

encFiles = allfiles()
 
if choice == "E" or 'e':
        for Tfiles in encFiles:
                if os.path.basename(Tfiles).startswith("(encrypted)"):
                        print("%s is already encrypted" %str(Tfiles))
                        pass
 
                elif Tfiles == os.path.join(os.getcwd(), sys.argv[0]):
                        pass
                else:
                        encrypt(SHA256.new(password).digest(), str(Tfiles))
                        print("Done encrypting %s" %str(Tfiles))
                        os.remove(Tfiles)
 
 
elif choice == "D" or 'd':
        filename = input("Enter the filename to decrypt: ")
        if not os.path.exists(filename):
                print("The file does not exist")
                sys.exit()
        elif not filename.startswith("(encrypted)"):
                print("%s is already not encrypted" %filename)
                sys.exit()
        else:
                decrypt(SHA256.new(password).digest(), filename)
                print("Done decrypting %s" %filename)
                os.remove(filename)
 
else:
        print("Please choose a valid command.")
        sys.exit()

Может ли кто-нибудь помочь мне с этой проблемой? Я использовал инструмент Python 2–3, но он все еще не работал.

Кроме того, не могли бы вы решить проблему с каталогом? Это не обязательно, но мне бы этого хотелось.


EDIT: я заменил str на bytes и bytearray, но он возвращает ту же ошибку.


person Trooper Z    schedule 15.07.2018    source источник
comment
Вы пытались использовать bytes вместо str? Строки Python 2 — это просто массивы байтов; Строки Python 3 представляют собой Unicode, и, как говорится в сообщении об ошибке, их необходимо закодировать в байты, прежде чем выполнять двоичные операции, такие как шифрование.   -  person Tom Zych    schedule 15.07.2018
comment
@TomZych Итак, замените все str на bytes.   -  person Trooper Z    schedule 15.07.2018
comment
Ваш пример, похоже, не соответствует минимальным проверяемым критериям.   -  person guidot    schedule 15.07.2018
comment
Модифицированный код с bytes вместо str по-прежнему возвращает ту же ошибку.   -  person Trooper Z    schedule 15.07.2018
comment
У вас также есть неявные строки, например. IV. У меня нет этого пакета на компе, не могу поэкспериментировать. Я рекомендую вам просмотреть документы и убедиться, что вы передаете допустимый тип в encrypt и все остальное, что дает ошибку, а затем работать в обратном направлении, пока все типы не будут правильными. Обратите внимание, что bytes неизменяемо; используйте bytearray, когда вам нужно что-то изменяемое.   -  person Tom Zych    schedule 15.07.2018
comment
@TomZych установите пакет через pip install pycrypto   -  person Trooper Z    schedule 15.07.2018
comment
Нет, спасибо, я не настолько заинтересован в вашей проблеме.   -  person Tom Zych    schedule 15.07.2018
comment
Я бы хотел, чтобы кто-нибудь дал мне простой код или отредактированные части моего кода, потому что замена str на bytes или bytearray не работает.   -  person Trooper Z    schedule 15.07.2018
comment
chr() тоже проблематично. Я бы собрал значения в список без chr() или любого другого преобразования, а затем передал бы этот список в bytes(), когда вы закончите цикл.   -  person tripleee    schedule 15.07.2018
comment
@tripleee можно пример?   -  person Trooper Z    schedule 15.07.2018
comment
Не в том месте, где я могу тестировать код, а ivlist=[]; for i in range(16): ivlist.append(random.randint(0, 0xFF)); IV=bytes(ivlist)... и, очевидно, более элегантно с пониманием списка, чтобы вы могли избежать глупой временной переменной.   -  person tripleee    schedule 15.07.2018
comment
@tripleee Если бы вы могли отредактировать весь мой код и поместить его в раздел ответов, чтобы я мог ответить на этот ответ   -  person Trooper Z    schedule 15.07.2018
comment
Не стесняйтесь ответить на это самостоятельно. Вы можете пометить его как вики сообщества, если вы предпочитаете воздержаться от получения репутации от него, и пометить ответ как усилия сообщества. Очевидно, в любом случае, не стесняйтесь поднимать текст из моих комментариев, если хотите.   -  person tripleee    schedule 15.07.2018
comment
@tripleee Но у меня возникли проблемы с добавлением этого кода в мой код.   -  person Trooper Z    schedule 15.07.2018
comment
Я тоже, на мобильном устройстве далеко от всего с приличной клавиатурой или экраном.   -  person tripleee    schedule 15.07.2018
comment
попробуйте посмотреть строковые методы .decode('utf8') и .encode('utf8') (или, может быть, 'ascii' вместо 'utf8', в зависимости от ваших файлов.   -  person Louic    schedule 15.07.2018
comment
@louic, куда я могу их поместить   -  person Trooper Z    schedule 15.07.2018
comment
SHA256.new (s.encode ('utf8')). дайджест ()   -  person Louic    schedule 16.07.2018


Ответы (1)


Ваша переменная «пароль» представляет собой строку, но SHA256.new ожидает байты (например, чтобы разрешить юникод). Требуемые байты указаны в Crypto. Документация Hash.SHA256.

Решение состоит в том, чтобы закодировать пароль в байтах перед хешированием. Это почти буквально то, что говорит сообщение об ошибке (если вы знаете, что все строки в python 3 являются объектами unicode):

TypeError: Unicode-objects must be encoded before hashing

Решение, например, для кодирования с помощью utf8:

SHA256.new(password.encode('utf8')).digest()
person Louic    schedule 15.07.2018
comment
Это работает, но есть новая ошибка: ValueError: IV must be 16 bytes long - person Trooper Z; 16.07.2018
comment
Пожалуйста, начните новый вопрос, если вы хотите спросить об этом, и убедитесь, что вы предоставили подробную информацию и показали, что вы уже пробовали. - person Louic; 16.07.2018