в eclipse у меня есть файл, где где-то это написано:
onclick='obj1.help_open_new_window(fn1(), "/redir/url_name")'
и в меню eclipse Edit-> установить кодировку я вижу это:
Теперь я меняю кодировку на UTF-8, используя то же диалоговое окно, и текст меняется на:
onclick='obj1.help_open_new_window(fn1(),�"/redir/url_name")'
Все, что я знаю, это то, что если бы этого не происходило, то мой сайт работал бы нормально. Почему это происходит и что делать, чтобы этого не допустить?
У меня есть некоторые знания о кодировках: Â и объяснение тайны nbsp Абсолютный минимум Разработчик программного обеспечения Абсолютно, обязательно должен знать о Unicode и наборах символов (без оправданий!) но все же я не понимаю, почему это происходит. Не стесняйтесь переходить на уровень байтов (как хранится файл), просто чтобы объяснить это.
ОБНОВЛЕНИЕ: вот что я понимаю: если файл закодирован в latin-1
, то каждый символ является байтом, как и . it should be
hex(32)
. теперь, когда я конвертирую его в utf-8, он все еще остается hex(32)
, и это определенно . this leads me to believe that in latin-1,
не
hex(32)
, а комбинация двух байтов. Как это возможно?