Почему требуется html lang=en, если мы определяем meta charset=utf-8. Я имею в виду, что мы определили кодировку, так какой смысл в lang?
Что я понимаю из utf-8, так это то, что он содержит в себе символы почти всех языков.
Почему требуется html lang=en, если мы определяем meta charset=utf-8. Я имею в виду, что мы определили кодировку, так какой смысл в lang?
Что я понимаю из utf-8, так это то, что он содержит в себе символы почти всех языков.
Атрибут HTML lang используется для определения языка текстового содержимого в Интернете. Эта информация помогает поисковым системам возвращать результаты для конкретного языка, а также используется программами чтения с экрана, которые переключают языковые профили для обеспечения правильного акцента и произношения. Я добавил ссылку на статью, вы можете прочитать больше:
Вы путаете кодировку с языком.
Юникод (и кодировка UTF-8) может представлять символы почти для всех языков, вы правы, но как их представлять? Шрифты должны знать язык, чтобы отображать каждый символ в родной форме. Один и тот же символ мог быть написан по-разному, в зависимости от языка (обычно речь идет о лигатурах, но и символы могли быть написаны по-разному). Также в старом английском иногда мы хотим, чтобы s
записывалось как f
(без средней строки), но мы хотим писать его как s
, не используя специальный символ (в Unicode есть is для особых целей). Но правила были только для английского языка. В других языках были другие правила.
Но язык определяет множество других частей: как писать числа (с десятичной точкой или запятой? Как писать даты? и т. д.), а также как разбивать строки (слова).
Потом о читалках, а если хотите, то в браузере посмотрите определение слова, или просто в поисковиках.
UTF-8 — это просто кодировка, ее не следует путать с представлением текста.