лучший набор символов и сопоставление для хранения тегов и URL-адресов в базе данных MySQL

Я загружаю информацию о фотографиях с Flickr на свой сайт. Для каждой фотографии URL, заголовок и теги сохраняются в базе данных MySQL.

Я много читал о наиболее подходящем наборе символов для таких значений, и я нашел его в основном между использованием utf8 или latin1.

Некоторые заголовки и теги содержат такие символы, как авторское право (или аналогичные). Подойдет ли мне набор символов Latin1?


person user2142084    schedule 06.03.2013    source источник


Ответы (2)


Всегда используйте utf-8 везде, в вашей базе данных, текстовом редакторе, метаданных html, заголовках кодировки....

Это единственный совет, который я могу вам дать.

person Sebas    schedule 06.03.2013

Никогда не используйте utf-8 в своей базе данных, если сохраненный текст на 100% состоит из символов ASCII. Раздувание каждого символа с помощью utf-8 может привести к значительному снижению производительности, если текст будет проиндексирован.

person l33t    schedule 21.08.2014
comment
100% ascii звучит так, будто парень потратит несколько часов на отладку чего-то в вашей системе в какой-то момент в следующие несколько лет... - person Sebas; 09.02.2017
comment
Потому что, конечно, должно было быть 100% ascii. - person Sebas; 09.02.2017
comment
Сообщите мне, если вы найдете URL-адрес, содержащий символы, отличные от ASCII. Если в стандарте указано, что разрешены только символы ascii, то хранить их как не-ascii не так уж и умно. - person l33t; 10.02.2017
comment
Но парень упоминает и титулы; если я неправильно понимаю вариант использования, там может храниться что угодно - person Sebas; 10.02.2017
comment
На самом деле зависит от того, сколько рядов у вас будет. Если у вас 20 страниц, влияние на производительность будет несущественным. Однажды у вас может быть URL или тег со специальным символом, и если все ваше приложение основано на Ascii... это может быть плохо. - person Ben; 14.01.2021
comment
Мне интересно, какой тип StackOverFlow используют для своих тегов :) - person l33t; 14.01.2021