A coleção é a menor das suas preocupações, o que você precisa pensar é no conjunto de caracteres para a coluna/tabela/banco de dados. A ordenação (regras que regem como os dados são comparados e classificado ) é apenas um corolário disso.
MySQL suporta vários conjuntos de caracteres Unicode,
utf8
e utf8mb4
sendo o mais interessante. utf8
suporta caracteres Unicode no BMP
, ou seja, um subconjunto de todos os Unicode. utf8mb4
, disponível desde o MySQL 5.5.3, suporta todos de Unicode. A coleção para ser usado com qualquer uma das codificações Unicode é provavelmente
xxx_general_ci
ou xxx_unicode_ci
. O primeiro é um algoritmo geral de classificação e comparação independente do idioma, o último é um mais completo algoritmo independente de linguagem que suporta mais recursos Unicode (por exemplo, tratando "ß" e "ss" como equivalentes), mas, portanto, também é mais lento. Consulte https://dev.mysql.com/ doc/refman/5.5/en/charset-unicode-sets.html .