A coleção é a menor das suas preocupações, o que você precisa pensar é no conjunto de caracteres para a coluna/tabela/banco de dados. A ordenação (regras que regem como os dados são comparados e classificado ) é apenas um corolário disso.
MySQL suporta vários conjuntos de caracteres Unicode,
utf8 e utf8mb4 sendo o mais interessante. utf8 suporta caracteres Unicode no BMP
, ou seja, um subconjunto de todos os Unicode. utf8mb4 , disponível desde o MySQL 5.5.3, suporta todos de Unicode. A coleção para ser usado com qualquer uma das codificações Unicode é provavelmente
xxx_general_ci ou xxx_unicode_ci . O primeiro é um algoritmo geral de classificação e comparação independente do idioma, o último é um mais completo algoritmo independente de linguagem que suporta mais recursos Unicode (por exemplo, tratando "ß" e "ss" como equivalentes), mas, portanto, também é mais lento. Consulte https://dev.mysql.com/ doc/refman/5.5/en/charset-unicode-sets.html .