utf8_turkish_ci
e utf8_romanian_ci
-- como mostrado em http://mysql.rjweb.org/utf8_collations.html
(Além disso, é claro,
utf8_bin
.) Para sua pergunta adicional:você está procurando um "conjunto de caracteres" (não um "agrupamento") que possa representar Emoji e outros caracteres não latinos --
UTF-8
é o único a usar. No MySQL, é utf8mb4
. Os "collations" associados a isso são denominados utf8mb4_...
. Os agrupamentos controlam a ordem e a igualdade, conforme indicado na primeira parte da sua pergunta sobre s
e ş
. CHARACTER SET utf8
do MySQL é um subconjunto de utf8mb4
. Qualquer um pode lidar com todas as "cartas" do mundo. Mas apenas utf8mb4 pode lidar com Emoji e alguns caracteres chineses.