Sim, está correto. UTF-8 é uma codificação para o conjunto de caracteres Unicode, que suporta praticamente todos os idiomas do mundo.
Acho que a única diferença vem com a classificação de seus resultados, letras diferentes podem vir em uma ordem diferente em outros idiomas (acentos, tremas, etc.). Além disso, comparando
a
para ä
pode se comportar de maneira diferente em outro agrupamento. O
_ci
sufixo significa que a classificação e a comparação acontecem c asse eu insensível. http://www.collation-charts.org/ pode ser do seu interesse.