Alexey Pechnikov wrote:
> Поддержка юникода оказывается все большей проблемой...

Уникод тут ни при чём. Сортировка букв в определённом языке, а тем более
строк — совершенно отдельная задача.

Прежде всего решение зависит от языка. В разных языках общие буквы могут
иметь разный порядок в алфавите.

Потом, обычно стоит задача сортировки слов или строк, а не только отдельных
букв. Буква «ё» при словарной сортировке занимает ту же позицию, что и «е».
Т.е. слова на «е» и «ё» идут вперемешку.

Если же сортируются многословные строки, то тут правила ещё сложнее.
Игнорируются артикли, всякие «фон» и «де» в именах, игнорируются пробелы и
знаки пунктуации («триединый» идёт перед «три коровы», но после «три
банана»). Отдельно стоит задача сортировки словосочетаний на разных языках.
Если в строке встречаются числа, то порядок зависит от величины этих чисел
(«файл-100» идёт после «файл-22»).

В общем решение полностью зависит от задачи. Где-то может и порядок записи
чисел в римской системе следует учитывать.


-- 
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmas...@lists.debian.org

Ответить