Victor Wagner wrote:
> Надо было не говорить, а писать. Прислал бы патчик, я б его, глядишь,
> интегрировал.
Патчик-то я прислал, только что-то ответа долго нет.
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmas...@list
Hello!
> Можно, но либо придётся вручную перекодировать данные перед и после вызова
> unac_string_utf16, либо, что лучше, вместо unac_string_utf16 использовать
> unac_char_utf16.
Ради таких перспектив явно не имеет смысла отказываться от привычной utf8.
Собственно, если хранить
данные в utf-16,
Alexey Pechnikov wrote:
>> Для unac_string_utf16 данные должны быть получены sqlite3_value_text16be,
>> а не sqlite3_value_text16.
>
> А в определяемом платформой формате be/le никак нельзя?! Ой не нравится
> мне такой подход.
Можно, но либо придётся вручную перекодировать данные перед и после вы
Alexey Pechnikov wrote:
> Никак не могу решить проблему с буквой "ё" - при сравнении wcsncasecmp
> выкидывает "ё" после всех букв алфавита. Или я что-то не понимаю, или в
> линуксе буква "ё" не обрабатывается корректно.
>
> int sqlite3StrNICmp16(const void *zLeft, const void *zRight, int N){
> c
Hello!
> Почему бы не сделать две реализации и не сравнить простоту и эффективность?
> Sqlite3, как я вижу, предоставляет одинаковый интерфейс независимо от
> внутреннего представления, прозрачно перекодируя на лету. Выбор зависит от
> того, какое представление чаще используется.
Видимо, так и пр
Alexey Pechnikov wrote:
> После ваших подсказок
> появилась мысль, что для utf8 можно сделать локале-независимую, а для
> utf16 - локале-зависимую реализации и выбирать формат хранения данных в
> зависимости от потребностей. Может быть, вы можете дать оценку такому
> варианту?
Почему бы не сделат
Hello!
Никак не могу решить проблему с буквой "ё" - при сравнении wcsncasecmp
выкидывает "ё" после всех
букв алфавита. Или я что-то не понимаю, или в линуксе буква "ё" не
обрабатывается корректно.
int sqlite3StrNICmp16(const void *zLeft, const void *zRight, int N){
const unsigned short *a =
Hello!
> Если нужна посимвольная обработка, определение типа (буква, знак препинания
> и т.п.), преобразование (регистра, убирание акцента,…), то удобнее работать
> с представлением, в котором размер каждого символа одинаков. Иначе всё
> равно каждый символ пришлось бы преобразовывать при извлечен
Alexey Pechnikov wrote:
> Hello!
>
>> Удаление акцента, как и преобразование регистра, и т.п. производится над
>> строкой символов уникода. А UTF-8 — всего лишь представление этой строки
>> в виде последовательности байт.
>
> Извиняюсь за некорректное использование терминов, сейчас вроде понятне
Hello!
> Удаление акцента, как и преобразование регистра, и т.п. производится над
> строкой символов уникода. А UTF-8 — всего лишь представление этой строки в
> виде последовательности байт.
Извиняюсь за некорректное использование терминов, сейчас вроде понятнее
становится, попробую
переформули
Alexey Pechnikov wrote:
> В сообщении от Monday 19 January 2009 14:56:02 Serhiy Storchaka
>> А какие функции нужны?
>
> Удаление акцента для символов utf8.
Удаление акцента, как и преобразование регистра, и т.п. производится над
строкой символов уникода. А UTF-8 — всего лишь представление этой ст
Hello!
В сообщении от Monday 19 January 2009 14:56:02 Serhiy Storchaka написал(а):
> Alexey Pechnikov wrote:
> > В libunicode-0.7v/include/unicode.h есть
> > typedef u_int16_t Uchar;
> >
> > Разве это не utf-16? Плюс предлагаются функции преобразования utf8 <->
> > utf16. Про utf32 в коде не вижу
Alexey Pechnikov wrote:
> В libunicode-0.7v/include/unicode.h есть
> typedef u_int16_t Uchar;
>
> Разве это не utf-16? Плюс предлагаются функции преобразования utf8 <->
> utf16. Про utf32 в коде не вижу даже упоминания.
Странно, в 0.4 использовались по крайней мере 32-битные символы для
внутренне
Hello!
В сообщении от Sunday 18 January 2009 23:43:16 Victor Wagner написал(а):
> > Не понимаю - в линуксе стандарт utf8, но работать с ним нельзя, все нужно
> > конвертировать в utf32 и
>
> Читать внимательнее надо. Выше я писал про наличие стандарных функций
> работы с multibyte charsets.
Да, с
Hello!
В сообщении от Sunday 18 January 2009 22:23:27 Victor Wagner написал(а):
> Еще следует учесть что wide char в Linux - это UCS-4.
> Так что если нужно работать с юникодом с фиксированным размером символа,
> можно использовать стандартные wide char функции. Правда, это
> непереносимо. Во free
Hello!
> В этче есть.
Есть, но версия 0.4 и это притом, что версия 0.7 датируется, если не ошибаюсь,
2000-м годом (на
sf.net).
> >> > Еще вопрос по последней - в ней используется
> >> > utf-16, хотя хотелось бы работать со стандартным для линукса utf-8,
> >>
> >> Есть и UTF-8, и UTF-16, и UTF-
Alexey Pechnikov wrote:
> В сообщении от Sunday 18 January 2009 19:35:08 Serhiy Storchaka
> написал(а):
>> Alexey Pechnikov wrote:
>> > А где в системе библиотека для работы с юникодом? Рекомендованной вами
>> > libunicode в дебиане нет.
>>
>> Как это нет? Пакеты libunicode0 и libunicode-dev.
>
>
Hello!
В сообщении от Sunday 18 January 2009 19:35:08 Serhiy Storchaka написал(а):
> Alexey Pechnikov wrote:
> > А где в системе библиотека для работы с юникодом? Рекомендованной вами
> > libunicode в дебиане нет.
>
> Как это нет? Пакеты libunicode0 и libunicode-dev.
Таких пакетов нет. На хосте с
Alexey Pechnikov wrote:
> А где в системе библиотека для работы с юникодом? Рекомендованной вами
> libunicode в дебиане нет.
Как это нет? Пакеты libunicode0 и libunicode-dev.
> Еще вопрос по последней - в ней используется
> utf-16, хотя хотелось бы работать со стандартным для линукса utf-8,
Ест
Hello!
В сообщении от Friday 16 January 2009 16:33:15 вы написали:
> > На самом деле, самым правильным было бы таскать эти таблицы в
> > исходниках, но при сборке на системах, которые имеют соответствующие
> > функции в libc использовать именно их, а не собственные таблицы.
>
> Я ещё давно то же
Hello!
В сообщении от Saturday 17 January 2009 08:08:54 Murat D. Kadirov написал(а):
> Всё познаётся в сравнении, профиту от ссылок выше в действительности
> мало, но вам хотелось посмотреть на "расцвет", я попытался показать, что
> он был. Сравнивать и оценивать самому на _серьёзном_ уровне у мен
Hello!
В сообщении от Friday 16 January 2009 17:41:23 Jurgen V. Uzbekoff написал(а):
> > P.S. Булгаков, кстати, использовал слово "галстух" - и что, неграмотным
> > его считать? :-) Передает дух времени.
>
> В прошлом году в журнале "Наука и жизнь" была статья
> (http://www.nkj.ru/archive/articles
Hello!
В сообщении от Friday 16 January 2009 19:31:35 Murat D. Kadirov написал(а):
> 17:35 Fri 16 Jan, Alexey Pechnikov wrote:
> > Hello!
> >
> > В сообщении от Friday 16 January 2009 15:32:46 Murat D. Kadirov написал(а):
> > > В редких
> > > случаях единая версия может быть _только_ для самого ис
Hello!
В сообщении от Friday 16 January 2009 19:35:35 Serhiy Storchaka написал(а):
> Alexey Pechnikov wrote:
> > В сообщении от Friday 16 January 2009 16:23:15 Serhiy Storchaka
> >
> > написал(а):
> >> Вот вижу в современном написании ?сёл?, ?запущённый?, ?маркёр?, ?тёмно?
> >> в ?Евгении Онегине?
Hello!
В сообщении от Friday 16 January 2009 18:31:27 Aleksey Cheusov написал(а):
> > P.S. Булгаков, кстати, использовал слово "галстух" - и что,
> > неграмотным его считать? :-) Передает дух времени.
>
> Замечательное чтиво от Корнея Чуковского.
>
> http://vivovoco.rsl.ru/VV/BOOKS/LANG/LANG_1.HTM
Hello!
В сообщении от Friday 16 January 2009 18:23:16 Aleksey Cheusov написал(а):
> > "Не в Афинах ростох, не у философ научихся" - можно и Киевской Руси
> > письменность современным языком переписать, только хреновенько как-то
> > (уж не знаю, как историки это пишут, если что, см. Даниила Заточни
Alexey Pechnikov wrote:
> В сообщении от Friday 16 January 2009 16:23:15 Serhiy Storchaka
> написал(а):
>> Вот вижу в современном написании ?сёл?, ?запущённый?, ?маркёр?, ?тёмно?
>> в ?Евгении Онегине?.
>
> Пушкин справлялся, не переживайте.
И как же? Какая буква (или буквы) стояла в этих словах?
> P.S. Булгаков, кстати, использовал слово "галстух" - и что,
> неграмотным его считать? :-) Передает дух времени.
Замечательное чтиво от Корнея Чуковского.
http://vivovoco.rsl.ru/VV/BOOKS/LANG/LANG_1.HTM
--
Best regards, Aleksey Cheusov.
--
To UNSUBSCRIBE, email to debian-russian-requ...@li
>> > Ссылки на Карамзина считаю некорректными.
>>
>> Карамзин, заметим, использовал букву "Ять" и твердый знак в конце слов,
>> оканчивающихся на согласную. Поэтому пусть те, кто ссылается на
>> Карамзина и пишут в орфографии, принятой во времена Карамзина.
>
> "Не в Афинах ростох, не у философ нау
Hello!
В сообщении от Friday 16 January 2009 15:32:46 Murat D. Kadirov написал(а):
> В редких
> случаях единая версия может быть _только_ для самого историка. И то, если
> у него найдётся мужество быть честным перед самим собой.
Пугачевщина, к примеру, таких эмоций не вызывает, можно изучать исто
Hello!
В сообщении от Friday 16 January 2009 15:55:54 Victor Wagner написал(а):
> > Ссылки на Карамзина считаю некорректными.
>
> Карамзин, заметим, использовал букву "Ять" и твердый знак в конце слов,
> оканчивающихся на согласную. Поэтому пусть те, кто ссылается на
> Карамзина и пишут в орфограф
Hello!
В сообщении от Friday 16 January 2009 16:23:15 Serhiy Storchaka написал(а):
> > Вы таки считаете, что Пушкин использовал букву "ё" при письме?
>
> А что он использовал вместо неё?
>
> Вот вижу в современном написании ?сёл?, ?запущённый?, ?маркёр?, ?тёмно?
> в ?Евгении Онегине?.
Пушкин спра
> Редукция алфавита оправдана -- расширение -- нет.
Бред. Просто не знаю, что тут можно еще сказать...
И это, ничего личного.
--
Best regards, Aleksey Cheusov.
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmas...@lists
Victor Wagner wrote:
> On 2009.01.16 at 11:34:07 +0200, Serhiy Storchaka wrote:
>> Victor Wagner wrote:
>> > Не таскать же за собой собственные таблицы collation sequence.
>> Таскает же тикль за собой собственные таблицы перекодировки.
>
> Одно время он и собственные таблицы таймзон таскал. Слава
Alexander GQ Gerasiov wrote:
> Вы таки считаете, что Пушкин использовал букву "ё" при письме?
А что он использовал вместо неё?
Вот вижу в современном написании ?сёл?, ?запущённый?, ?маркёр?, ?тёмно?
в ?Евгении Онегине?.
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a
Aleksey Cheusov wrote:
> А "звательный" падеж тоже преподают?
Его ещё в 80-х преподавали. Ну что поделаешь, если есть такой падеж в языке.
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmas...@lists.debian.org
>> У нас на Украине другие проблемы, нам впарили вторую букву Г (с
>> хвостиком вверх), там какие-то особенности в произношении мне лично на
>> слух не понятные.
>
> Украинское «ґ» произносится так же, как русское «г». Отличается от
> украинской «г» как «д» от «т» или «к» от «х». Но встречается дей
> Собственно, ё = ударная е
Да вы тут с ума посходили!
Ё - это другая буква!
> и грамотный человек должен правильно
> произнести слово "ежик", без необходимости указывать, что первая буква
> под ударением.
Грамотный человек не должен провоцировать не очень грамотных и
иностранцев, и не вносить пут
Alexey Pechnikov wrote:
> Но, кроме того, полагаю, только когда пропадают
> личные интересы, начинается исследование, а пока что - сплошные эмоции,
> кто хорошо жил, кто плохо, а у кого родственники и вовсе...
Вот «официальная история», которую учат в школе, по которой пишут романы,
снимают фильм
Иван Лох wrote:
> On Fri, Jan 16, 2009 at 12:52:16PM +0200, Serhiy Storchaka wrote:
>> >> Язык меняется. 400 лет назад был другой язык, в котором буква «ё» была
>> >> не нужна.
> Даже если было это бы так, то на подобном же основании позднего появления
> акающих говоров, ставших теперь доминирующим
Hello!
В сообщении от Friday 16 January 2009 14:57:30 Alexander GQ Gerasiov написал(а):
> > Цари это история, а СССР - недавнее прошлое. Вот как сформируется
> > более-менее единая версия событий в России 20-го века, тогда и это
> > станет историей.
>
> OMG!
> Что за детская наивность? "Чем дальше
Hello!
В сообщении от Friday 16 January 2009 14:45:30 Alexander GQ Gerasiov написал(а):
> А я этого не утверждал, это был намек, что подавляющая часть русской
> литературы и уж точно вся классика написана, именно написана именно без
> ё. Зато с ерами и ятями. Так что приводить это в качестве аргум
Hello!
В сообщении от Friday 16 January 2009 14:21:51 Murat D. Kadirov написал(а):
> При чём тут Пушкин? Там автор утверждал о том, что _вся_ русская
> литература написана без буквы "ё". Куда дели Солженицина, Высоцкого,
> Ахматову, Ахмадуллину, Айтматова.. мне продолжить?
Это вообще-то советская
Hello!
В сообщении от Friday 16 January 2009 14:07:11 Dmitry Fedorov написал(а):
> > Изменение алфавита указом главного партийного бонзы не считаю
> > историческим аргументом. Как вам
>
> Бонзам нельзя, а царям можно?
> Пётр I алфавит реформировал лично.
Цари это история, а СССР - недавнее прошло
Hello!
В сообщении от Friday 16 January 2009 14:16:59 Alexander GQ Gerasiov написал(а):
> > > Логично, чтобы в программе для работы с историческими
> > > данными ?Генрих VI? шёл перед ?Генрих IX?.
> >
> > Тогда в списке авторов "Петров" предшествует "Иванов", если Петров
> > доктор наук, а Иванов
16 января 2009 г. 15:28 пользователь Alexey Pechnikov написал:
>
> Изменение алфавита указом главного партийного бонзы не считаю историческим
> аргументом. Как вам
Бонзам нельзя, а царям можно?
Пётр I алфавит реформировал лично.
Alexey Pechnikov wrote:
> Тогда в списке авторов "Петров" предшествует "Иванов", если Петров доктор
> наук, а Иванов - студент? :-) Так можно накуролесить до абсурда.
Ну если так хотите ? можете и такую сортировку сделать.
Не до абсурда, а от задачи.
--
To UNSUBSCRIBE, email to debian-russian-
Покотиленко Костик wrote:
> У нас на Украине другие проблемы, нам впарили вторую букву Г (с
> хвостиком вверх), там какие-то особенности в произношении мне лично на
> слух не понятные.
Украинское «ґ» произносится так же, как русское «г». Отличается от
украинской «г» как «д» от «т» или «к» от «х».
Hello!
В сообщении от Friday 16 January 2009 13:57:37 Serhiy Storchaka написал(а):
> >> В общем решение полностью зависит от задачи. Где-то может и порядок
> >> записи чисел в римской системе следует учитывать.
> >
> > Это что за метод сортировки такой?
>
> Логично, чтобы в программе для работы с
Покотиленко Костик wrote:
> В Птн, 16/01/2009 в 11:12 +0200, Serhiy Storchaka пишет:
>> (?триединый? идёт перед ?три коровы?, но после ?три
>> банана?).
>
> Это как так?
?б? < ?е? < ?к?
>> В общем решение полностью зависит от задачи. Где-то может и порядок
>> записи чисел в римской системе след
В Птн, 16/01/2009 в 12:49 +0200, Serhiy Storchaka пишет:
> Alexander GQ Gerasiov wrote:
> > Ну так есть же правила русского языка - там написано ясно: в детских
> > книгах - везде, в нормальных - по месту, чтобы исключить неправильное
> > прочтение.
>
> Закавыка в том, что если можно употреблять «
Alexey Pechnikov wrote:
> В сообщении от Friday 16 January 2009 12:27:15 Serhiy Storchaka
> написал(а):
>> Alexey Pechnikov wrote:
>> > Посмотрел в википедии, оказывается, буква ё - наследие культа личности
>> > и официально присутствует в руссом языке лишь с 1942 года.
>> Ага, а григорианский кале
Alexander GQ Gerasiov wrote:
> Ну так есть же правила русского языка - там написано ясно: в детских
> книгах - везде, в нормальных - по месту, чтобы исключить неправильное
> прочтение.
Закавыка в том, что если можно употреблять «ё» для исключения неоднозначного
прочтения «ё», то при таких правилах
В Птн, 16/01/2009 в 10:14 +0300, Konstantin Matyukhin пишет:
> 2009/1/16 Иван Лох :
> > P.S. Да и есть-ли в русском языке эта полумифическая буква ё? ;-}
> Ага, есть. Назло некоторым "дизайнёрам".
> Мало вам, что i профукали? Хотите еще и ё в угоду малограмотным лентяям
> под нож пустить? Что ж та
Mikhail Gusarov wrote:
> Twas brillig at 11:43:44 16.01.2009 UTC+02 when storch...@gmail.com did
> gyre and gimble:
> >> Описанная в Unicode Technical Stardard #10. Правда, этот TS не
> >> является частью Unicode Standard.
> SS> Там перечислены алфавиты всех языков, включая мёртвые?
> А что вам
В Птн, 16/01/2009 в 11:12 +0200, Serhiy Storchaka пишет:
> Alexey Pechnikov wrote:
> > Поддержка юникода оказывается все большей проблемой...
>
> Уникод тут ни при чём. Сортировка букв в определённом языке, а тем более
> строк — совершенно отдельная задача.
>
> Прежде всего решение зависит от язы
Mikhail Gusarov wrote:
> Twas brillig at 11:12:53 16.01.2009 UTC+02 when storch...@gmail.com did
> gyre and gimble:
> SS> Уникод тут ни при чём. Сортировка букв в определённом языке, а тем
> SS> более строк — совершенно отдельная задача.
>
> Описанная в Unicode Technical Stardard #10. Правда, эт
Hello!
В сообщении от Friday 16 January 2009 12:27:15 Serhiy Storchaka написал(а):
> Alexey Pechnikov wrote:
> > Посмотрел в википедии, оказывается, буква ё - наследие культа личности и
> > официально присутствует в руссом языке лишь с 1942 года.
>
> Ага, а григорианский календарь — наследие крова
Alexey Pechnikov wrote:
> Так что делать-то? Я отказался от компактного модуля для эскулайт, который
> обеспечивает поддержку юникода, за исключением порядка следования буквы ё,
> а теперь обнаружил, что в тикле та же самая проблема.
Использовать зависящие от локали функции, надеясь на существован
Victor Wagner wrote:
> Не таскать же за собой собственные таблицы collation sequence.
Таскает же тикль за собой собственные таблицы перекодировки.
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmas...@lists.debian.org
16.01.09, 12:18, "Alexey Pechnikov" :
> > > Вы считаете безграмотным Карамзина, писавшего "Историю государства
> > > Российского" без буквы ё?
> >
> > Не считаю, с чего вы взяли?
> > Я считаю безграмотными людей, которые "недоумивают" зачем им в школе
> > "впаривают" правила
> > орфографии и пункт
Hello!
В сообщении от Friday 16 January 2009 11:25:37 Konstantin Matyukhin написал(а):
> > Вы считаете безграмотным Карамзина, писавшего "Историю государства
> > Российского" без буквы ё?
>
> Не считаю, с чего вы взяли?
> Я считаю безграмотными людей, которые "недоумивают" зачем им в школе
> "впар
Alexey Pechnikov wrote:
> Посмотрел в википедии, оказывается, буква ё - наследие культа личности и
> официально присутствует в руссом языке лишь с 1942 года.
Ага, а григорианский календарь — наследие кровавого режима большевиков?
Может и от электрификации всей страны откажемся? Раз уж от «ликвида
16.01.09, 11:29, "Konstantin Matyukhin" :
> > Языковое наследие - груз, особенно для технического
> > человека.
> Чего уж там, давайте на пиктограммы переходить.
Уже в процессе. На иконки.
--
wBR,George.
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of "un
> > Тикль тут не при чем, это проблема кривых кодовый таблиц юникода, об этом
> > я в своё время писал в русскоязычном списке рассылке по tcl.
> > $ clisp
> > [1]> (sort '(й ц у е ё) 'string<)
> > (Ё Е Й У Ц)
> Нигде не написано, что символы национального языка должны быть упорядочены по
> алфави
Alexey Pechnikov wrote:
> Поддержка юникода оказывается все большей проблемой...
Уникод тут ни при чём. Сортировка букв в определённом языке, а тем более
строк — совершенно отдельная задача.
Прежде всего решение зависит от языка. В разных языках общие буквы могут
иметь разный порядок в алфавите.
Hello!
В сообщении от Friday 16 January 2009 11:09:57 Konstantin Matyukhin написал(а):
> Если человек не в состоянии выучить родной язык, о чем он вообще
> может рассуждать?
Вы считаете безграмотным Карамзина, писавшего "Историю государства Российского"
без буквы ё?
Позвольте с вами не согласит
Hello!
В сообщении от Friday 16 January 2009 10:14:41 Konstantin Matyukhin написал(а):
> > P.S. Да и есть-ли в русском языке эта полумифическая буква ё? ;-}
>
> Ага, есть. Назло некоторым "дизайнёрам".
> Мало вам, что i профукали? Хотите еще и ё в угоду малограмотным лентяям
> под нож пустить? Чт
Hello!
В сообщении от Friday 16 January 2009 09:22:51 Victor Wagner написал(а):
> С переходом на unicode от этого патча отказались. Потому что никто не
> гарантировал наличия в системе юникодной локали для соответствующего
> языка от этого патча отказались. Потому что никто не гарантировал
> налич
On Friday 16 January 2009 05:16:33 Иван Лох wrote:
> P.S. Да и есть-ли в русском языке эта полумифическая буква ё? ;-}
В русском языке 33 буквы. В языке гастарбайтеров, героев "Дом" и "Дом2",
школьников, пустивших букварь на самокрутки, возможно, меньше; наверное
20-25. Это их проблемы.
--
А
Hello!
В продолжение темы "Как правильно сделать поддержку юникода в программе" -
обнаружил, что не я один
не умею это делать, в тикле также пресловутая буква Ё не желает сортироваться:
$ cat collate.tcl
#!/usr/bin/tclsh8.5
proc russian_compare {a b} {
return [string compare $a $b]
}
proc
71 matches
Mail list logo