Re: подсчет символо в UTF-8

2009-04-25 Пенетрантность Иван Лох
On Sat, Apr 25, 2009 at 12:44:06PM +0300, Serhiy Storchaka wrote: > Иван Лох wrote: > > Думаю, что если убрать пробелы всех видов, то совпадет... > > Не всё так просто. Сперва нужно договориться какие символы считать пробелами > и каких видов… ;) В стандарте unicode есть такой класс "пробелы" Я

Re: подсчет символо в UTF-8

2009-04-23 Пенетрантность Иван Лох
On Thu, Apr 23, 2009 at 05:13:48PM +0300, Fedir Gontsa wrote: > > iconv -f UTF-8 -t KOI8-U file.txt | wc -m > > > iconv вешаеться на каком-то из iconv: illegal input sequence at position 2337 > > env LANG=uk_UA.UTF-8 wc -m 01.txt > а вариант со сменой локали работает... погрешность при подсчете ~

Re: подсчет символо в UTF-8

2009-04-23 Пенетрантность Peter Pentchev
On Thu, Apr 23, 2009 at 04:29:19PM +0300, Fedir Gontsa wrote: > Добрый день Уважаемые! > Спешу с вопросом. Как подсчитать количество символов в текстовом файле > если файл в UTF-8, а локаль KOI-8 > [snip] > Подскажите как посчитать количество символов в файле (Копировать в > GEdit или OpenOffice