Re: [room] Как найти файл в определённой кодировке?

2011-08-25 Пенетрантность Aleksey Avdeev
24.08.2011 14:23, Andrew Borodin пишет: > On Wed, Aug 24, 2011 at 02:14:39PM +0400, Alexei V. Mezin wrote: >> 24.08.2011 14:04, Денис Черносов пишет: > >> С последующим прогоном recode /CR (или /LF, надо в man >> уточнить), который уберет лишние символы там, где они есть. > > Думаю, что > > tr

Re: [room] Как найти файл в определённой кодировке?

2011-08-24 Пенетрантность Sergey Korobitsin
Денис Черносов ☫ → To Культурный офтопик @ Wed, Aug 24, 2011 14:04 +0400 > Поэкспериментировал... > 1) вроде бы recode действительно не перекодирует лишнего, но > 2) преобразование виндовых разделителей в юниксовые он делать не умеет и > вообще не перекодирует такие файлы: > > recode: failed: Amb

Re: [room] Как найти файл в определённой кодировке?

2011-08-24 Пенетрантность Andrew Borodin
On Wed, Aug 24, 2011 at 02:14:39PM +0400, Alexei V. Mezin wrote: > 24.08.2011 14:04, Денис Черносов пишет: > С последующим прогоном recode /CR (или /LF, надо в man > уточнить), который уберет лишние символы там, где они есть. Думаю, что tr -d '\r' будет быстрее. -- С уважением А. Бородин. _

Re: [room] Как найти файл в определённой кодировке?

2011-08-24 Пенетрантность Aleksey Avdeev
24.08.2011 14:04, Денис Черносов пишет: > > > 22 августа 2011 г. 15:53 пользователь Sergey Korobitsin > mailto:underta...@arta.kz>> написал: > > Денис Черносов ☫ → To Культурный офтопик @ Mon, Aug 22, 2011 14:01 +0400 > ... > > > 2) Аналогичный вопрос про переносы строк в стиле Windows

Re: [room] Как найти файл в определённой кодировке?

2011-08-24 Пенетрантность Alexei V. Mezin
24.08.2011 14:04, Денис Черносов пишет: 2) преобразование виндовых разделителей в юниксовые он делать не умеет и вообще не перекодирует такие файлы: recode: failed: Ambiguous output in step `CR-LF..data' Для этого есть ключ -f С последующим прогоном recode /CR (или /LF, надо в man уточнить)

Re: [room] Как найти файл в определённой кодировке?

2011-08-24 Пенетрантность Alexei V. Mezin
24.08.2011 13:57, Денис Черносов пишет: Нет, эта информация ненадёжная. Не знаю, есть ли готовое, но google("file charset detection") говорит, что http://sourceforge.net/projects/chsdet/ http://fredeaker.blogspot.com/2007/01/character-encoding-detection.html http://www-archive.mozilla.org/proj

Re: [room] Как найти файл в определённой кодировке?

2011-08-24 Пенетрантность Денис Черносов
22 августа 2011 г. 15:53 пользователь Sergey Korobitsin написал: > Денис Черносов ☫ → To Культурный офтопик @ Mon, Aug 22, 2011 14:01 +0400 > > > Добрый день всем! > > > > > > Есть проект, которые разрабатывался в течение долгого времени самыми > разными > > людьми. В нём в хаотичном порядке встре

Re: [room] Как найти файл в определённой кодировке?

2011-08-24 Пенетрантность Денис Черносов
22 августа 2011 г. 15:06 пользователь Alexei V. Mezin < alexei-me...@rambler.ru> написал: > 22.08.2011 14:01, Денис Черносов пишет: > > > 1) Есть ли автоматический способ получить список файлов, в cp1251 для >> (полу)автоматической конвертации в юникод? >> >> 2) Аналогичный вопрос про переносы ст

Re: [room] Как найти файл в определённой кодировке?

2011-08-22 Пенетрантность Sergey Korobitsin
Денис Черносов ☫ → To Культурный офтопик @ Mon, Aug 22, 2011 14:01 +0400 > Добрый день всем! > > > Есть проект, которые разрабатывался в течение долгого времени самыми разными > людьми. В нём в хаотичном порядке встречаются файлы в кодировке cp1251 > (остальные в юникоде). > > 1) Есть ли автома

Re: [room] Как найти файл в определённой кодировке?

2011-08-22 Пенетрантность Alexei V. Mezin
22.08.2011 14:01, Денис Черносов пишет: 1) Есть ли автоматический способ получить список файлов, в cp1251 для (полу)автоматической конвертации в юникод? 2) Аналогичный вопрос про переносы строк в стиле Windows|Unix... Не так? [alexei@intel_server tmp]$ file 1251.txt utf.txt 1251.txt: ISO-885

[room] Как найти файл в определённой кодировке?

2011-08-22 Пенетрантность Денис Черносов
Добрый день всем! Есть проект, которые разрабатывался в течение долгого времени самыми разными людьми. В нём в хаотичном порядке встречаются файлы в кодировке cp1251 (остальные в юникоде). 1) Есть ли автоматический способ получить список файлов, в cp1251 для (полу)автоматической конвертации в юн