Re: Lenny.Неправильное отображе ние символов русского языка в ар хиве UTF-8

2009-09-28 Пенетрантность Mark Goldshtein
2009/9/28 Mikhail A Antonov :
> -[ Mark Goldshtein 28/09/2009 13:01 (GMT +3)
>> > 28 сентября 2009 г. 12:07 пользователь Mark Goldshtein
>> >
>> >  написал:
>> >> Доброго времени суток, Рассылка!
>> >>
>> >> Помогите, пожалуйста, разобраться с некорректным отображением
>> >> кирилликов в архиве. Архив создан стандартной MS Windows, UTF-8,
>> >> встроенный ZIP архиватор. Имя архива читается правильно, а вот то, что
>> >> внутри - "кракозябры".
>>
>> 2009/9/28 Олег Ключкин :
>> > Скорее всего локаль тут не причем, а unzip в Ubuntu пропатчен, чтобы
>> > декодировать имена файлов на лету. В ZIP не сохраняется кодировка имен
>> > файлов - отсюда все проблемы.
>>
>> Не совсем понял насчёт кодировки, ведь и там и там - UTF-8.
>
> Внутри zip-архива не utf8.

Нет ли возможности узнать что там?

>> А можно что-то сделать в Lenny?
>
> unzip -Z1 filename.zip | iconv -f cp1252 -t cp850 | iconv -f cp866

Большое спасибо, это работает.

Простите за настойчивость, может быть где-то мелькало решение и для GUI?

-- 
С Уважением,
Марк Гольдштейн

Sincerely Yours'
Mark Goldshtein


Re: Lenny.Неправильное отображе ние символов русского языка в ар хиве UTF-8

2009-09-28 Пенетрантность Олег Ключкин
28 сентября 2009 г. 13:01 пользователь Mark Goldshtein <
mark.goldsht...@gmail.com> написал:

> > 28 сентября 2009 г. 12:07 пользователь Mark Goldshtein
> >  написал:
> >>
> >> Доброго времени суток, Рассылка!
> >>
> >> Помогите, пожалуйста, разобраться с некорректным отображением
> >> кирилликов в архиве. Архив создан стандартной MS Windows, UTF-8,
> >> встроенный ZIP архиватор. Имя архива читается правильно, а вот то, что
> >> внутри - "кракозябры".
>
>
> 2009/9/28 Олег Ключкин :
> > Скорее всего локаль тут не причем, а unzip в Ubuntu пропатчен, чтобы
> > декодировать имена файлов на лету. В ZIP не сохраняется кодировка имен
> > файлов - отсюда все проблемы.
>
> Не совсем понял насчёт кодировки, ведь и там и там - UTF-8.
>
> Я предпологаю, что в Ubuntu(именно в ней) утилита unzip пропатчена таким
образом, что автоматически перекодирует CP1251(архив, созданный в Windows) в
UTF8(текущая локаль).


> А можно что-то сделать в Lenny?
>
> --
> С Уважением,
> Марк Гольдштейн
>
> Sincerely Yours'
> Mark Goldshtein
>

   1. Могу посоветовать использовать 7z или RAR(тут не уверен-не помню) -
   эти архиваторы не зависят от текущей локали и таких проблем не будет.
   2. В Lenny можно переконвертировать имена файлов с помощью утилиты *
   convmv*.


Re: Lenny.Неправильное отображе ние символов русского языка в ар хиве UTF-8

2009-09-28 Пенетрантность Mark Goldshtein
> 28 сентября 2009 г. 12:07 пользователь Mark Goldshtein
>  написал:
>>
>> Доброго времени суток, Рассылка!
>>
>> Помогите, пожалуйста, разобраться с некорректным отображением
>> кирилликов в архиве. Архив создан стандартной MS Windows, UTF-8,
>> встроенный ZIP архиватор. Имя архива читается правильно, а вот то, что
>> внутри - "кракозябры".


2009/9/28 Олег Ключкин :
> Скорее всего локаль тут не причем, а unzip в Ubuntu пропатчен, чтобы
> декодировать имена файлов на лету. В ZIP не сохраняется кодировка имен
> файлов - отсюда все проблемы.

Не совсем понял насчёт кодировки, ведь и там и там - UTF-8.

А можно что-то сделать в Lenny?

-- 
С Уважением,
Марк Гольдштейн

Sincerely Yours'
Mark Goldshtein


Re: Lenny.Неправильное отображе ние символов русского языка в ар хиве UTF-8

2009-09-28 Пенетрантность Олег Ключкин
Скорее всего локаль тут не причем, а unzip в Ubuntu пропатчен, чтобы
декодировать имена файлов на лету. В ZIP не сохраняется кодировка имен
файлов - отсюда все проблемы.

28 сентября 2009 г. 12:07 пользователь Mark Goldshtein <
mark.goldsht...@gmail.com> написал:

> Доброго времени суток, Рассылка!
>
> Помогите, пожалуйста, разобраться с некорректным отображением
> кирилликов в архиве. Архив создан стандартной MS Windows, UTF-8,
> встроенный ZIP архиватор. Имя архива читается правильно, а вот то, что
> внутри - "кракозябры".
>
> Что имеем на машине, где пытаемся прочитать архив:
>
> $ locale -m
> ANSI_X3.110-1983
> ANSI_X3.4-1968
> ARMSCII-8
> ASMO_449
> BIG5
> BIG5-HKSCS
> BRF
> BS_4730
> BS_VIEWDATA
> CP10007
> CP1125
> CP1250
> CP1251
> CP1252
> CP1253
> CP1254
> CP1255
> CP1256
> CP1257
> CP1258
> CP737
> CP775
> CP949
> CSA_Z243.4-1985-1
> CSA_Z243.4-1985-2
> CSA_Z243.4-1985-GR
> CSN_369103
> CWI
> DEC-MCS
> DIN_66003
> DS_2089
> EBCDIC-AT-DE
> EBCDIC-AT-DE-A
> EBCDIC-CA-FR
> EBCDIC-DK-NO
> EBCDIC-DK-NO-A
> EBCDIC-ES
> EBCDIC-ES-A
> EBCDIC-ES-S
> EBCDIC-FI-SE
> EBCDIC-FI-SE-A
> EBCDIC-FR
> EBCDIC-IS-FRISS
> EBCDIC-IT
> EBCDIC-PT
> EBCDIC-UK
> EBCDIC-US
> ECMA-CYRILLIC
> ES
> ES2
> EUC-JISX0213
> EUC-JP
> EUC-JP-MS
> EUC-KR
> EUC-TW
> GB18030
> GB2312
> GBK
> GB_1988-80
> GEORGIAN-ACADEMY
> GEORGIAN-PS
> GOST_19768-74
> GREEK-CCITT
> GREEK7
> GREEK7-OLD
> HP-ROMAN8
> IBM037
> IBM038
> IBM1004
> IBM1026
> IBM1047
> IBM1124
> IBM1129
> IBM1132
> IBM1133
> IBM1160
> IBM1161
> IBM1162
> IBM1163
> IBM1164
> IBM256
> IBM273
> IBM274
> IBM275
> IBM277
> IBM278
> IBM280
> IBM281
> IBM284
> IBM285
> IBM290
> IBM297
> IBM420
> IBM423
> IBM424
> IBM437
> IBM500
> IBM850
> IBM851
> IBM852
> IBM855
> IBM856
> IBM857
> IBM860
> IBM861
> IBM862
> IBM863
> IBM864
> IBM865
> IBM866
> IBM866NAV
> IBM868
> IBM869
> IBM870
> IBM871
> IBM874
> IBM875
> IBM880
> IBM891
> IBM903
> IBM904
> IBM905
> IBM918
> IBM922
> IEC_P27-1
> INIS
> INIS-8
> INIS-CYRILLIC
> INVARIANT
> ISIRI-3342
> ISO-8859-1
> ISO-8859-10
> ISO-8859-11
> ISO-8859-13
> ISO-8859-14
> ISO-8859-15
> ISO-8859-16
> ISO-8859-2
> ISO-8859-3
> ISO-8859-4
> ISO-8859-5
> ISO-8859-6
> ISO-8859-7
> ISO-8859-8
> ISO-8859-9
> ISO-8859-9E
> ISO-IR-197
> ISO-IR-209
> ISO-IR-90
> ISO_10367-BOX
> ISO_10646
> ISO_11548-1
> ISO_2033-1983
> ISO_5427
> ISO_5427-EXT
> ISO_5428
> ISO_646.BASIC
> ISO_646.IRV
> ISO_6937
> ISO_6937-2-25
> ISO_6937-2-ADD
> ISO_8859-1,GL
> ISO_8859-SUPP
> IT
> JIS_C6220-1969-JP
> JIS_C6220-1969-RO
> JIS_C6229-1984-A
> JIS_C6229-1984-B
> JIS_C6229-1984-B-ADD
> JIS_C6229-1984-HAND
> JIS_C6229-1984-HAND-ADD
> JIS_C6229-1984-KANA
> JIS_X0201
> JOHAB
> JUS_I.B1.002
> JUS_I.B1.003-MAC
> JUS_I.B1.003-SERB
> KOI-8
> KOI8-R
> KOI8-RU
> KOI8-T
> KOI8-U
> KSC5636
> LATIN-GREEK
> LATIN-GREEK-1
> MAC-CENTRALEUROPE
> MAC-CYRILLIC
> MAC-IS
> MAC-SAMI
> MAC-UK
> MACINTOSH
> MAC_CENTRALEUROPE
> MIK
> MSZ_7795.3
> NATS-DANO
> NATS-DANO-ADD
> NATS-SEFI
> NATS-SEFI-ADD
> NC_NC00-10
> NEXTSTEP
> NF_Z_62-010
> NF_Z_62-010_(1973)
> NF_Z_62-010_1973
> NS_4551-1
> NS_4551-2
> PT
> PT154
> PT2
> RK1048
> SAMI
> SAMI-WS2
> SEN_850200_B
> SEN_850200_C
> SHIFT_JIS
> SHIFT_JISX0213
> T.101-G2
> T.61-7BIT
> T.61-8BIT
> TCVN5712-1
> TIS-620
> TSCII
> UTF-8
> VIDEOTEX-SUPPL
> VISCII
> WIN-SAMI-2
> WINDOWS-31J
>
> $ locale -a
> C
> en_US.utf8
> POSIX
> ru_RU
> ru_RU.cp1251
> ru_RU.iso88595
> ru_RU.koi8r
> ru_RU.utf8
> russian
>
> $ locale
> LANG=en_US.UTF-8
> LC_CTYPE="en_US.UTF-8"
> LC_NUMERIC="en_US.UTF-8"
> LC_TIME="en_US.UTF-8"
> LC_COLLATE="en_US.UTF-8"
> LC_MONETARY="en_US.UTF-8"
> LC_MESSAGES="en_US.UTF-8"
> LC_PAPER="en_US.UTF-8"
> LC_NAME="en_US.UTF-8"
> LC_ADDRESS="en_US.UTF-8"
> LC_TELEPHONE="en_US.UTF-8"
> LC_MEASUREMENT="en_US.UTF-8"
> LC_IDENTIFICATION="en_US.UTF-8"
> LC_ALL=
>
> $ ls
> Тестовый архив MSW.zip
>
> $ unzip Тестовый\ архив\ MSW.zip
> Archive:  Тестовый архив MSW.zip
>  extracting: ���ԫ��� ���Ѭԫӿ�/���ԫ�ٮ ���Ҽѡ� 2.txt
>  extracting: ���ԫ�ٮ ���Ҽѡ� 1.txt
>
> $ ls
> ??? ???Ѭ?ӿ?  Тестовый архив MSW.zip  ?ٮ ???Ҽѡ? 1.txt
>
> Через GUI (archive manager, xarchiver) - тоже самое.
>
> Самое обидное то, что рядом стоит машина с Ubuntu 9.04 c точно таким
> же выводом 'locale' - там всё видится нормально, и соответственно,
> нормально разархивируется и консольно и GUI.
>
> --
> С Уважением,
> Марк Гольдштейн
>
> Sincerely Yours'
> Mark Goldshtein
>