[pgbr-geral] converter ascii para utf8

2017-09-26 Thread Santiago - NSR
Boa noite. Tenho que converter um banco de dados que está codificado em
ASCII para UTF8. Existe alguma ferramenta que possa tratar o arquivo gerado
a partir do pg_dump ?.

Tentei  gerar o aqruivo pg_dump com –E UTF8 mas não da erro e não deixa
gerar o arquivo.

 

___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Re: [pgbr-geral] converter ascii para utf8

2017-09-26 Thread Osvaldo Kussama
Em 26/09/2017, Santiago - NSR escreveu:
> Boa noite. Tenho que converter um banco de dados que está codificado em
> ASCII para UTF8. Existe alguma ferramenta que possa tratar o arquivo gerado
> a partir do pg_dump ?.
>
> Tentei  gerar o aqruivo pg_dump com –E UTF8 mas não da erro e não deixa
> gerar o arquivo.
>
>
>


Se por ASCII você quer dizer que está utilizando o conjunto de
caracteres SQL_ASCII então você fez uma péssima escolha. Isto
significa que não foi feita nenhuma verificação de validade dos
caracteres inseridos.

https://www.postgresql.org/docs/current/static/multibyte.html
"When the server character set is SQL_ASCII, the server interprets
byte values 0-127 according to the ASCII standard, while byte values
128-255 are taken as uninterpreted characters."

Ou seja você terá que verificar qual codificação cada aplicação que
inseriu dados em seu banco de dados utilizou para tentar descobrir os
caracteres equivalentes em UTF-8. Se for uma única aplicação talvez
seja mais fácil, se forem múltiplas aplicações com diferentes
codificações será, no mínimo, bastante difícil.

Osvaldo
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Re: [pgbr-geral] converter ascii para utf8

2017-09-27 Thread Ilton Junior
Na época, estudei que o windows para codificação HTML utiliza como charset
o Win1252 que nada mais é que uma extensão do ISO8859-1, enfim, posso ter
associado o problema dessa forma, não sou expert microsoft, desta forma,
agradeço a orientação.

*Ilton Júnior*
Redes de Computadores | LPIC Sênior *| DBA Pleno*
Cel.: +55 85 9915-5540
E-mail: iltonjunio...@gmail.com

Em 27 de setembro de 2017 10:05, Leandro Guimarães Faria Corcete DUTRA <
l...@dutras.org> escreveu:

> Le mercredi 27 septembre 2017 à 09:38 -0300, Ilton Junior a écrit :
> >
> > Tive um problema parecido, so que no meu caso era de ISO8859-1 para
> > UTF8, acontece que tinhamos uma infraestrutura desktop baseada na
> > Microsoft, e quando migramos pra Linux a base mudou devido o S.O
> > Windows usar ISO8859 e o Linux UTF8.
>
> Só um detalhe: ISO 8859-1 é parecido, mas não idêntico ao Win 1252.
> Geralmente funciona, mas pode haver problemas menores (não lembro se
> relacionados a € ou algum caracter com sinal diacrítico dalguma língua
> menos votada) e não é correto dizer que Microsoft Windows usa ISO 8859.
>
>
> --
> skype:leandro.gfc.dutra?chat  Yahoo!: ymsgr:sendIM?lgcdutra
> +55 (61) 3546 7191  gTalk: xmpp:leand...@jabber.org
> +55 (61) 9302 2691ICQ/AIM: aim:GoIM?screenname=61287803
> BRAZIL GMT−3  MSN: msnim:chat?contact=lean...@dutra.fastmail.fm
> ___
> pgbr-geral mailing list
> pgbr-geral@listas.postgresql.org.br
> https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Re: [pgbr-geral] converter ascii para utf8

2017-09-27 Thread Ursulino Barboza
Prezados,

Não sei se o contexto é esse, mas estou encaminhado:

NameDescriptionLanguageServer?Bytes/CharAliases
BIG5 Big Five Traditional Chinese No 1-2 WIN950, Windows950
EUC_CN Extended UNIX Code-CN Simplified Chinese Yes 1-3
EUC_JP Extended UNIX Code-JP Japanese Yes 1-3
EUC_JIS_2004 Extended UNIX Code-JP, JIS X 0213 Japanese Yes 1-3
EUC_KR Extended UNIX Code-KR Korean Yes 1-3
EUC_TW Extended UNIX Code-TW Traditional Chinese, Taiwanese Yes 1-3
GB18030 National Standard Chinese No 1-4
GBK Extended National Standard Simplified Chinese No 1-2 WIN936, Windows936
ISO_8859_5 ISO 8859-5, ECMA 113 Latin/Cyrillic Yes 1
ISO_8859_6 ISO 8859-6, ECMA 114 Latin/Arabic Yes 1
ISO_8859_7 ISO 8859-7, ECMA 118 Latin/Greek Yes 1
ISO_8859_8 ISO 8859-8, ECMA 121 Latin/Hebrew Yes 1
JOHAB JOHAB Korean (Hangul) No 1-3
KOI8R KOI8-R Cyrillic (Russian) Yes 1 KOI8
KOI8U KOI8-U Cyrillic (Ukrainian) Yes 1
LATIN1 ISO 8859-1, ECMA 94 Western European Yes 1 ISO88591
LATIN2 ISO 8859-2, ECMA 94 Central European Yes 1 ISO88592
LATIN3 ISO 8859-3, ECMA 94 South European Yes 1 ISO88593
LATIN4 ISO 8859-4, ECMA 94 North European Yes 1 ISO88594
LATIN5 ISO 8859-9, ECMA 128 Turkish Yes 1 ISO88599
LATIN6 ISO 8859-10, ECMA 144 Nordic Yes 1 ISO885910
LATIN7 ISO 8859-13 Baltic Yes 1 ISO885913
LATIN8 ISO 8859-14 Celtic Yes 1 ISO885914
LATIN9 ISO 8859-15 LATIN1 with Euro and accents Yes 1 ISO885915
LATIN10 ISO 8859-16, ASRO SR 14111 Romanian Yes 1 ISO885916


SHOW client_encoding;
UPDATE pg_database SET datistemplate = FALSE WHERE datname = 'template1';
DROP DATABASE template1;
CREATE DATABASE template1 WITH TEMPLATE = template0 ENCODING = 'LATIN1'
LC_COLLATE = 'C' LC_CTYPE = 'C';
UPDATE pg_database SET datistemplate = TRUE WHERE datname = 'template1';


Ursulino

Em 27 de setembro de 2017 10:05, Leandro Guimarães Faria Corcete DUTRA <
l...@dutras.org> escreveu:

> Le mercredi 27 septembre 2017 à 09:38 -0300, Ilton Junior a écrit :
> >
> > Tive um problema parecido, so que no meu caso era de ISO8859-1 para
> > UTF8, acontece que tinhamos uma infraestrutura desktop baseada na
> > Microsoft, e quando migramos pra Linux a base mudou devido o S.O
> > Windows usar ISO8859 e o Linux UTF8.
>
> Só um detalhe: ISO 8859-1 é parecido, mas não idêntico ao Win 1252.
> Geralmente funciona, mas pode haver problemas menores (não lembro se
> relacionados a € ou algum caracter com sinal diacrítico dalguma língua
> menos votada) e não é correto dizer que Microsoft Windows usa ISO 8859.
>
>
> --
> skype:leandro.gfc.dutra?chat  Yahoo!: ymsgr:sendIM?lgcdutra
> +55 (61) 3546 7191  gTalk: xmpp:leand...@jabber.org
> +55 (61) 9302 2691ICQ/AIM: aim:GoIM?screenname=61287803
> BRAZIL GMT−3  MSN: msnim:chat?contact=lean...@dutra.fastmail.fm
> ___
> pgbr-geral mailing list
> pgbr-geral@listas.postgresql.org.br
> https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral




-- 
Att,


Ursulino Barboza de Souza Neto
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Re: [pgbr-geral] converter ascii para utf8

2017-09-27 Thread Manuel Garcia
Boa tarde você tento usar a EXTENSION unaccent;

2017-09-27 15:06 GMT-03:00 Ursulino Barboza :

> Prezados,
>
> Não sei se o contexto é esse, mas estou encaminhado:
>
> NameDescriptionLanguageServer?Bytes/CharAliases
> BIG5 Big Five Traditional Chinese No 1-2 WIN950, Windows950
> EUC_CN Extended UNIX Code-CN Simplified Chinese Yes 1-3
> EUC_JP Extended UNIX Code-JP Japanese Yes 1-3
> EUC_JIS_2004 Extended UNIX Code-JP, JIS X 0213 Japanese Yes 1-3
> EUC_KR Extended UNIX Code-KR Korean Yes 1-3
> EUC_TW Extended UNIX Code-TW Traditional Chinese, Taiwanese Yes 1-3
> GB18030 National Standard Chinese No 1-4
> GBK Extended National Standard Simplified Chinese No 1-2 WIN936,
> Windows936
> ISO_8859_5 ISO 8859-5, ECMA 113 Latin/Cyrillic Yes 1
> ISO_8859_6 ISO 8859-6, ECMA 114 Latin/Arabic Yes 1
> ISO_8859_7 ISO 8859-7, ECMA 118 Latin/Greek Yes 1
> ISO_8859_8 ISO 8859-8, ECMA 121 Latin/Hebrew Yes 1
> JOHAB JOHAB Korean (Hangul) No 1-3
> KOI8R KOI8-R Cyrillic (Russian) Yes 1 KOI8
> KOI8U KOI8-U Cyrillic (Ukrainian) Yes 1
> LATIN1 ISO 8859-1, ECMA 94 Western European Yes 1 ISO88591
> LATIN2 ISO 8859-2, ECMA 94 Central European Yes 1 ISO88592
> LATIN3 ISO 8859-3, ECMA 94 South European Yes 1 ISO88593
> LATIN4 ISO 8859-4, ECMA 94 North European Yes 1 ISO88594
> LATIN5 ISO 8859-9, ECMA 128 Turkish Yes 1 ISO88599
> LATIN6 ISO 8859-10, ECMA 144 Nordic Yes 1 ISO885910
> LATIN7 ISO 8859-13 Baltic Yes 1 ISO885913
> LATIN8 ISO 8859-14 Celtic Yes 1 ISO885914
> LATIN9 ISO 8859-15 LATIN1 with Euro and accents Yes 1 ISO885915
> LATIN10 ISO 8859-16, ASRO SR 14111 Romanian Yes 1 ISO885916
>
>
> SHOW client_encoding;
> UPDATE pg_database SET datistemplate = FALSE WHERE datname = 'template1';
> DROP DATABASE template1;
> CREATE DATABASE template1 WITH TEMPLATE = template0 ENCODING = 'LATIN1'
> LC_COLLATE = 'C' LC_CTYPE = 'C';
> UPDATE pg_database SET datistemplate = TRUE WHERE datname = 'template1';
>
>
> Ursulino
>
> Em 27 de setembro de 2017 10:05, Leandro Guimarães Faria Corcete DUTRA <
> l...@dutras.org> escreveu:
>
>> Le mercredi 27 septembre 2017 à 09:38 -0300, Ilton Junior a écrit :
>> >
>> > Tive um problema parecido, so que no meu caso era de ISO8859-1 para
>> > UTF8, acontece que tinhamos uma infraestrutura desktop baseada na
>> > Microsoft, e quando migramos pra Linux a base mudou devido o S.O
>> > Windows usar ISO8859 e o Linux UTF8.
>>
>> Só um detalhe: ISO 8859-1 é parecido, mas não idêntico ao Win 1252.
>> Geralmente funciona, mas pode haver problemas menores (não lembro se
>> relacionados a € ou algum caracter com sinal diacrítico dalguma língua
>> menos votada) e não é correto dizer que Microsoft Windows usa ISO 8859.
>>
>>
>> --
>> skype:leandro.gfc.dutra?chat  Yahoo!: ymsgr:sendIM?lgcdutra
>> +55 (61) 3546 7191  gTalk: xmpp:leand...@jabber.org
>> +55 (61) 9302 2691ICQ/AIM: aim:GoIM?screenname=61287803
>> BRAZIL GMT−3  MSN: msnim:chat?contact=lean...@dutra.fastmail.fm
>> ___
>> pgbr-geral mailing list
>> pgbr-geral@listas.postgresql.org.br
>> https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral
>
>
>
>
> --
> Att,
>
>
> Ursulino Barboza de Souza Neto
>
> ___
> pgbr-geral mailing list
> pgbr-geral@listas.postgresql.org.br
> https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral
>



-- 
   Manuel Alejandro Garcia Mellado
Ingeniero Ejecución en Informática e computación
Concepcion - Chile VIII Region del Bio - Bio
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral