Re: [pgbr-geral] LATIN1 ou UTF-8

2013-07-18 Por tôpico Matheus de Oliveira
2013/7/17 Euler Taveira eu...@timbira.com.br

 On 16-07-2013 19:57, Alessandro Gonçalves wrote:
  Alguns caracteres que compõem utf-8 necessitam de até 3 bytes, se não me
  engano 2 para armazenar o caracter e 1 byte para guardar a sua posição
  enquanto em latin-1 os caracteres ocupam apenas 8 bits (1 byte).
 
 Na verdade, até 4 bytes. Quanto a parte da posição isso *não* é verdade.
 UTF-8 ocupa o menor espaço possível (o alfabeto é mapeado todo apenas
 com 1 byte).

  Logo se usarmos utf-8 o tamanho do banco tende a ser maior com o tempo,
  se a base for maior pior é isso em varios pontos como espaço em disco,
  backup (Hoje em dia isso é muito barato) o que é mais caro hoje em
  questão de estrutura é o IO.
 
 Para o português, converter de Latin-1 [1] (aka ISO-8859-1) para UTF-8
 [2] não irá aumentar o seu banco pois todos os caracteres do Latin-1 são
 mapeados para UTF-8 utilizando o *mesmo* tamanho em bytes (isso não é
 verdade, por exemplo, para alfabetos cirílicos -- línguas eslavas).


Só uma correção, até onde me lembro, os caracteres acentuados (êãú...) são
representados com dois bytes em UTF8, não um. Logo o espaço ocupado para
textos em português em UTF8 pode ser, no máximo, o dobro dos representados
em Latin-1. Mas, é claro, que a grande maioria não é caractere acentuado.

Só pra ter uma ideia, peguei essa mensagem de e-mail e fiz a contagem:

Latin1 = 2454 bytes
UTF8 = 2517 bytes

Para um texto razoavelmente grande, a diferença é ínfima.


  Você precisa usar UTF-8? Sim. Então use, senão for necessário utilize
  LATIN-1 que irá ocupar menos espaço em disco.
 
 A questão de *não* utilizar UTF-8 é meramente por falta de suporte das
 interfaces ao UTF-8 (que diga-se de passagem, se elas ainda não o
 suportam, elas devem estar obsoletas) e _não_ por questão de espaço.

 Como reforçou o Osvaldo, *não* utilize Latin-1 a não ser que você seja
 obrigado a isso.


Também concordo. Usar Latin-1 ao invés de UTF-8 somente por ocupar um pouco
mais de espaço é, na minha opinião, uma regressão tecnológica . Hoje eu
diria para usar UTF-8 em qualquer projeto novo.

-- 
Matheus de Oliveira
Analista de Banco de Dados
Dextra Sistemas - MPS.Br nível F!
www.dextra.com.br/postgres
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


Re: [pgbr-geral] LATIN1 ou UTF-8

2013-07-18 Por tôpico VidaUTI
Mas se vamos a parte que se aplica ao sistema legado que dou manutenção:
A aplicação já impede que o usuário digite com acentuação. Logo, não há nenhum 
acento gráfico nos registros do banco. Inclusive pensei em colocar esse banco 
em SQL_ASCII,
já que não se utiliza nenhuma acentuação nessa aplicação. 
E colocando o banco em SQL_ASCII ainda poderei desabilitar o algorítimo que 
valida e retira acentos,
já que o próprio banco já fará isso. Ou não?


Att Carlos


From: Matheus de Oliveira 
Sent: Thursday, July 18, 2013 8:03 AM
To: Comunidade PostgreSQL Brasileira 
Subject: Re: [pgbr-geral] LATIN1 ou UTF-8


2013/7/17 Euler Taveira eu...@timbira.com.br

  On 16-07-2013 19:57, Alessandro Gonçalves wrote:
   Alguns caracteres que compõem utf-8 necessitam de até 3 bytes, se não me
   engano 2 para armazenar o caracter e 1 byte para guardar a sua posição
   enquanto em latin-1 os caracteres ocupam apenas 8 bits (1 byte).
  

  Na verdade, até 4 bytes. Quanto a parte da posição isso *não* é verdade.
  UTF-8 ocupa o menor espaço possível (o alfabeto é mapeado todo apenas
  com 1 byte).


   Logo se usarmos utf-8 o tamanho do banco tende a ser maior com o tempo,
   se a base for maior pior é isso em varios pontos como espaço em disco,
   backup (Hoje em dia isso é muito barato) o que é mais caro hoje em
   questão de estrutura é o IO.
  

  Para o português, converter de Latin-1 [1] (aka ISO-8859-1) para UTF-8
  [2] não irá aumentar o seu banco pois todos os caracteres do Latin-1 são
  mapeados para UTF-8 utilizando o *mesmo* tamanho em bytes (isso não é
  verdade, por exemplo, para alfabetos cirílicos -- línguas eslavas).



Só uma correção, até onde me lembro, os caracteres acentuados (êãú...) são 
representados com dois bytes em UTF8, não um. Logo o espaço ocupado para textos 
em português em UTF8 pode ser, no máximo, o dobro dos representados em Latin-1. 
Mas, é claro, que a grande maioria não é caractere acentuado.

Só pra ter uma ideia, peguei essa mensagem de e-mail e fiz a contagem:


Latin1 = 2454 bytes

UTF8 = 2517 bytes


Para um texto razoavelmente grande, a diferença é ínfima.


 
   Você precisa usar UTF-8? Sim. Então use, senão for necessário utilize
   LATIN-1 que irá ocupar menos espaço em disco.
  

  A questão de *não* utilizar UTF-8 é meramente por falta de suporte das
  interfaces ao UTF-8 (que diga-se de passagem, se elas ainda não o
  suportam, elas devem estar obsoletas) e _não_ por questão de espaço.

  Como reforçou o Osvaldo, *não* utilize Latin-1 a não ser que você seja
  obrigado a isso.



Também concordo. Usar Latin-1 ao invés de UTF-8 somente por ocupar um pouco 
mais de espaço é, na minha opinião, uma regressão tecnológica . Hoje eu diria 
para usar UTF-8 em qualquer projeto novo.

-- 

Matheus de Oliveira
Analista de Banco de Dados
Dextra Sistemas - MPS.Br nível F!
www.dextra.com.br/postgres





___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


Re: [pgbr-geral] LATIN1 ou UTF-8

2013-07-18 Por tôpico Osvaldo Kussama
Em 18/07/13, Carlos Antônio Pereira
(VidaUTI)carlosanto...@utivida.com.br escreveu:
 Mas se vamos a parte que se aplica ao sistema legado que dou manutenção:
 A aplicação já impede que o usuário digite com acentuação. Logo, não há
 nenhum
 acento gráfico nos registros do banco. Inclusive pensei em colocar esse
 banco em SQL_ASCII,
 já que não se utiliza nenhuma acentuação nessa aplicação.
 E colocando o banco em SQL_ASCII ainda poderei desabilitar o algorítimo que
 valida e retira acentos,
 já que o próprio banco já fará isso. Ou não?



Não.
Como você pode verificar no manual [1] SQL_ASCII significa não fazer
qualquer verificação sobre o que é gravado no banco. Você é que terá
que garantir que o que será gravado sejam caracteres permitidos.

The SQL_ASCII setting behaves considerably differently from the other
settings. When the server character set is SQL_ASCII, the server
interprets byte values 0-127 according to the ASCII standard, while
byte values 128-255 are taken as uninterpreted characters. No encoding
conversion will be done when the setting is SQL_ASCII. Thus, this
setting is not so much a declaration that a specific encoding is in
use, as a declaration of ignorance about the encoding.

Nunca use SQL_ASCII.

Osvaldo
[1] 
http://www.postgresql.org/docs/current/interactive/multibyte.html#MULTIBYTE-CHARSET-SUPPORTED
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


Re: [pgbr-geral] LATIN1 ou UTF-8

2013-07-18 Por tôpico Euler Taveira
On 18-07-2013 08:03, Matheus de Oliveira wrote:
 Só uma correção, até onde me lembro, os caracteres acentuados (êãú...)
 são representados com dois bytes em UTF8, não um. Logo o espaço ocupado
 para textos em português em UTF8 pode ser, no máximo, o dobro dos
 representados em Latin-1.

Afirmação precisa, porém, muito teórica. O uso de caracteres do Latin-1
que não são representados com 1 byte (vide [1]) é esparso. Para se ter
uma ideia, peguei dois títulos de Machado de Assis [2] e o aumento foi:

Quincas Borba: 4,02%
Dom Casmurro: 2,81%

A não ser que o seu banco de dados seja meramente para guardar dados
históricos e a quantidade armazenada fosse na casa das dezenas de
terabytes, eu aconselharia não utilizar UTF-8.


[1] http://en.wikipedia.org/wiki/C1_Controls_and_Latin-1_Supplement
[2]
http://machado.mec.gov.br/index.php?option=com_contentview=articleid=164:romancecatid=34:obra-completaItemid=123


-- 
   Euler Taveira   Timbira - http://www.timbira.com.br/
   PostgreSQL: Consultoria, Desenvolvimento, Suporte 24x7 e Treinamento
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


Re: [pgbr-geral] LATIN1 ou UTF-8

2013-07-18 Por tôpico Matheus de Oliveira
2013/7/18 Euler Taveira eu...@timbira.com.br

 On 18-07-2013 08:03, Matheus de Oliveira wrote:
  Só uma correção, até onde me lembro, os caracteres acentuados (êãú...)
  são representados com dois bytes em UTF8, não um. Logo o espaço ocupado
  para textos em português em UTF8 pode ser, no máximo, o dobro dos
  representados em Latin-1.
 
 Afirmação precisa, porém, muito teórica. O uso de caracteres do Latin-1
 que não são representados com 1 byte (vide [1]) é esparso. Para se ter
 uma ideia, peguei dois títulos de Machado de Assis [2] e o aumento foi:

 Quincas Borba: 4,02%
 Dom Casmurro: 2,81%


Agora não entendi. Parece que falamos a mesma coisa. Eu disse *no máximo* o
dobro, mas é pouquíssimo provável que chegará perto disso. Como no exemplo
do e-mail que citei, que deu 2,56%.

De qualquer forma, gostei das referências para os livros do Machado de
Assis.


A não ser que o seu banco de dados seja meramente para guardar dados
 históricos e a quantidade armazenada fosse na casa das dezenas de
 terabytes, eu aconselharia não utilizar UTF-8.


 [1] http://en.wikipedia.org/wiki/C1_Controls_and_Latin-1_Supplement
 [2]

 http://machado.mec.gov.br/index.php?option=com_contentview=articleid=164:romancecatid=34:obra-completaItemid=123


Aí sim... :-)


Atenciosamente,
-- 
Matheus de Oliveira
Analista de Banco de Dados
Dextra Sistemas - MPS.Br nível F!
www.dextra.com.br/postgres
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


Re: [pgbr-geral] LATIN1 ou UTF-8

2013-07-17 Por tôpico Euler Taveira
On 16-07-2013 19:57, Alessandro Gonçalves wrote:
 Alguns caracteres que compõem utf-8 necessitam de até 3 bytes, se não me
 engano 2 para armazenar o caracter e 1 byte para guardar a sua posição
 enquanto em latin-1 os caracteres ocupam apenas 8 bits (1 byte).
 
Na verdade, até 4 bytes. Quanto a parte da posição isso *não* é verdade.
UTF-8 ocupa o menor espaço possível (o alfabeto é mapeado todo apenas
com 1 byte).

 Logo se usarmos utf-8 o tamanho do banco tende a ser maior com o tempo,
 se a base for maior pior é isso em varios pontos como espaço em disco,
 backup (Hoje em dia isso é muito barato) o que é mais caro hoje em
 questão de estrutura é o IO.
 
Para o português, converter de Latin-1 [1] (aka ISO-8859-1) para UTF-8
[2] não irá aumentar o seu banco pois todos os caracteres do Latin-1 são
mapeados para UTF-8 utilizando o *mesmo* tamanho em bytes (isso não é
verdade, por exemplo, para alfabetos cirílicos -- línguas eslavas).

 Você precisa usar UTF-8? Sim. Então use, senão for necessário utilize
 LATIN-1 que irá ocupar menos espaço em disco.
 
A questão de *não* utilizar UTF-8 é meramente por falta de suporte das
interfaces ao UTF-8 (que diga-se de passagem, se elas ainda não o
suportam, elas devem estar obsoletas) e _não_ por questão de espaço.

Como reforçou o Osvaldo, *não* utilize Latin-1 a não ser que você seja
obrigado a isso.


[1] http://en.wikipedia.org/wiki/Latin-1
[2] http://en.wikipedia.org/wiki/Utf-8


-- 
   Euler Taveira   Timbira - http://www.timbira.com.br/
   PostgreSQL: Consultoria, Desenvolvimento, Suporte 24x7 e Treinamento
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


[pgbr-geral] LATIN1 ou UTF-8

2013-07-16 Por tôpico VidaUTI
Senhores, boa tarde.

Em relação a codificação do banco, há alguma diferença entre usar
LATIN1 ou UTF-8? Muda algo em relação a performance?

Att Carlos___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


Re: [pgbr-geral] LATIN1 ou UTF-8

2013-07-16 Por tôpico Osvaldo Kussama
Em 16/07/13, Carlos Antônio Pereira
(VidaUTI)carlosanto...@utivida.com.br escreveu:
 Senhores, boa tarde.

 Em relação a codificação do banco, há alguma diferença entre usar
 LATIN1 ou UTF-8? Muda algo em relação a performance?


Recomendo fortemente UTF-8.

Não creio que, em termos de desempenho, exista alguma diferença
sensível, entre as duas codificações.

LATIN-1, e todas as codificações ISO-8859-x, são passado, o presente e
futuro é UTF-8.

Osvaldo
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


Re: [pgbr-geral] LATIN1 ou UTF-8

2013-07-16 Por tôpico Alexsandro Haag
O cuidado somente é com aplicações de terceiros. Algumas ainda utilizam
LATIN-1 e variantes como padrão, não funcionando ainda em UTF-8.




Em 16 de julho de 2013 18:49, Osvaldo Kussama
osvaldo.kuss...@gmail.comescreveu:

 Em 16/07/13, Carlos Antônio Pereira
 (VidaUTI)carlosanto...@utivida.com.br escreveu:
  Senhores, boa tarde.
 
  Em relação a codificação do banco, há alguma diferença entre usar
  LATIN1 ou UTF-8? Muda algo em relação a performance?
 

 Recomendo fortemente UTF-8.

 Não creio que, em termos de desempenho, exista alguma diferença
 sensível, entre as duas codificações.

 LATIN-1, e todas as codificações ISO-8859-x, são passado, o presente e
 futuro é UTF-8.

 Osvaldo
 ___
 pgbr-geral mailing list
 pgbr-geral@listas.postgresql.org.br
 https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral




-- 
Atenciosamente

Alexsandro Haag
http://alexsandrohaag.blogspot.com
skype: alex_hg
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


Re: [pgbr-geral] LATIN1 ou UTF-8

2013-07-16 Por tôpico Alessandro Gonçalves
Sabemos que utf-8 pode representar um conjunto de caracteres bem maior que
latin-1, tanto no postgresql quanto no mysql e acredito que em outros
softwares também.

Alguns caracteres que compõem utf-8 necessitam de até 3 bytes, se não me
engano 2 para armazenar o caracter e 1 byte para guardar a sua posição
enquanto em latin-1 os caracteres ocupam apenas 8 bits (1 byte).

Logo se usarmos utf-8 o tamanho do banco tende a ser maior com o tempo, se
a base for maior pior é isso em varios pontos como espaço em disco, backup
(Hoje em dia isso é muito barato) o que é mais caro hoje em questão de
estrutura é o IO.

Resumindo, na minha opnião:

Você precisa usar UTF-8? Sim. Então use, senão for necessário utilize
LATIN-1 que irá ocupar menos espaço em disco.

A se você for fazer um provedor de email por exemplo será obrigado a
utilizar UTF-8 codificação depende da sua real necessidade!

Pode ter certeza que existem outros pontos muito mais importantes para se
preocupar em questão de performance do que o charset do banco ou das
tabelas.






Em 16 de julho de 2013 18:57, Alexsandro Haag
alexsandro.h...@gmail.comescreveu:

 O cuidado somente é com aplicações de terceiros. Algumas ainda utilizam
 LATIN-1 e variantes como padrão, não funcionando ainda em UTF-8.




 Em 16 de julho de 2013 18:49, Osvaldo Kussama 
 osvaldo.kuss...@gmail.comescreveu:

 Em 16/07/13, Carlos Antônio Pereira
 (VidaUTI)carlosanto...@utivida.com.br escreveu:
  Senhores, boa tarde.
 
  Em relação a codificação do banco, há alguma diferença entre usar
  LATIN1 ou UTF-8? Muda algo em relação a performance?
 

 Recomendo fortemente UTF-8.

 Não creio que, em termos de desempenho, exista alguma diferença
 sensível, entre as duas codificações.

 LATIN-1, e todas as codificações ISO-8859-x, são passado, o presente e
 futuro é UTF-8.

 Osvaldo
 ___
 pgbr-geral mailing list
 pgbr-geral@listas.postgresql.org.br
 https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral




 --
 Atenciosamente

 Alexsandro Haag
 http://alexsandrohaag.blogspot.com
 skype: alex_hg


 ___
 pgbr-geral mailing list
 pgbr-geral@listas.postgresql.org.br
 https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral




-- 
*   *Alessandro Gonçalves
Programador de Sistemas para Web
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


Re: [pgbr-geral] LATIN1 ou UTF-8

2013-07-16 Por tôpico Osvaldo Kussama
Em 16/07/13, Alessandro Gonçalvesale...@gmail.com escreveu:
 Sabemos que utf-8 pode representar um conjunto de caracteres bem maior que
 latin-1, tanto no postgresql quanto no mysql e acredito que em outros
 softwares também.

 Alguns caracteres que compõem utf-8 necessitam de até 3 bytes, se não me
 engano 2 para armazenar o caracter e 1 byte para guardar a sua posição
 enquanto em latin-1 os caracteres ocupam apenas 8 bits (1 byte).

 Logo se usarmos utf-8 o tamanho do banco tende a ser maior com o tempo, se
 a base for maior pior é isso em varios pontos como espaço em disco, backup
 (Hoje em dia isso é muito barato) o que é mais caro hoje em questão de
 estrutura é o IO.

 Resumindo, na minha opnião:

 Você precisa usar UTF-8? Sim. Então use, senão for necessário utilize
 LATIN-1 que irá ocupar menos espaço em disco.

 A se você for fazer um provedor de email por exemplo será obrigado a
 utilizar UTF-8 codificação depende da sua real necessidade!

 Pode ter certeza que existem outros pontos muito mais importantes para se
 preocupar em questão de performance do que o charset do banco ou das
 tabelas.




Sigam a recomendação do Roberto Mello [1] e leiam:

O Mínimo Absoluto Que Todo Desenvolvedor De Software Absolutamente,
Positivamente Precisa Saber Sobre Unicode E Conjuntos de Caracteres
(Sem Desculpas!)
do Joel Spolsky
(apesar de ser de 2003 ainda tem que ser recomendado)
http://local.joelonsoftware.com/mediawiki/index.php/O_M%C3%ADnimo_Absoluto_Que_Todo_Desenvolvedor_de_Software_Absolutamente%2C_Positivamente_Precisa_Saber_Sobre_Unicode_e_Conjuntos_de_Caracteres_%28Sem_Desculpas!%29

e

Encoding Issues
de Susanne Ebrecht
http://www.divisiblebyfour.org/pool/pgencoding.pdf

Osvaldo

[1] 
http://blog.divisiblebyfour.org/2008/03/postgresql-e-codificaes-postgresql-and.html
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


[pgbr-geral] Latin1 ou UTF-8

2013-06-03 Por tôpico Gerson
Prezados boa tarde.

Qual a diferença entre esses dois charset? O que eu ganho e perco com cada
um? Obrigado a todos pelas respostas.

Ats,
Gerson Jr.
gersoncjun...@gmail.com
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


Re: [pgbr-geral] Latin1 ou UTF-8

2013-06-03 Por tôpico Fabrízio de Royes Mello
2013/6/3 Gerson gersoncjun...@gmail.com

 Prezados boa tarde.

 Qual a diferença entre esses dois charset? O que eu ganho e perco com
cada um? Obrigado a todos pelas respostas.


Gerson,

Em [1] vc encontra essa sua resposta.

Att,

[1]
http://stackoverflow.com/questions/7048745/what-is-the-difference-between-utf-8-and-iso-8859-1

--
Fabrízio de Royes Mello
Consultoria/Coaching PostgreSQL
 Blog sobre TI: http://fabriziomello.blogspot.com
 Perfil Linkedin: http://br.linkedin.com/in/fabriziomello
 Twitter: http://twitter.com/fabriziomello
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


Re: [pgbr-geral] Latin1 ou UTF-8

2013-06-03 Por tôpico Gerson
Fabrízio,

Muito obrigado, respondeu a minha dúvida. Neste caso, para uma aplicação a
ser executada aqui no Brasil, bastaria utilizar o Latin1 visto que não
precisaríamos do unicode porque a aplicação não seria multi idioma?

PS.: Essa questão do Latin1 x UTF-8 seria +/- como o que acontece nos
campos Varchar x NVarchar do Sql Server?

[]'s


Ats,
Gerson Jr.
gersoncjun...@gmail.com


Em 3 de junho de 2013 12:53, Fabrízio de Royes Mello 
fabriziome...@gmail.com escreveu:

 2013/6/3 Gerson gersoncjun...@gmail.com
 
  Prezados boa tarde.
 
  Qual a diferença entre esses dois charset? O que eu ganho e perco com
 cada um? Obrigado a todos pelas respostas.
 

 Gerson,

 Em [1] vc encontra essa sua resposta.

 Att,

 [1]
 http://stackoverflow.com/questions/7048745/what-is-the-difference-between-utf-8-and-iso-8859-1

 --
 Fabrízio de Royes Mello
 Consultoria/Coaching PostgreSQL
  Blog sobre TI: http://fabriziomello.blogspot.com
  Perfil Linkedin: http://br.linkedin.com/in/fabriziomello
  Twitter: http://twitter.com/fabriziomello

 ___
 pgbr-geral mailing list
 pgbr-geral@listas.postgresql.org.br
 https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


Re: [pgbr-geral] Latin1 ou UTF-8

2013-06-03 Por tôpico Osvaldo Kussama
Em 03/06/13, Gersongersoncjun...@gmail.com escreveu:
 Fabrízio,

 Muito obrigado, respondeu a minha dúvida. Neste caso, para uma aplicação a
 ser executada aqui no Brasil, bastaria utilizar o Latin1 visto que não
 precisaríamos do unicode porque a aplicação não seria multi idioma?

 PS.: Essa questão do Latin1 x UTF-8 seria +/- como o que acontece nos
 campos Varchar x NVarchar do Sql Server?


Leia este artigo:
http://blog.divisiblebyfour.org/2008/03/postgresql-e-codificaes-postgresql-and.html

Osvaldo
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


Re: [pgbr-geral] Latin1 ou UTF-8

2013-06-03 Por tôpico Gerson
Só mais uma dúvida, é possível depois de criado o banco mudar de Latin1
para UTF-8? Se sim, haverá perda de informação os os caracteres ficarão
loucos?


Ats,
Gerson Jr.
gersoncjun...@gmail.com


Em 3 de junho de 2013 13:02, Gerson gersoncjun...@gmail.com escreveu:

 Fabrízio,

 Muito obrigado, respondeu a minha dúvida. Neste caso, para uma aplicação a
 ser executada aqui no Brasil, bastaria utilizar o Latin1 visto que não
 precisaríamos do unicode porque a aplicação não seria multi idioma?

 PS.: Essa questão do Latin1 x UTF-8 seria +/- como o que acontece nos
 campos Varchar x NVarchar do Sql Server?

 []'s


 Ats,
 Gerson Jr.
 gersoncjun...@gmail.com


 Em 3 de junho de 2013 12:53, Fabrízio de Royes Mello 
 fabriziome...@gmail.com escreveu:

  2013/6/3 Gerson gersoncjun...@gmail.com
 
  Prezados boa tarde.
 
  Qual a diferença entre esses dois charset? O que eu ganho e perco com
 cada um? Obrigado a todos pelas respostas.
 

 Gerson,

 Em [1] vc encontra essa sua resposta.

 Att,

 [1]
 http://stackoverflow.com/questions/7048745/what-is-the-difference-between-utf-8-and-iso-8859-1

 --
 Fabrízio de Royes Mello
 Consultoria/Coaching PostgreSQL
  Blog sobre TI: http://fabriziomello.blogspot.com
  Perfil Linkedin: http://br.linkedin.com/in/fabriziomello
  Twitter: http://twitter.com/fabriziomello

 ___
 pgbr-geral mailing list
 pgbr-geral@listas.postgresql.org.br
 https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral



___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


Re: [pgbr-geral] Latin1 ou UTF-8

2013-06-03 Por tôpico Alexsander Rosa
Em 3 de junho de 2013 12:49, Gerson gersoncjun...@gmail.com escreveu:

 Prezados boa tarde.

 Qual a diferença entre esses dois charset? O que eu ganho e perco com cada
 um? Obrigado a todos pelas respostas.

 Ats,
 Gerson Jr.
 gersoncjun...@gmail.com


UTF-8 sem a menor sombra de dúvida. LATIN1 é coisa do século passado.

-- 
Atenciosamente,
Alexsander da Rosa
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


Re: [pgbr-geral] Latin1 ou UTF-8

2013-06-03 Por tôpico Dickson S. Guedes
Em Seg, 2013-06-03 às 12:49 -0300, Gerson escreveu:
 Prezados boa tarde.
 
 Qual a diferença entre esses dois charset? O que eu ganho e perco com cada
 um? Obrigado a todos pelas respostas.


Os demais colegas já nos presentearam com informações valiosas, mas como
não vi alguém citar os links abaixo segue um texto interessante:


http://www.joelonsoftware.com/articles/Unicode.html

Uma versão tupiniquim pode ser encontrada em:

http://local.joelonsoftware.com/wiki/O_M%C3%
ADnimo_Absoluto_Que_Todos_os_Programadores_de_Software_Precisam,_Absolutamente,_Positivamente_de_Saber_Sobre_Unicode_e_Conjuntos_de_Caracteres_(Sem_Desculpas!)


[]s
-- 
Dickson S. Guedes
mail/xmpp: gue...@guedesoft.net - skype: guediz
http://guedesoft.net - http://www.postgresql.org.br
http://www.rnp.br/keyserver/pks/lookup?search=0x8F3E3C06D428D10A


signature.asc
Description: This is a digitally signed message part
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral


Re: [pgbr-geral] Latin1 ou UTF-8

2013-06-03 Por tôpico Tiago Adami
Em 3 de junho de 2013 13:59, Fabrízio de Royes Mello
fabriziome...@gmail.com escreveu:
 A questão não é idioma e sim o conjunto de caracteres que o teu encoding
 suporta... vc pode ter uma app com LATIN1 em idiomas como português, inglês
 e espanhol. O que acontece é que alguns idiomas estrangeiros tem um alfabeto
 diferente e consequentemente se encaixam em outro encoding, então nesse caso
 vc precisa de um que suporte isso.

Para complementar sem retirar nada dos links anteriores
(principalmente O Mínimo Absoluto...): se você usar alguma
ferramenta de desenvolvimento antiga que não tenha suporte total ao
UTF-8, minha recomendação pessoal é que você não fuja do LATIN1. Se
usar ferramentas mais atuais, pode - ou deve - usar UTF-8 sem maiores
problemas.


--
TIAGO J. ADAMI
http://www.adamiworks.com
@tiadami
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral