O grupo no qual você está postando é um grupo da Usenet. As mensagens postadas neste grupo farão com que o seu e-mail fique visível para qualquer pessoa na internet.
Gostaria de saber qual é a melhor codificação para os conjuntos -
BROWSER / TEXTO / BANCO DE DADOS?
Hoje com a diversificação de browsers, temos vários tratamentos a ser
feitos, porém ainda encontro muitos sites com esse problema de
codificação e tivemos esse mesmo problema com acentuação.
Tem uma forma prática que solucione esse problema?
Qual eh a formatação do banco?
No head do Html?
Browser precisa ser ajustado algo?
Mudaria algo se o "usuário" acesse de outro PAÍS?
Acho q isso conseguiria ajudar a todos que tem esse mesmo problema.
A recomendação é usar sempre UTF-8. Mas no caso os browser ocidentais estão em iso-8859-1, mas isso não tem problema, pois o navegador já retorna o ASCII.
Mas para o xhtml/php/banco de dados é recomendável sempre usar UTF-8 por ele suportar às mais variadas linguas.
> Date: Sun, 1 Nov 2009 03:08:40 -0800
> Subject: [ PHP - Google ] UTF-8 ou ISO-8859-1? qual dessas eh a melhor formatação?
> From: andre.nova...@gmail.com
> To: listaphp@googlegroups.com
> Gostaria de saber qual é a melhor codificação para os conjuntos -
> BROWSER / TEXTO / BANCO DE DADOS?
> Hoje com a diversificação de browsers, temos vários tratamentos a ser
> feitos, porém ainda encontro muitos sites com esse problema de
> codificação e tivemos esse mesmo problema com acentuação.
> Tem uma forma prática que solucione esse problema?
> Qual eh a formatação do banco?
> No head do Html?
> Browser precisa ser ajustado algo?
> Mudaria algo se o "usuário" acesse de outro PAÍS?
> Acho q isso conseguiria ajudar a todos que tem esse mesmo problema.
> Gostaria de saber qual é a melhor codificação para os conjuntos -
> BROWSER / TEXTO / BANCO DE DADOS?
> Hoje com a diversificação de browsers, temos vários tratamentos a ser
> feitos, porém ainda encontro muitos sites com esse problema de
> codificação e tivemos esse mesmo problema com acentuação.
> Tem uma forma prática que solucione esse problema?
> Qual eh a formatação do banco?
> No head do Html?
> Browser precisa ser ajustado algo?
> Mudaria algo se o "usuário" acesse de outro PAÍS?
> Acho q isso conseguiria ajudar a todos que tem esse mesmo problema.
Já codei algumas aplicações que utlizavam nl (Holandês) e de_de
(Alemão), alem de ingles para visualização (camada da view).
Sempre utilizei codificação UTF-8, e nunca tive problemas com
caracteres estrangeiros.
É importante salientar que o encoding do teu arquivo, onde estás
escrevendo teu código, também esteja codificado em UTF-8.
Nós utilizavamos uma função para verificação da linguagem do browser
do cliente (caso não fosse nem "de" nem "nl" ele setava a linguagem da
aplicação para inglês)
Nunca tive problema algum na apresentação dos dados. Aconcelho
fortemente a utilização de UTF-8 na codificação dos arquivos e nos
headers do html. ;D
> Já codei algumas aplicações que utlizavam nl (Holandês) e de_de
> (Alemão), alem de ingles para visualização (camada da view).
> Sempre utilizei codificação UTF-8, e nunca tive problemas com
> caracteres estrangeiros.
> É importante salientar que o encoding do teu arquivo, onde estás
> escrevendo teu código, também esteja codificado em UTF-8.
> Nós utilizavamos uma função para verificação da linguagem do browser
> do cliente (caso não fosse nem "de" nem "nl" ele setava a linguagem da
> aplicação para inglês)
> Nunca tive problema algum na apresentação dos dados. Aconcelho
> fortemente a utilização de UTF-8 na codificação dos arquivos e nos
> headers do html. ;D
Cara.. esse assunto é complicado de mais.
A melhor solução que já encontrei foi: Tudo em UTF-8
Tudo mesmo. Só precisa q UM arquivo esteja diferente pra dar tudo errado..
Ontem mesmo estava quebrando minha cabeça tentando achar esse tal
arquivo...Se for de configuração então, é complicado, pois afetará o sistema
inteiro...
Alguém aqui já ouviu falar de uma ferramenta que converta múltiplos arquivos
para uma codificação?
Eu achei essa <http://winvnkey.sourceforge.net/main.html> ontem, mas não
testei ainda. Alguém conhece outra, ou até mesmo já testou essa?
> > Já codei algumas aplicações que utlizavam nl (Holandês) e de_de
> > (Alemão), alem de ingles para visualização (camada da view).
> > Sempre utilizei codificação UTF-8, e nunca tive problemas com
> > caracteres estrangeiros.
> > É importante salientar que o encoding do teu arquivo, onde estás
> > escrevendo teu código, também esteja codificado em UTF-8.
> > Nós utilizavamos uma função para verificação da linguagem do browser
> > do cliente (caso não fosse nem "de" nem "nl" ele setava a linguagem da
> > aplicação para inglês)
> > Nunca tive problema algum na apresentação dos dados. Aconcelho
> > fortemente a utilização de UTF-8 na codificação dos arquivos e nos
> > headers do html. ;D
Aqui na minha empresa para não termos problemas com acentos(Flex) e
codificação (HTML), padronizamos tudo para UTF-8. Esta codificação vale
desde o banco de dados até tabelas.
COLLATE utf8_general_ci
utf8 - *U**TF-8*
***general - Geral*
ci - *C*ase *I*nsensitive - Sem diferenciar maiúsculas e minúsculas.
Base de dados:
CREATE DATABASE `basededados` DEFAULT CHARACTER SET utf8 COLLATE
utf8_general_ci;
Tabelas
*CREATE TABLE `basededados `.`tabela` (
`nome` VARCHAR( 255 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL
) ENGINE = MYISAM CHARACTER SET utf8 COLLATE utf8_general_ci*
Para que o MySql faça automáticamente as tabelas como UTF-8 adicione a
seguinte linha no *config.inc.php*
$cfg['DefaultCharset'] = 'utf8_general_ci';
No HTML vai a seguinte informação:
<meta http-equiv="Content-Type" content="txt/html; charset="utf-8" />
Todos os arquivos criados estão na codificação UTF-8.
[image:
?ui=2&view=att&th=124b6ec1aa795e65&attid=0.1&disp=attd&realattid=ii_124b6ec 1aa795e65&zw]
> Gostaria de saber qual é a melhor codificação para os conjuntos -
> BROWSER / TEXTO / BANCO DE DADOS?
> Hoje com a diversificação de browsers, temos vários tratamentos a ser
> feitos, porém ainda encontro muitos sites com esse problema de
> codificação e tivemos esse mesmo problema com acentuação.
> Tem uma forma prática que solucione esse problema?
> Qual eh a formatação do banco?
> No head do Html?
> Browser precisa ser ajustado algo?
> Mudaria algo se o "usuário" acesse de outro PAÍS?
> Acho q isso conseguiria ajudar a todos que tem esse mesmo problema.
> Já codei algumas aplicações que utlizavam nl (Holandês) e de_de
> (Alemão), alem de ingles para visualização (camada da view).
> Sempre utilizei codificação UTF-8, e nunca tive problemas com
> caracteres estrangeiros.
> É importante salientar que o encoding do teu arquivo, onde estás
> escrevendo teu código, também esteja codificado em UTF-8.
> Nós utilizavamos uma função para verificação da linguagem do browser
> do cliente (caso não fosse nem "de" nem "nl" ele setava a linguagem da
> aplicação para inglês)
> Nunca tive problema algum na apresentação dos dados. Aconcelho
> fortemente a utilização de UTF-8 na codificação dos arquivos e nos
> headers do html. ;D
@José Cláudio
Se voce usa o linux é só fazer um script assim:
#!/bin/sh
# convert.sh
# Aqui coloque o diretorio que deseja mandar os arquivos alterados
# recomendo não colocar no diretório original, pois pode haver algum
problema
# e corromper o seu trabalho
novo_project="/home/jose/meu_novo_projeto"
for arquivo in `ls`
do
iconv -f iso-8859-1 -t utf-8 $arquivo > "$novo_project/$arquivo"
done
> Cara.. esse assunto é complicado de mais.
> A melhor solução que já encontrei foi: Tudo em UTF-8
> Tudo mesmo. Só precisa q UM arquivo esteja diferente pra dar tudo errado..
> Ontem mesmo estava quebrando minha cabeça tentando achar esse tal
> arquivo...Se for de configuração então, é complicado, pois afetará o sistema
> inteiro...
> Alguém aqui já ouviu falar de uma ferramenta que converta múltiplos arquivos
> para uma codificação?
> Eu achei essa <http://winvnkey.sourceforge.net/main.html> ontem, mas não
> testei ainda. Alguém conhece outra, ou até mesmo já testou essa?
> > > Já codei algumas aplicações que utlizavam nl (Holandês) e de_de
> > > (Alemão), alem de ingles para visualização (camada da view).
> > > Sempre utilizei codificação UTF-8, e nunca tive problemas com
> > > caracteres estrangeiros.
> > > É importante salientar que o encoding do teu arquivo, onde estás
> > > escrevendo teu código, também esteja codificado em UTF-8.
> > > Nós utilizavamos uma função para verificação da linguagem do browser
> > > do cliente (caso não fosse nem "de" nem "nl" ele setava a linguagem da
> > > aplicação para inglês)
> > > Nunca tive problema algum na apresentação dos dados. Aconcelho
> > > fortemente a utilização de UTF-8 na codificação dos arquivos e nos
> > > headers do html. ;D
> @José Cláudio
> Se voce usa o linux é só fazer um script assim:
> #!/bin/sh
> # convert.sh
> # Aqui coloque o diretorio que deseja mandar os arquivos alterados
> # recomendo não colocar no diretório original, pois pode haver algum
> problema
> # e corromper o seu trabalho
> novo_project="/home/jose/meu_novo_projeto"
> for arquivo in `ls`
> do
> iconv -f iso-8859-1 -t utf-8 $arquivo > "$novo_project/$arquivo"
> done
> On 2 nov, 14:27, José Cláudio Medeiros de Lima <klaw...@gmail.com>
> wrote:
> > Cara.. esse assunto é complicado de mais.
> > A melhor solução que já encontrei foi: Tudo em UTF-8
> > Tudo mesmo. Só precisa q UM arquivo esteja diferente pra dar tudo errado..
> > Ontem mesmo estava quebrando minha cabeça tentando achar esse tal
> > arquivo...Se for de configuração então, é complicado, pois afetará o sistema
> > inteiro...
> > Alguém aqui já ouviu falar de uma ferramenta que converta múltiplos arquivos
> > para uma codificação?
> > Eu achei essa <http://winvnkey.sourceforge.net/main.html> ontem, mas não
> > testei ainda. Alguém conhece outra, ou até mesmo já testou essa?
> > > > Já codei algumas aplicações que utlizavam nl (Holandês) e de_de
> > > > (Alemão), alem de ingles para visualização (camada da view).
> > > > Sempre utilizei codificação UTF-8, e nunca tive problemas com
> > > > caracteres estrangeiros.
> > > > É importante salientar que o encoding do teu arquivo, onde estás
> > > > escrevendo teu código, também esteja codificado em UTF-8.
> > > > Nós utilizavamos uma função para verificação da linguagem do browser
> > > > do cliente (caso não fosse nem "de" nem "nl" ele setava a linguagem da
> > > > aplicação para inglês)
> > > > Nunca tive problema algum na apresentação dos dados. Aconcelho
> > > > fortemente a utilização de UTF-8 na codificação dos arquivos e nos
> > > > headers do html. ;D
> @José Cláudio
> Se voce usa o linux é só fazer um script assim:
> #!/bin/sh
> # convert.sh
> # Aqui coloque o diretorio que deseja mandar os arquivos alterados
> # recomendo não colocar no diretório original, pois pode haver algum
> problema
> # e corromper o seu trabalho
> novo_project="/home/jose/meu_novo_projeto"
> for arquivo in `ls`
> do
> iconv -f iso-8859-1 -t utf-8 $arquivo > "$novo_project/$arquivo"
> done
> On 2 nov, 14:27, José Cláudio Medeiros de Lima <klaw...@gmail.com>
> wrote:
> > Cara.. esse assunto é complicado de mais.
> > A melhor solução que já encontrei foi: Tudo em UTF-8
> > Tudo mesmo. Só precisa q UM arquivo esteja diferente pra dar tudo
> errado..
> > Ontem mesmo estava quebrando minha cabeça tentando achar esse tal
> > arquivo...Se for de configuração então, é complicado, pois afetará o
> sistema
> > inteiro...
> > Alguém aqui já ouviu falar de uma ferramenta que converta múltiplos
> arquivos
> > para uma codificação?
> > Eu achei essa <http://winvnkey.sourceforge.net/main.html> ontem, mas não
> > testei ainda. Alguém conhece outra, ou até mesmo já testou essa?
> > > > Já codei algumas aplicações que utlizavam nl (Holandês) e de_de
> > > > (Alemão), alem de ingles para visualização (camada da view).
> > > > Sempre utilizei codificação UTF-8, e nunca tive problemas com
> > > > caracteres estrangeiros.
> > > > É importante salientar que o encoding do teu arquivo, onde estás
> > > > escrevendo teu código, também esteja codificado em UTF-8.
> > > > Nós utilizavamos uma função para verificação da linguagem do browser
> > > > do cliente (caso não fosse nem "de" nem "nl" ele setava a linguagem
> da
> > > > aplicação para inglês)
> > > > Nunca tive problema algum na apresentação dos dados. Aconcelho
> > > > fortemente a utilização de UTF-8 na codificação dos arquivos e nos
> > > > headers do html. ;D
> 2009/11/2 Tiago Natel de Moura <tiago_mo...@live.com>
>> @José Cláudio
>> Se voce usa o linux é só fazer um script assim:
>> #!/bin/sh
>> # convert.sh
>> # Aqui coloque o diretorio que deseja mandar os arquivos alterados
>> # recomendo não colocar no diretório original, pois pode haver algum
>> problema
>> # e corromper o seu trabalho
>> novo_project="/home/jose/meu_novo_projeto"
>> for arquivo in `ls`
>> do
>> iconv -f iso-8859-1 -t utf-8 $arquivo > "$novo_project/$arquivo"
>> done
>> On 2 nov, 14:27, José Cláudio Medeiros de Lima <klaw...@gmail.com>
>> wrote:
>> > Cara.. esse assunto é complicado de mais.
>> > A melhor solução que já encontrei foi: Tudo em UTF-8
>> > Tudo mesmo. Só precisa q UM arquivo esteja diferente pra dar tudo
>> errado..
>> > Ontem mesmo estava quebrando minha cabeça tentando achar esse tal
>> > arquivo...Se for de configuração então, é complicado, pois afetará o
>> sistema
>> > inteiro...
>> > Alguém aqui já ouviu falar de uma ferramenta que converta múltiplos
>> arquivos
>> > para uma codificação?
>> > Eu achei essa <http://winvnkey.sourceforge.net/main.html> ontem, mas
>> não
>> > testei ainda. Alguém conhece outra, ou até mesmo já testou essa?
>> > > > Já codei algumas aplicações que utlizavam nl (Holandês) e de_de
>> > > > (Alemão), alem de ingles para visualização (camada da view).
>> > > > Sempre utilizei codificação UTF-8, e nunca tive problemas com
>> > > > caracteres estrangeiros.
>> > > > É importante salientar que o encoding do teu arquivo, onde estás
>> > > > escrevendo teu código, também esteja codificado em UTF-8.
>> > > > Nós utilizavamos uma função para verificação da linguagem do browser
>> > > > do cliente (caso não fosse nem "de" nem "nl" ele setava a linguagem
>> da
>> > > > aplicação para inglês)
>> > > > Nunca tive problema algum na apresentação dos dados. Aconcelho
>> > > > fortemente a utilização de UTF-8 na codificação dos arquivos e nos
>> > > > headers do html. ;D
Na verdade este é o mínimo que um programador tem que saber. Se não souber a
diferença de UTF-8 e ISO-8859-1 não é programador. Apenas ele se diz
programador. *
Eduardo Kraus*
Desenvolvedor
eduardokr...@gmail.com
blog.mxml.com.br
www.twitter.com/EduardoKraus
Ta sendo totalmente ignorante em sua fala, não é só porque vocë sabe, que
todos devem saber, e uma coisa não liga a outra, para ser programador agora
tenho que saber a diferença entre ambos? Ta maluco? E outra cara,
programador não precisa saber disso, em um ciclo de produção de software, o
programador não tem contato nem com o HTML muito menos com o banco dados em
si, então onde ele precisa saber disso?
Sendo que a solução deste problema está no META e no Collate e Charset do
banco...
@Topic.
Muito boa as respostas, obrigado galera aprendi muito com tudo que foi
passado aqui, sempre tive duvidas sobre isso, @Julio Protzek muito obrigado
por passar esse link achei bem interessante.
> Na verdade este é o mínimo que um programador tem que saber. Se não souber
> a diferença de UTF-8 e ISO-8859-1 não é programador. Apenas ele se diz
> programador. *
> Eduardo Kraus*
> Desenvolvedor
> eduardokr...@gmail.com
> blog.mxml.com.br
> www.twitter.com/EduardoKraus
> 2009/11/3 Julio Protzek <julioprot...@gmail.com>
> Esse assunto é simples quando se entende o que está acontecendo.
>> Leia e recomende a todos programadores que leiam também:
Meio infeliz e sem lógica esta colocação, nada haver...
[]s
Luiz Escobar - http://www.megasistema.com.br ============================================
Harbour 2.0.0beta3(Rev.12624) (DbfNtx+MySQL)
MiniGUI 1.7 Extended (Build 74)-2009.09.30
BCC 5.8.2 (Turbo C++ Explorer 2006)
--------------------------------------------
XAMPP 1.7.1 (Apache+MySQL+PHP+(Linux/Win))
FLEX 3.0 (iniciante)
--------------------------------------------
Delphi ( 6 PRO & 7 Ent ) (DBF/NTX+MySQL)
============================================
AMD ? AiMeuDeus Ñ!, Sou + Intel....
From: Eduardo Kraus Sent: Tuesday, November 03, 2009 11:28 PM
To: listaphp@googlegroups.com Subject: [ PHP - Google ] Re: UTF-8 ou ISO-8859-1? qual dessas eh a melhor formatação?
Na verdade este é o mínimo que um programador tem que saber. Se não souber a diferença de UTF-8 e ISO-8859-1 não é programador. Apenas ele se diz programador.
Prezados estava tendo problema de codificação no meu projeto, estava
ocorrendo de aparecer uns caracteres estranhos na página, utilizando aqui no
meu servidor local e na web. Eu usava ISO-8859-1.
Após ler esta discussão resolvi mudar tudo pra UTF-8 e transformei os
arquivos para UTF-8 sem BOM, como mencionado aqui.
Ok, localmente ficou tudo certo, mas quando uso meu sistema na web e vou
salvar algo no banco de dados MySQL que contenha acento ele distorce o
caracter, por exemplo, digito á e ele salva á .
o que pode estar ocorrendo? sendo que localmente eu uso o banco da web ?
> *From:* Eduardo Kraus <eduardokr...@gmail.com>
> *Sent:* Tuesday, November 03, 2009 11:28 PM
> *To:* listaphp@googlegroups.com
> *Subject:* [ PHP - Google ] Re: UTF-8 ou ISO-8859-1? qual dessas eh a
> melhor formatação?
> Na verdade este é o mínimo que um programador tem que saber. Se não
> souber a diferença de UTF-8 e ISO-8859-1 não é programador. Apenas ele se
> diz programador. *
> Eduardo Kraus*
> Desenvolvedor
> eduardokr...@gmail.com
> blog.mxml.com.br
> www.twitter.com/EduardoKraus
> 2009/11/3 Julio Protzek <julioprot...@gmail.com>
>> Esse assunto é simples quando se entende o que está acontecendo.
>> Leia e recomende a todos programadores que leiam também:
Isso pode ocorrer por vários fatores.
Em primeiro lugar... qual o collate dos campos, da tabela e do banco de dados? aconselhável utf8_bin.
Qual o charset que está usando na conexão com o mysql? Geralmente o padrão é latin7. Aconselhável nesse caso utf8 (mysql_set_charset('utf8') ou $mysqli->set_charset('utf8'))
Ano passado postei em meu blog a minha solução para este problema. De lá pra cá nunca mais tive problemas com charset, a menos com "softwares" de terceiros ... hehe
> Prezados estava tendo problema de codificação no meu projeto, estava > ocorrendo de aparecer uns caracteres estranhos na página, utilizando > aqui no meu servidor local e na web. Eu usava ISO-8859-1.
> Após ler esta discussão resolvi mudar tudo pra UTF-8 e transformei os > arquivos para UTF-8 sem BOM, como mencionado aqui.
> Ok, localmente ficou tudo certo, mas quando uso meu sistema na web e > vou salvar algo no banco de dados MySQL que contenha acento ele > distorce o caracter, por exemplo, digito á e ele salva á .
> o que pode estar ocorrendo? sendo que localmente eu uso o banco da web ?
> *From:* Eduardo Kraus <mailto:eduardokr...@gmail.com>
> *Sent:* Tuesday, November 03, 2009 11:28 PM
> *To:* listaphp@googlegroups.com <mailto:listaphp@googlegroups.com>
> *Subject:* [ PHP - Google ] Re: UTF-8 ou ISO-8859-1? qual dessas
> eh a melhor formatação?
> Na verdade este é o mínimo que um programador tem que saber. Se
> não souber a diferença de UTF-8 e ISO-8859-1 não é programador.
> Apenas ele se diz programador.
> *
> Eduardo Kraus*
> Desenvolvedor
> eduardokr...@gmail.com <mailto:eduardokr...@gmail.com>
> blog.mxml.com.br <http://blog.mxml.com.br/>
> www.twitter.com/EduardoKraus <http://www.twitter.com/EduardoKraus>
> 2009/11/3 Julio Protzek <julioprot...@gmail.com
> <mailto:julioprot...@gmail.com>>
Prezados, minha aplicação usa o zend framework, estou citando pois pode
precisar fazer alguma alteração nele que talvez não esteja fazendo.
Todas as páginas usam a meta tag content-type e coloco como utf-8 , o banco
estava latin, mudei para utf-8 e não mudou em nada o problema
todos os arquivos estão salvos como utf-8 sem BOM pelo notepad++ e meu
eclipse também está configurado para salvar os arquivos como utf-8.
Quando usa minha aplicação LOCAL, pc windows 7, que utiliza o banco da web e
vou salvar algo com acentro fica guardado desta maneira no banco.
ex.: conteúdo =>(no banco)conteúdo
Quando uso minha aplicação no servidor da web, que é linux:
Ex.: conteúdo =>(no banco)conteúdo
ou seja, na web ele não está salvando de maneira correta, será alguma coisa
do servidor?? pois todos meus arquivos locais estão na web no mesmo estado.
Atenciosamente,
Danilo Portela
2009/11/4 Michel Wilhelm <michelwilh...@gmail.com>
> Isso pode ocorrer por vários fatores.
> Em primeiro lugar... qual o collate dos campos, da tabela e do banco de
> dados? aconselhável utf8_bin.
> Qual o charset que está usando na conexão com o mysql? Geralmente o
> padrão é latin7. Aconselhável nesse caso utf8 (mysql_set_charset('utf8')
> ou $mysqli->set_charset('utf8'))
> Ano passado postei em meu blog a minha solução para este problema. De lá
> pra cá nunca mais tive problemas com charset, a menos com "softwares" de
> terceiros ... hehe
> Que a moderação me perdoe o link mas pode resolver o problema aqui exposto.
> Danilo Portela escreveu:
> > Prezados estava tendo problema de codificação no meu projeto, estava
> > ocorrendo de aparecer uns caracteres estranhos na página, utilizando
> > aqui no meu servidor local e na web. Eu usava ISO-8859-1.
> > Após ler esta discussão resolvi mudar tudo pra UTF-8 e transformei os
> > arquivos para UTF-8 sem BOM, como mencionado aqui.
> > Ok, localmente ficou tudo certo, mas quando uso meu sistema na web e
> > vou salvar algo no banco de dados MySQL que contenha acento ele
> > distorce o caracter, por exemplo, digito á e ele salva á .
> > o que pode estar ocorrendo? sendo que localmente eu uso o banco da web ?
> > *From:* Eduardo Kraus <mailto:eduardokr...@gmail.com>
> > *Sent:* Tuesday, November 03, 2009 11:28 PM
> > *To:* listaphp@googlegroups.com <mailto:listaphp@googlegroups.com>
> > *Subject:* [ PHP - Google ] Re: UTF-8 ou ISO-8859-1? qual dessas
> > eh a melhor formatação?
> > Na verdade este é o mínimo que um programador tem que saber. Se
> > não souber a diferença de UTF-8 e ISO-8859-1 não é programador.
> > Apenas ele se diz programador.
> > *
> > Eduardo Kraus*
> > Desenvolvedor
> > eduardokr...@gmail.com <mailto:eduardokr...@gmail.com>
> > blog.mxml.com.br <http://blog.mxml.com.br/>
> > www.twitter.com/EduardoKraus <http://www.twitter.com/EduardoKraus>
> > 2009/11/3 Julio Protzek <julioprot...@gmail.com
> > <mailto:julioprot...@gmail.com>>
> > Esse assunto é simples quando se entende o que está acontecendo.
> > Leia e recomende a todos programadores que leiam também:
Todas estas alterações de banco e arquivos foram replicadas?
/* Arquivos quando só altera o tipo, é aconselhável antes apagar os arquivos
remotos antes de enviar novos. */
*
Eduardo Kraus*
Desenvolvedor
eduardokr...@gmail.com
blog.mxml.com.br
www.twitter.com/EduardoKraus
> Prezados, minha aplicação usa o zend framework, estou citando pois pode
> precisar fazer alguma alteração nele que talvez não esteja fazendo.
> Todas as páginas usam a meta tag content-type e coloco como utf-8 , o banco
> estava latin, mudei para utf-8 e não mudou em nada o problema
> todos os arquivos estão salvos como utf-8 sem BOM pelo notepad++ e meu
> eclipse também está configurado para salvar os arquivos como utf-8.
> Quando usa minha aplicação LOCAL, pc windows 7, que utiliza o banco da web
> e vou salvar algo com acentro fica guardado desta maneira no banco.
> ex.: conteúdo =>(no banco)conteúdo
> Quando uso minha aplicação no servidor da web, que é linux:
> Ex.: conteúdo =>(no banco)conteúdo
> ou seja, na web ele não está salvando de maneira correta, será alguma coisa
> do servidor?? pois todos meus arquivos locais estão na web no mesmo estado.
> Atenciosamente,
> Danilo Portela
> 2009/11/4 Michel Wilhelm <michelwilh...@gmail.com>
>> Isso pode ocorrer por vários fatores.
>> Em primeiro lugar... qual o collate dos campos, da tabela e do banco de
>> dados? aconselhável utf8_bin.
>> Qual o charset que está usando na conexão com o mysql? Geralmente o
>> padrão é latin7. Aconselhável nesse caso utf8 (mysql_set_charset('utf8')
>> ou $mysqli->set_charset('utf8'))
>> Ano passado postei em meu blog a minha solução para este problema. De lá
>> pra cá nunca mais tive problemas com charset, a menos com "softwares" de
>> terceiros ... hehe
>> Que a moderação me perdoe o link mas pode resolver o problema aqui
>> exposto.
>> Danilo Portela escreveu:
>> > Prezados estava tendo problema de codificação no meu projeto, estava
>> > ocorrendo de aparecer uns caracteres estranhos na página, utilizando
>> > aqui no meu servidor local e na web. Eu usava ISO-8859-1.
>> > Após ler esta discussão resolvi mudar tudo pra UTF-8 e transformei os
>> > arquivos para UTF-8 sem BOM, como mencionado aqui.
>> > Ok, localmente ficou tudo certo, mas quando uso meu sistema na web e
>> > vou salvar algo no banco de dados MySQL que contenha acento ele
>> > distorce o caracter, por exemplo, digito á e ele salva á .
>> > o que pode estar ocorrendo? sendo que localmente eu uso o banco da web ?
>> > *From:* Eduardo Kraus <mailto:eduardokr...@gmail.com>
>> > *Sent:* Tuesday, November 03, 2009 11:28 PM
>> > *To:* listaphp@googlegroups.com <mailto:listaphp@googlegroups.com>
>> > *Subject:* [ PHP - Google ] Re: UTF-8 ou ISO-8859-1? qual dessas
>> > eh a melhor formatação?
>> > Na verdade este é o mínimo que um programador tem que saber. Se
>> > não souber a diferença de UTF-8 e ISO-8859-1 não é programador.
>> > Apenas ele se diz programador.
>> > *
>> > Eduardo Kraus*
>> > Desenvolvedor
>> > eduardokr...@gmail.com <mailto:eduardokr...@gmail.com>
>> > blog.mxml.com.br <http://blog.mxml.com.br/>
>> > www.twitter.com/EduardoKraus <http://www.twitter.com/EduardoKraus>
>> > 2009/11/3 Julio Protzek <julioprot...@gmail.com
>> > <mailto:julioprot...@gmail.com>>
>> > Esse assunto é simples quando se entende o que está acontecendo.
>> > Leia e recomende a todos programadores que leiam também:
> *From:* Eduardo Kraus <eduardokr...@gmail.com>
> *Sent:* Tuesday, November 03, 2009 11:28 PM
> *To:* listaphp@googlegroups.com
> *Subject:* [ PHP - Google ] Re: UTF-8 ou ISO-8859-1? qual dessas eh a
> melhor formatação?
> Na verdade este é o mínimo que um programador tem que saber. Se não
> souber a diferença de UTF-8 e ISO-8859-1 não é programador. Apenas ele se
> diz programador. *
> Eduardo Kraus*
> Desenvolvedor
> eduardokr...@gmail.com
> blog.mxml.com.br
> www.twitter.com/EduardoKraus
> 2009/11/3 Julio Protzek <julioprot...@gmail.com>
>> Esse assunto é simples quando se entende o que está acontecendo.
>> Leia e recomende a todos programadores que leiam também:
Só que esta página não contem mais conteúdo algum!
=/
........................................................................... ..........................................................
Janes Roberto da Costa
Analista de Sistemas (TAIG)
SEDUC-Secretaria de Estado de Educação de Mato Grosso
www.seduc.mt.gov.br<http://www.seduc.mt.gov.br/>
COT-Coordenadoria de Tecnologia da Informação
Telefone: (65) 3613-6394
E-mail: janes.co...@seduc.mt.gov.br<mailto:janes.co...@seduc.mt.gov.br>
"Se, pois, o Filho do Homem vos libertar, verdadeiramente sereis livres.
E conhecereis a verdade, e a verdade vos libertará." (João 8:32;36)
De: listaphp@googlegroups.com [mailto:listaphp@googlegroups.com] Em nome de Alessandro Santos
Enviada em: quinta-feira, 5 de novembro de 2009 06:40
Para: listaphp@googlegroups.com
Assunto: [ PHP - Google ] Re: UTF-8 ou ISO-8859-1? qual dessas eh a melhor formatação?
Também acho. Mas seria ideal que o programador entendesse UTF-8, então:
Eu sempre mando esse link aqui na lista :)
2009/11/4 Luiz Escobar <esco...@megasistema.com.br<mailto:esco...@megasistema.com.br>>
Meio infeliz e sem lógica esta colocação, nada haver...
[]s
Luiz Escobar - http://www.megasistema.com.br ============================================
Harbour 2.0.0beta3(Rev.12624) (DbfNtx+MySQL)
MiniGUI 1.7 Extended (Build 74)-2009.09.30
BCC 5.8.2 (Turbo C++ Explorer 2006)
--------------------------------------------
XAMPP 1.7.1 (Apache+MySQL+PHP+(Linux/Win))
FLEX 3.0 (iniciante)
--------------------------------------------
Delphi ( 6 PRO & 7 Ent ) (DBF/NTX+MySQL)
============================================
AMD ? AiMeuDeus Ñ!, Sou + Intel....
From: Eduardo Kraus<mailto:eduardokr...@gmail.com>
Sent: Tuesday, November 03, 2009 11:28 PM
To: listaphp@googlegroups.com<mailto:listaphp@googlegroups.com>
Subject: [ PHP - Google ] Re: UTF-8 ou ISO-8859-1? qual dessas eh a melhor formatação?
Na verdade este é o mínimo que um programador tem que saber. Se não souber a diferença de UTF-8 e ISO-8859-1 não é programador. Apenas ele se diz programador.
Olá pessoal!
Como um dos objetivos deste blog é apresentar soluções para problemas
cotidianos, hoje eu vou falar sobre um problema que enfrentei utilizando a
codificação UTF-8 BOM em minhas páginas e sinceramente, até a pouco eu não
sabia a diferença entre o UTF-8 sem o BOM e o UTF-8 com o BOM.
O Problema
Quando usamos paginas codificadas em UTF-8, em alguns user
agents<http://en.wikipedia.org/wiki/User_agent>eu recebo algumas
linhas extras ou caracteres não esperados no TOPO do
documento ou no TOPO de arquivos incluídos… como eu removo estes caracteres?
Resposta
Se você trabalha com um arquivo codificado em UTF-8, provavelmente, seus
problemas estão sendo causados pela presença da assinatura (BOM) do seu
documento que o user agent não reconheçe.
A assintua (BOM) dos documentos UTF-8 estão sempre no topo do documento e
normalmente você espera vêlos, mas não perca seu tempo. A única maneira
(works for me) que fez com que pudesse ver a assinatura foi trocando a
codificação do documento de UTF-8 BOM para um ISO, caso contrário, a única
coisa que você verá, será uma linha em branco no começo do seu documento (e
em alguns casos, como o meu, nem isso você vê).
A confusão
O grande problema causado pela assinatura dos documentos UTF-8 é que pêla
experiência que cada programador possuí é de instinto o programador já sair
à procura de linhas extras nos arquivos incluídos.
É neste pronto onde se é gasto um grande tempo… Depois de perter todo o seu
tempo, então, você começa a ficar frustrado por não encontrar a linhas
extras nos arquivos e começa a acreditar que tudo isso não passa de uma
conspiração do dêmonio com a sua pessoa.
O que é a assinatura (BOM) dos documentos UTF-8?
Algumas aplicações inserem uma combinação particular de bytes no começo dos
arquivos e isso é usado para indicar que o conteúdo a seguir, possuí
caracteres *Unicode*. Essa combinação de caracteres é conhecida como *
assinatura* ou Byte Order Mark<http://en.wikipedia.org/wiki/Byte-order_mark>.
Alguns editores mostram a assinatura como uma linha extra outras aplicações
como o Zend Studio mostram a assinatura como ( ).
A assinatura (BOM) do documento é importante?
No caso dos arquivos codificados em UTF-8 não, você pode retirar esta
assinatura sem causar problemas de interpretação, a assinatura (BOM) do
documento só é importante para documentos UTF-16 e UTF-32 ela é usada para
informar como o user agent deve interpretar os caracteres.
Como detectar a presença da assinatura de arquivos UTF-8?
Primeiro, nós precisamos detectar se esta linha extra no começo do arquivo é
realmente a assinatura BOM.
Você pode tentar procurar no olhometro, mas se o seu editor interpreta
corretamente a assinatura do arquivo, lamento, mas você não verá. Se o seu
editor não interpretar ou não reconhecer esta assinatura ele vai apresentar
caracteres como  no início do seu documento. Se você utilizar um editor
binário, capaz de mostrar valores em hexadecimal, a assinatura poderá ser
indentificada pelo conjunto de bytes *EF BB BF*.
Alternativamente, se você possuir em mãos um bom editor, ele vai te dizer a
codificação do documento na barra inferior do editor ou em algum menu que
apresente o encoding do seu documento.
Se em nenhum destes casos você obter sucesso, existem algumas aplicações web
que são capazes de detectar a assinatura (BOM) de documentos
UTF-8<http://people.w3.org/rishida/utils/bomtester/>
.
Removendo a assinatura (BOM)
Se você possuí algum editor capaz de exibir esta assinatura, você pode
remover na mão, apenas seleciona-la e apaga-la.
Alguns editores como o Notepad++ (Windows, free) e Komodo (Linux, Free)
permitem que você especifique se você quer ou não a assinatura no ato em que
você salva o arquivo, dê uma olhada no menu “Format”.
Outra opção, é você utilizar algum tipo de script que automatize a remoção
da assinatura rápidamente e recursivamente em todos os seus arquivos. Existe
um script feito em Perl, desenvolvido por Martin Dürst que faz isso para
você:
view source<http://www.igorescobar.com/blog/2009/10/26/problemas-com-utf-8-with-b...>
print<http://www.igorescobar.com/blog/2009/10/26/problemas-com-utf-8-with-b...>
?<http://www.igorescobar.com/blog/2009/10/26/problemas-com-utf-8-with-b...>
01.# program to remove a leading UTF-8 BOM from a file
02.# works both STDIN -> STDOUT and on the spot (with filename as
argument)
03.
04.if ($#ARGV > 0) {
05. print STDERR "Too many arguments!\n";
06. exit;
07. }
08.
09.my @file; # file content
10.my $lineno = 0;
11.
12.my $filename = @ARGV[0];
13.if ($filename) {
14. open( BOMFILE, $filename ) || die "Could not open source file
for reading.";
15. while (<BOMFILE>) {
16. if ($lineno++ == 0) {
17. if ( index( $_, '' ) == 0 ) {
18. s/^\xEF\xBB\xBF//;
19. print "BOM found and removed.\n";
20. }
21. else { print "No BOM found.\n"; }
22. }
23. push @file, $_ ;
24. }
25. close (BOMFILE) || die "Can't close source file after
reading.";
26.
27. open (NOBOMFILE, ">$filename") || die "Could not
open source file for writing.";
28. foreach $line (@file) {
29. print NOBOMFILE $line;
30. }
31. close (NOBOMFILE) || die "Can't close source file after
writing.";
32. }
33.else { # STDIN -> STDOUT
34. while (<>) {
35. if (!$lineno++) {
36. s/^\xEF\xBB\xBF//;
37. }
38. push @file, $_ ;
39. }
40.
41. foreach $line (@file) {
42. print $line;
43. }
44. }
Cuidado com o BOM
Em alguns editores como o Widows Notepad, se você escolhe salvar o arquivo
como UTF-8 ele automaticamente coloca a assinatura (BOM).
A assinatura (BOM) em arquivos CSS pode causar a falha de de interpretação
de algumas regras em alguns user agents, por isso, deve ser removida.
Em alguns navegadores, a presença da assinatura pode fazer com que TODOS os
caracteres da sua pagina sejam interpretados como se fossem UTF-8
independente de qualquer declaração contrária.
E é isso pessoal, espero que seja útil para vocês, espero que você não perca
horas do seu dia tentando resolver este problema como eu e algumas pessoas
da comunidade PHP passaram.
Em arquivos PHP, se você trabalhar como funções como header(); a assinatura
causará aquele problema comum quando você enviar qualquer caracter para o
browser antes dos header();
[]’s
Igor
Regards,
Igor Escobar
Systems Analyst & Interface Designer
> *“Se, pois, o Filho do Homem vos libertar, verdadeiramente sereis livres.*
> *E conhecereis a verdade, e a verdade vos libertará.” (João 8:32;36)*
> *De:* listaphp@googlegroups.com [mailto:listaphp@googlegroups.com] *Em
> nome de *Alessandro Santos
> *Enviada em:* quinta-feira, 5 de novembro de 2009 06:40
> *Para:* listaphp@googlegroups.com
> *Assunto:* [ PHP - Google ] Re: UTF-8 ou ISO-8859-1? qual dessas eh a
> melhor formatação?
> Também acho. Mas seria ideal que o programador entendesse UTF-8, então:
O Gmail cortou a URL... essa URL tava no link que mandei láaaaaaaa em cima,
onde contei como resolvi todos meus probs com UTF-8, PHP e MySQL mas ninguem
leu :)
2009/11/5 Janes Roberto da Costa <janes.co...@seduc.mt.gov.br>
> *“Se, pois, o Filho do Homem vos libertar, verdadeiramente sereis livres.*
> *E conhecereis a verdade, e a verdade vos libertará.” (João 8:32;36)*
> *De:* listaphp@googlegroups.com [mailto:listaphp@googlegroups.com] *Em
> nome de *Alessandro Santos
> *Enviada em:* quinta-feira, 5 de novembro de 2009 06:40
> *Para:* listaphp@googlegroups.com
> *Assunto:* [ PHP - Google ] Re: UTF-8 ou ISO-8859-1? qual dessas eh a
> melhor formatação?
> Também acho. Mas seria ideal que o programador entendesse UTF-8, então:
> *Subject:* [ PHP - Google ] Re: UTF-8 ou ISO-8859-1? qual dessas eh a
> melhor formatação?
> Na verdade este é o mínimo que um programador tem que saber. Se não souber
> a diferença de UTF-8 e ISO-8859-1 não é programador. Apenas ele se diz
> programador.
........................................................................... ..........................................................
Janes Roberto da Costa
Analista de Sistemas (TAIG)
SEDUC-Secretaria de Estado de Educação de Mato Grosso
www.seduc.mt.gov.br<http://www.seduc.mt.gov.br/>
COT-Coordenadoria de Tecnologia da Informação
Telefone: (65) 3613-6394
E-mail: janes.co...@seduc.mt.gov.br<mailto:janes.co...@seduc.mt.gov.br>
"Se, pois, o Filho do Homem vos libertar, verdadeiramente sereis livres.
E conhecereis a verdade, e a verdade vos libertará." (João 8:32;36)
De: listaphp@googlegroups.com [mailto:listaphp@googlegroups.com] Em nome de Alessandro Santos
Enviada em: quinta-feira, 5 de novembro de 2009 07:36
Para: listaphp@googlegroups.com
Assunto: [ PHP - Google ] Re: UTF-8 ou ISO-8859-1? qual dessas eh a melhor formatação?
O Gmail cortou a URL... essa URL tava no link que mandei láaaaaaaa em cima, onde contei como resolvi todos meus probs com UTF-8, PHP e MySQL mas ninguem leu :)
2009/11/5 Janes Roberto da Costa <janes.co...@seduc.mt.gov.br<mailto:janes.co...@seduc.mt.gov.br>>
Só que esta página não contem mais conteúdo algum!
=/
........................................................................... ..........................................................
Janes Roberto da Costa
Analista de Sistemas (TAIG)
SEDUC-Secretaria de Estado de Educação de Mato Grosso
www.seduc.mt.gov.br<http://www.seduc.mt.gov.br/>
COT-Coordenadoria de Tecnologia da Informação
Telefone: (65) 3613-6394
E-mail: janes.co...@seduc.mt.gov.br<mailto:janes.co...@seduc.mt.gov.br>
"Se, pois, o Filho do Homem vos libertar, verdadeiramente sereis livres.
E conhecereis a verdade, e a verdade vos libertará." (João 8:32;36)
De: listaphp@googlegroups.com<mailto:listaphp@googlegroups.com> [mailto:listaphp@googlegroups.com<mailto:listaphp@googlegroups.com>] Em nome de Alessandro Santos
Enviada em: quinta-feira, 5 de novembro de 2009 06:40
Para: listaphp@googlegroups.com<mailto:listaphp@googlegroups.com>
Assunto: [ PHP - Google ] Re: UTF-8 ou ISO-8859-1? qual dessas eh a melhor formatação?
Também acho. Mas seria ideal que o programador entendesse UTF-8, então:
Eu sempre mando esse link aqui na lista :)
2009/11/4 Luiz Escobar <esco...@megasistema.com.br<mailto:esco...@megasistema.com.br>>
Meio infeliz e sem lógica esta colocação, nada haver...
[]s
Luiz Escobar - http://www.megasistema.com.br ============================================
Harbour 2.0.0beta3(Rev.12624) (DbfNtx+MySQL)
MiniGUI 1.7 Extended (Build 74)-2009.09.30
BCC 5.8.2 (Turbo C++ Explorer 2006)
--------------------------------------------
XAMPP 1.7.1 (Apache+MySQL+PHP+(Linux/Win))
FLEX 3.0 (iniciante)
--------------------------------------------
Delphi ( 6 PRO & 7 Ent ) (DBF/NTX+MySQL)
============================================
AMD ? AiMeuDeus Ñ!, Sou + Intel....
From: Eduardo Kraus<mailto:eduardokr...@gmail.com>
Sent: Tuesday, November 03, 2009 11:28 PM
To: listaphp@googlegroups.com<mailto:listaphp@googlegroups.com>
Subject: [ PHP - Google ] Re: UTF-8 ou ISO-8859-1? qual dessas eh a melhor formatação?
Na verdade este é o mínimo que um programador tem que saber. Se não souber a diferença de UTF-8 e ISO-8859-1 não é programador. Apenas ele se diz programador.