quinta-feira, 12 de março de 2009

Conversão de Character Encoding

Ao converter arquivos shapefile para o Postgis, me deparei com o problema de codificação de caracteres, os SHP estavam em ISO-8859-1 e meu banco em UTF-8.

Antes de fazer a carga no banco, converti os arquivos para UTF-8 utilizando uma biblioteca que se encontra no repositório do Ubuntu. Então criei um script que antes de fazer a carga no PostgreSQL converte o arquivo com o seguinte comando:

iconv -f iso-8859-1 -t utf-8 <'nome_arquivo_iso-8859-1'> 'nome_arquivo_UTF8'