Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Próxima revisão | Revisão anterior | ||
dicas:caracteres [2008/10/24 19:14] – criada paulojus | dicas:caracteres [2010/04/12 10:46] (atual) – paulojus | ||
---|---|---|---|
Linha 1: | Linha 1: | ||
- | === Codificação de caracteres === | + | ====== Codificação de caracteres ====== |
- | Em português brasileiro os sistemas operacionais utilizam tipocamente uma das seguintes codificações de caracteres: '' | + | |
- | Para converter um arquivo | + | Em português brasileiro os sistemas operacionais utilizam diferentes codificações |
- | * Voce tem um arquivo '' | + | * **'' |
- | < | + | * **'' |
- | $ iconv -f ISO-8859-1 -t UTF-8 -o exemplo1a.tex exemplo1.tex </ | + | |
- | * Voce tem um arquivo | + | |
- | < | + | |
- | $ iconv -f UTF-8 -t ISO-8859-1 -o exemplo2a.tex exemplo2.tex </ | + | |
- | Para saber qual a codificação de caracteres está sendo usada no sistema | + | Estas diferentes codificações podem ter efeitos sobre documentos com caracteres especiais escritos em um sistema e visualizados e ou compilados(por exemplo documentos LaTeX) em outro sistema. |
+ | |||
+ | **No LINUX**, para saber qual a codificação de caracteres está sendo usada no sistema digite | ||
< | < | ||
- | $ locale </ | + | locale </ |
- Se voce ver na saída '' | - Se voce ver na saída '' | ||
- Se voce ver na saída '' | - Se voce ver na saída '' | ||
+ | Alguns programas e aplicativos, | ||
+ | |||
+ | |||
+ | ==== Conversão de arquivos via comando em terminal (LINUX) ==== | ||
+ | Para converter um arquivo de um formato para outro na linha de comando do Linux pode-se usar os comandos '' | ||
+ | |||
+ | == Usando o comando convmv == | ||
+ | O comando '' | ||
+ | * Veja se o comando está disponível no seu sistema. Se não etiver instale com< | ||
+ | sudo apt-get install convmv | ||
+ | </ | ||
+ | * para testar a conversão de um arquivo, por exemplo, '' | ||
+ | convmv -f UTF-8 -t ISO-8859-1 exemplo.tex | ||
+ | </ | ||
+ | * e para converter definitivamente | ||
+ | convmv -f UTF-8 -t ISO-8859-1 --notest exemplo.tex | ||
+ | </ | ||
+ | * Para converter definitivamente | ||
+ | convmv -r -f UTF-8 -t ISO-8859-1 --notest DIRETORIO | ||
+ | </ | ||
+ | * Mais detalhes na documentação < | ||
+ | man convmv | ||
+ | </ | ||
+ | |||
+ | == Usando o comando iconv == | ||
+ | * Voce tem um arquivo '' | ||
+ | iconv -f ISO-8859-1 -t UTF-8 -o exemplo1a.tex exemplo1.tex </ | ||
+ | * Voce tem um arquivo '' | ||
+ | iconv -f UTF-8 -t ISO-8859-1 -o exemplo2a.tex exemplo2.tex </ | ||
+ | |||
+ | |||
+ | == Usando o comando recode == | ||
+ | |||
+ | * De latin1 (iso-8859-1) para utf-8:< | ||
+ | recode l1..utf8 arquivo.csv</ | ||
+ | |||
+ | * De utf-8 para latin1 (iso-8859-1):< | ||
+ | recode utf8..l1 arquivo.csv | ||
+ | </ | ||
+ | |||
+ | == Usando o recurso dos2unix == | ||
+ | |||
+ | O **'' | ||
+ | |||
+ | |||
+ | === Definição de codificação no R === | ||
+ | |||
+ | O R por " | ||
+ | |||
+ | === Definição de codificação (locale) no LATEX === | ||
**Uso no ** < | **Uso no ** < | ||
- para '' | - para '' | ||
Linha 21: | Linha 68: | ||
</ | </ | ||
- para '' | - para '' | ||
- | \usepackage[utf-8]{inputenc} | + | \usepackage[utf8]{inputenc} |
</ | </ | ||
+ | |||
+ | |||
+ | === Definição de codificação (locale) em uma sessão do R e/ou Sweave === | ||
+ | |||
+ | No R há pelos menos duas formas de lidar com isto: | ||
+ | - É possível fazer a conversão usando a função '' | ||
+ | - Definir a opção padrão para uma sassão com '' | ||
+ | |||
+ | <code R> | ||
+ | options(encoding=" | ||
+ | </ | ||
+ | |||
+ | <code R> | ||
+ | options(encoding=" | ||
+ | </ | ||
+ | |||
+ | Note que isto vai gerar o documento em um computador com certa codificação e que pode ser incompatível | ||
+ | para compilação em outra máquina que usar um outro // | ||
+ | Neste caso é necessário usar o '' | ||
+ | converter de um formato para outro antes de compilar o documento LaTeX. | ||
+ | |||
+ | ===== Conversão de todo o sistema ===== | ||
+ | |||
+ | Na instalação do sistema operacional (LINUX) é instalada uma codificação cd caracteres '' | ||
+ | |||
+ | A seguir vamos ilustrar a configuração e conversão de sistema '' | ||
+ | - **Gerar os locales desejados: | ||
+ | - editar o arquivo ''/ | ||
+ | pt_BR.UTF-8 UTF-8 | ||
+ | en_US.UTF-8 UTF-8 | ||
+ | en_GB.UTF-8 UTF-8 | ||
+ | pt_BR IS0-8859-1 | ||
+ | en_US IS0-8859-1 | ||
+ | en_GB IS0-8859-1</ | ||
+ | - gerar os locales com o comando:< | ||
+ | sudo dpkg-reconfigure locales</ | ||
+ | - **Definição do locale do sistema** Cada um dos locales gerados podem ser escolhidos para o sistema. Para definir o locale desejado edite o Arquivo de configuração para definição dos locales ''/ | ||
+ | LANG=" | ||
+ | LANGUAGE=" | ||
+ | - Depois disto, para converter nomes e conteúdos de arquivos e diretórios já existentes use o comando '' | ||
+ | |||
+ | |||