Conversion de fichiers en UTF-8

Certains fichiers doivent être convertis en UTF8 avant de pouvoir être utilisés. Cet article vous indique comment effectuer cette conversion.

Ordinateurs basés sur Unix (Mac OS X, Linux, etc.)

La conversion s'effectue au moyen de la commande iconv :

iconv -f encodage_original -t utf-8 fichier_original > nouveau_fichier

Ordinateurs sous Windows

Solution 1

Solution 2

Téléchargez la version du programme iconv pour Windows. Téléchargez la version complète sans les sources et démarrez le programme d'installation. L'exécutable sera situé dans le répertoire bin. Lancez-le à partir de la fenêtre de ligne de commande (que vous obtenez ainsi : Démarrer → Exécuter… et tapez cmd + entrée) et suivez ensuite les instructions comme ci dessus.

Solution 3

On peut effectuer la conversion avec Cygwin, un environnement Linux fonctionnant dans Windows, et en lançant la commande iconv dans cet environnement.

Exemple d'une solution sous Windows avec Cygwin :

  • Créez un fichier texte, nommé ToUtf8.txt
  • Remplissez-le (en faisant un copier/coller) avec le contenu ci-dessous
#!/bin/bash
FROM=iso-8859-1
TO=UTF-8
ICONV="iconv -f $FROM -t $TO"
# Convert
find ToUTF/ -type f -name "*" | while read fn; do
cp ${fn} ${fn}.bak
$ICONV < ${fn}.bak > ${fn}
rm ${fn}.bak
done

Vous devrez adapter deux éléments, en fonction de votre environnement local :

 1. FROM est l'encodage original (celui dans lequel sont vos fichiers avant la conversion)
 2. ToUTF est le nom du dossier contenant les fichiers à convertir. Ce dossier peut contenir des sous dossiers. Attention, assurez vous d'avoir une sauvegarde ! 
  • Démarrez Cygwin.
  • Grâce aux commandes cd nom_dossier, cd.., ls, placez vous sur le dossier de votre ordinateur contenant le fichier ToUtf8.txt et le dossier ToUTF8.
  • Exécutez le script pour convertir tous vos fichiers en tapant la commande suivante : sh ToUtf8.txt