11 private links
Je m'étonne de ne pas avoir déja bookmarké cet article, qui fait partie des fondamentaux (pour moi) sur l'encodage de caractères.
Un super outil pour toutes les manipulations de chaîne (typiquement mon camarade sécu-boy utilise ce genre
Parfaitement lucide. Et la partie python est bien faible face au descriptif de ce merdier.
La meilleure façon de détecter un texte à l'encodage trouble
L'introduction est à lire pour tous les développeurs qui lisent/écrivent un fichier dans un jeu de caractère "quelconque" (en France, ce sera typiquement ISO-8859-1(5)) et qui veulent l'afficher dans un autre jeu de caractère.
Pour les javaistes, le secret, c'est de passer par Apache Commons-IO et IOUtils#toString(InputStream, String charset) en mettant charset à la bonne valeur (et surtout, surtout, en considérant que Java utilise l'unicode en interne)
YEAAAAAAAAAHHHHHHHHHHHHHHHHHHHH Unicode !
Enfin bon, faut faire gaffe : entre l'UTF-8, l'UTF-16, et d'autres gadgets, c'est pas aussi simple qu'il n'y paraît ...