Encodage des documents XML
Bonjour,
Le latin1 est actuellement déclaré pour tous les documents XML (à la fois articles et flux RSS&Atom).
Pourquoi l'utf-8 n'est-il pas utilisé ? (c'est d'ailleurs le format par défaut des XML)
Cela faciliterait grandement une internationalisation de PluXML ainsi que l'utilisation de moult caractères dans nos propres articles sans passer par des entités HTML.
Toutefois, mieux vaut penser à cela au plus tôt car plus facile est la conversion en utf-8 lorsqu'il y a peu de code écrit.
Et, tant que j'y suis, je signale un petit bug sur la flopalamite 14 : l'utilisation du caractère « » (euro) par exemple. Il n'est pas réencodé (donc invalide en latin1).
Et un autre bug est pour sa présence dans les noms de fichiers. Si le titre de mon article est « L'euro », ce symbole apparaît dans le nom de fichier. Ce n'est pas terrible...
À part ça, c'est avec plaisir que je découvre PluXML. Bravo pour votre travail !
Le latin1 est actuellement déclaré pour tous les documents XML (à la fois articles et flux RSS&Atom).
Pourquoi l'utf-8 n'est-il pas utilisé ? (c'est d'ailleurs le format par défaut des XML)
Cela faciliterait grandement une internationalisation de PluXML ainsi que l'utilisation de moult caractères dans nos propres articles sans passer par des entités HTML.
Toutefois, mieux vaut penser à cela au plus tôt car plus facile est la conversion en utf-8 lorsqu'il y a peu de code écrit.
Et, tant que j'y suis, je signale un petit bug sur la flopalamite 14 : l'utilisation du caractère « » (euro) par exemple. Il n'est pas réencodé (donc invalide en latin1).
Et un autre bug est pour sa présence dans les noms de fichiers. Si le titre de mon article est « L'euro », ce symbole apparaît dans le nom de fichier. Ce n'est pas terrible...
À part ça, c'est avec plaisir que je découvre PluXML. Bravo pour votre travail !
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Sinon, j'approuve le passage à l'utf-8, le petit problème est que les articles actuels devront être réencodés à la main.
Pas forcément à la main : il pourrait y avoir un petit fichier « maj.php » qui parcourt tous les articles et fait un coup de utf8_encode (en vérifiant au préalable que le document est bien déclaré en latin1 au début) et passe en utf-8.
Le mieux est encore de tester, ce que je vais faire dès que j'ai un peux de temps ^^
Autre question : les infos envoyées à partir d'un formulaire sont-elles en ISO-8859 ? En UTF-8 ? Ca dépends de l'encodage de la page ?
Je me suis laissé tenter par PluXML, mais vu que le site dans lequel je veux intégrer le blog est en UTF-8, ce serait plus pratique que le blog soit aussi en URF-8.
Serait-il donc possible de laisser le choix de l'encodage (au moins le choix entre ISO-8859-1 et UTF-8) à l'utilisateur-administrateur lors de l'installation ?
Merci d'avance,
Bogoris
Ces différences d'encodage sont vraiment $%=:#1@
On va voir ce que l'on peut faire...