Encodage des documents XML

IuliusIulius Member
Bonjour,

Le latin1 est actuellement déclaré pour tous les documents XML (à la fois articles et flux RSS&Atom).
Pourquoi l'utf-8 n'est-il pas utilisé ? (c'est d'ailleurs le format par défaut des XML)

Cela faciliterait grandement une internationalisation de PluXML ainsi que l'utilisation de moult caractères dans nos propres articles sans passer par des entités HTML.
Toutefois, mieux vaut penser à cela au plus tôt car plus facile est la conversion en utf-8 lorsqu'il y a peu de code écrit.

Et, tant que j'y suis, je signale un petit bug sur la flopalamite 14 : l'utilisation du caractère « € » (euro) par exemple. Il n'est pas réencodé (donc invalide en latin1).

Et un autre bug est pour sa présence dans les noms de fichiers. Si le titre de mon article est « L'euro € », ce symbole apparaît dans le nom de fichier. Ce n'est pas terrible...

À part ça, c'est avec plaisir que je découvre PluXML. Bravo pour votre travail !

Réponses

  • DitiDiti Member
    Iulius a écrit:
    Et, tant que j'y suis, je signale un petit bug sur la flopalamite 14 : l'utilisation du caractère « € » (euro) par exemple. Il n'est pas réencodé (donc invalide en latin1).
    Ça c'est compréhensible, les gens ont tendance à utiliser le latin1 au lieu du latin9, va savoir pourquoi... Concrètement : iso-8859-15.

    Sinon, j'approuve le passage à l'utf-8, le petit problème est que les articles actuels devront être réencodés à la main.
  • IuliusIulius Member
    Diti a écrit:
    Sinon, j'approuve le passage à l'utf-8, le petit problème est que les articles actuels devront être réencodés à la main.
    Comme c'est une version bêta, on peut encore se permettre une telle modification d'encodage.
    Pas forcément à la main : il pourrait y avoir un petit fichier « maj.php » qui parcourt tous les articles et fait un coup de utf8_encode (en vérifiant au préalable que le document est bien déclaré en latin1 au début) et passe en utf-8.
  • iKsiKs Member
    Question pour Iulius : que fait utf8_encode() face à un string déjà en UTF8 ? Si il est intelligent et ne fait rien alors pour vérifier que le document est en latin1 ?
  • haroldharold Member
    Malheureusement il n'est pas intelligent et ça foire lamentablement ;)
  • iKsiKs Member
    Ca renvoie une erreur simple sans rien faire au string ou ça défonce le string d'une manière incroyable ?
    Le mieux est encore de tester, ce que je vais faire dès que j'ai un peux de temps ^^

    Autre question : les infos envoyées à partir d'un formulaire sont-elles en ISO-8859 ? En UTF-8 ? Ca dépends de l'encodage de la page ?
  • Bonjour,

    Je me suis laissé tenter par PluXML, mais vu que le site dans lequel je veux intégrer le blog est en UTF-8, ce serait plus pratique que le blog soit aussi en URF-8.

    Serait-il donc possible de laisser le choix de l'encodage (au moins le choix entre ISO-8859-1 et UTF-8) à l'utilisateur-administrateur lors de l'installation ?

    Merci d'avance,

    Bogoris
  • maramamarama Member
    Bonjour,

    Ces différences d'encodage sont vraiment $%=:€#1@
    On va voir ce que l'on peut faire...
Connectez-vous ou Inscrivez-vous pour répondre.