&@§æÂ!!!

[Mise à jour : le problème est réglé, et surtout identifié, cf. à la fin du billet. Rien à voir avec UTF-8. L'Unicode c'est bien, mangez-en !]

Ouin !!! Mais quelle idée de changer le jeu de caractères de ce blog ! Quelle idée de mettre les doigts dans des technologies d'informaticiens autistes, les mêmes qui n'avaient pas vu l'an 2000 venir, et dont les trois quarts n'ont pas encore réalisé qu'il y a une vie en dehors de la table ASCII et de ses 26 lettres. Mon frère aîné m'a toujours dit que l'informatique ça sert à amuser les informaticiens. Il a bien raison (et il est informaticien). Et mon ancien patron n'en revenait jamais du nombre de personnes qui croient encore que l'informatique est une science exacte.

Ca fonctionnait bien jusqu'à aujourd'hui, quand je ne sais pas pourquoi MarsEdit a commencé à faire des siennes, puis mon fil RSS dans NetNewsWire, tous les deux affichant n'importe quoi à la place des accents(*). Je n'ai pas la moindre idée de ce qui a changé, ni d'ailleurs ce qui a provoqué la reconstruction de tout le fil cet après-midi faisant réapparaître les 15 dernières entrées comme nouvelles. Le pire, c'est que vu via Safari ou Firefox, rien à signaler, tout va bien, pas de problème, jolis accents, je m'appelle toujours François et pas Franŧois.

Si quelques lecteurs compatissants voulaient bien me dire si ça fonctionne ou pas chez eux, et avec quoi ils lisent cette prose, je leur en saurais gré. Sinon ça va m'empêcher de dormir et je vais encore écrire des âneries, tomber en dépression, ou prendre l'avion et dire à Ben Trott ce que je pense de la gestion des jeux de caractères dans MT en général et dans les TrackBacks en particulier.

(*) Pour les geeks au fond près du radiateur, ce que je vois côté client (ME ou NNW), c'est de l'UTF-8 affiché comme si c'était de l'ISO-8859-1. Mais toute la chaîne depuis le contenu, la base MySQL, les scripts MT, le serveur web Apache renvoie de l'UTF-8. Peut-être n'est-ce qu'un problème avec ces deux logiciels.

Explication : les deux applications que j'utilise, NetNewsWire et MarsEdit ont toutes les deux la désagréable manie d'essayer de deviner le jeu de caractère si jamais il y a un caractère invalide dans le flux, et de basculer sur ISO-8859-1 si elle n'y arrive pas. Le problème venait d'un guillemet courbe que j'avais copié dans une citation, et que MarsEdit est incapable de transmettre proprement à MT, et ensuite incapable de digérer une fois qu'il revient. Donc rien à voir avec UTF-8, c'est un bon gros bug des applications de notre ami Brent Simmons.

14 commentaires

Ce billet s'ouvre normalement à partir de NewsFire dans Safari. Et se lit tout aussi bien dans FireFox et Explorer. L'énoncé du titre à haute voix pose tout de même quelques soucis dans l'articulation.

Netnewswire est totalement autiste vis-à vis de l'UTF-8, ce n'est pas le premier blog illisible avec cet aggrégateur :-(

Mise à jour ?

Pas de problème pour moi avec Firefox (et l'extension Sage).
Mais j'ai eu le problème avec quelques blogs avec ce même Firefox, je n'ai plus ce problème actuellement.

Pareil que Marceneiro : aucun problème sur Newsfire ou sur Firefox. Il faudrait voir avec des gens qui sont sous autre chose que Mac (UTF-8 natif) ou même Windows XP (UTF-16 natif). En fait, s'il y a des linuxiens à côté du radiateur…

À noter que Maître Eolas à eu le même problème. Et moi aussi (j'ai tout reconverti à la main, c'est l'horreur mais faut dire que j'ai voulu le faire *avant* le support officiel de l(UTF-8).

Avertissement pour tous ceux qui créent leur blog : à l'installation, choisissez *directement* UTF-8. Passer de du latin-1 à l'UTF-8 après (ce qui est une bonne chose en soi), c'est l'horreur. Mieux vaut prévenir que guérir, mettez-vous en UTF-8 dès le début.

Sur FeedDemon, pas de problème pour la visualisation ou les feeds stockés (UTF-8 en interne).
Par contre, le trackback vu chez Neokraft a bien les symptomes que tu décris.

En tout cas, NetNewsWire avale correctement le fil RSS1.0 (en RDF), qui est codé EXACTEMENT de la même manière en UTF-8 ! Plus je creuse, plus j'ai l'impression que ce sont des bugs propres à NNW et MarsEdit.

Le problème touche les accents car l'UTF-8 code les caractères hors ascii de base sur plusieurs octets, résultats les accents ressemblent pour un logiciel qui ne reconnait pas l'UTF-8 à deux ou plusieurs caractères ésotériques.
Soit les aggrégateurs qui posent problème ne savent pas traiter l'utf-8, soit ils ne savent pas le reconnaitre. Après ouverture de ton fil dans un editeur, je penche pour la première solution puisque l'encodage est correctement annoncé dans la declaration xml (ou alors les aggregateurs en question sont très cons).

Laisser un commentaire

En laissant un commentaire, vous acceptez la politique des commentaires de ce blog.

Archives mensuelles

Notes récentes