30 décembre 2004

&@§æÂ!!!

[Mise à jour : le problème est réglé, et surtout identifié, cf. à la fin du billet. Rien à voir avec UTF-8. L’Unicode c’est bien, mangez-en !]

Ouin !!! Mais quelle idée de changer le jeu de caractères de ce blog ! Quelle idée de mettre les doigts dans des technologies d’informaticiens autistes, les mêmes qui n’avaient pas vu l’an 2000 venir, et dont les trois quarts n’ont pas encore réalisé qu’il y a une vie en dehors de la table ASCII et de ses 26 lettres. Mon frère aîné m’a toujours dit que l’informatique ça sert à amuser les informaticiens. Il a bien raison (et il est informaticien). Et mon ancien patron n’en revenait jamais du nombre de personnes qui croient encore que l’informatique est une science exacte.

Ca fonctionnait bien jusqu’à aujourd’hui, quand je ne sais pas pourquoi MarsEdit a commencé à faire des siennes, puis mon fil RSS dans NetNewsWire, tous les deux affichant n’importe quoi à la place des accents(*). Je n’ai pas la moindre idée de ce qui a changé, ni d’ailleurs ce qui a provoqué la reconstruction de tout le fil cet après-midi faisant réapparaître les 15 dernières entrées comme nouvelles. Le pire, c’est que vu via Safari ou Firefox, rien à signaler, tout va bien, pas de problème, jolis accents, je m’appelle toujours François et pas Franŧois.

Si quelques lecteurs compatissants voulaient bien me dire si ça fonctionne ou pas chez eux, et avec quoi ils lisent cette prose, je leur en saurais gré. Sinon ça va m’empêcher de dormir et je vais encore écrire des âneries, tomber en dépression, ou prendre l’avion et dire à Ben Trott ce que je pense de la gestion des jeux de caractères dans MT en général et dans les TrackBacks en particulier.

(*) Pour les geeks au fond près du radiateur, ce que je vois côté client (ME ou NNW), c’est de l’UTF-8 affiché comme si c’était de l’ISO-8859-1. Mais toute la chaîne depuis le contenu, la base MySQL, les scripts MT, le serveur web Apache renvoie de l’UTF-8. Peut-être n’est-ce qu’un problème avec ces deux logiciels.

Explication : les deux applications que j’utilise, NetNewsWire et MarsEdit ont toutes les deux la désagréable manie d’essayer de deviner le jeu de caractère si jamais il y a un caractère invalide dans le flux, et de basculer sur ISO-8859-1 si elle n’y arrive pas. Le problème venait d’un guillemet courbe que j’avais copié dans une citation, et que MarsEdit est incapable de transmettre proprement à MT, et ensuite incapable de digérer une fois qu’il revient. Donc rien à voir avec UTF-8, c’est un bon gros bug des applications de notre ami Brent Simmons.

Publié le 30 décembre 2004 dans Râle
Commentaires

Ce billet s'ouvre normalement à partir de NewsFire dans Safari. Et se lit tout aussi bien dans FireFox et Explorer. L'énoncé du titre à haute voix pose tout de même quelques soucis dans l'articulation.

Posté par Marceneiro le 30 décembre 2004 à 02h11 - #

Netnewswire est totalement autiste vis-à vis de l'UTF-8, ce n'est pas le premier blog illisible avec cet aggrégateur :-(

Mise à jour ?

Posté par Flagada le 30 décembre 2004 à 04h22 - #

Pas de problème pour moi avec Firefox (et l'extension Sage).
Mais j'ai eu le problème avec quelques blogs avec ce même Firefox, je n'ai plus ce problème actuellement.

Posté par Vincent le 30 décembre 2004 à 09h11 - #

Pareil que Marceneiro : aucun problème sur Newsfire ou sur Firefox. Il faudrait voir avec des gens qui sont sous autre chose que Mac (UTF-8 natif) ou même Windows XP (UTF-16 natif). En fait, s'il y a des linuxiens à côté du radiateur…

À noter que Maître Eolas à eu le même problème. Et moi aussi (j'ai tout reconverti à la main, c'est l'horreur mais faut dire que j'ai voulu le faire *avant* le support officiel de l(UTF-8).

Avertissement pour tous ceux qui créent leur blog : à l'installation, choisissez *directement* UTF-8. Passer de du latin-1 à l'UTF-8 après (ce qui est une bonne chose en soi), c'est l'horreur. Mieux vaut prévenir que guérir, mettez-vous en UTF-8 dès le début.

Posté par David Latapie le 30 décembre 2004 à 09h38 - #

Pas de problème pour windows, avec Firefox et IE, on a bien la page en UTF-8...

Posté par Mr Peer le 30 décembre 2004 à 09h45 - #

Je crois que je vais rester en iso-8859. Merci de souffrir pour nous.

Posté par Laurent le 30 décembre 2004 à 10h26 - #

j'utilise Thunderbird 1.0 en lecture de fil RSS.ça marche au poil.

Posté par Patf le 30 décembre 2004 à 10h59 - #

Sur FeedDemon, pas de problème pour la visualisation ou les feeds stockés (UTF-8 en interne).
Par contre, le trackback vu chez Neokraft a bien les symptomes que tu décris.

Posté par tehu le 30 décembre 2004 à 11h25 - #

Pas de soucis sur Bloglines (sous Firefox)

Posté par clark le 30 décembre 2004 à 11h38 - #

Linux (débian) et firefox, aucun probleme.

Posté par Cinquante le 30 décembre 2004 à 14h41 - #

Aucun probleme dans firefox ou blam! (aggrégateur rss) sous Linux.

Posté par mat le 30 décembre 2004 à 16h02 - #

En tout cas, NetNewsWire avale correctement le fil RSS1.0 (en RDF), qui est codé EXACTEMENT de la même manière en UTF-8 ! Plus je creuse, plus j'ai l'impression que ce sont des bugs propres à NNW et MarsEdit.

Posté par François le 30 décembre 2004 à 16h51 - #

Aucun problème dans SnowNews (agrégateur RSS en console).

Posté par Lunar le 30 décembre 2004 à 18h25 - #

Le problème touche les accents car l'UTF-8 code les caractères hors ascii de base sur plusieurs octets, résultats les accents ressemblent pour un logiciel qui ne reconnait pas l'UTF-8 à deux ou plusieurs caractères ésotériques.
Soit les aggrégateurs qui posent problème ne savent pas traiter l'utf-8, soit ils ne savent pas le reconnaitre. Après ouverture de ton fil dans un editeur, je penche pour la première solution puisque l'encodage est correctement annoncé dans la declaration xml (ou alors les aggregateurs en question sont très cons).

Posté par Fred Bird le 3 janvier 2005 à 10h33 - #

Trackback Pings

URL de TrackBack pour ce billet:
http://padawan.info/cgi-bin/mt/mt-trckbck.cgi/1161

Ajouter votre grain de sel (politique des commentaires)




Retenir ces informations ?

(HTML autorisé)