Le web 2.0 pour les nuls : tags et folksonomies

Parmi les marques de fabrique du web 2.0 on trouve les tags et les folksonomies, à tel point d'ailleurs qu'il suffit parfois de plaquer ça sur du web 1.0 pour recarrosser un vieux concept en deux coups de cuillère à pot.

Les tags sont simplement des étiquettes qu'on peut coller à loisir sur du contenu. Comme on veut, où on veut, autant qu'on veut. Par exemple ici sur ce billet, je vais plaquer les étiquettes "web 2.0", "tags" et "folksonomies", ce qui me permettra de retrouver plus tard l'ensemble des billets partageant tout ou partie de ces étiquettes. C'est une façon simple et rapide de qualifier du contenu et de naviguer dedans par association.

Sur mon blog je décide de l'étiquetage des billets en magasin, mais bientôt vous pourrez vous aussi coller vos tags sur mon contenu (et venir l'enrichir sans que j'ai besoin de bouger les oreilles, ça aussi c'est très web 2.0, ça s'appelle le crowdsourcing, concept lui aussi très à la mode en ce moment, qui consiste à utiliser gratuitement le temps de cerveau disponible de vos visiteurs pour les faire travailler pour vous, il n'y a pas de raison que seul Patrick Le Lay en profite). [Blague privée] Et puis ça me permettra de dire à Nicolas Voisin que ses piles sont à plat et qu'il peut arrêter ses bêtises. [/Blague privée]

Dans le monde de la gestion des connaissances, quand on veut structurer les choses, on crée une taxonomie (les informaticiens sont paresseux mais ils aiment que les choses soient bien rangées, pas chez eux ou sur leur bureau, mais dans leur système d'information). Pour ça on réunit un comité avec des gens autorisés qui décident du vocabulaire autorisé pour classer les choses autorisées qu'on va stocker dans le congélateur à connaissances système de knowledge management autorisé (et du lieu de la prochaine réunion à la faveur de la météo qu'il fera dans tel ou tel hémisphère le mois prochain). Après une rotation de la terre autour du soleil, on arrive parfois à une taxonomie tellement complète qu'on l'appelle ontologie (ce qui n'est pas l'art de gérer la honte en informatique mais l'étude des propriétés générales de ce qui existe, c'est dire la modestie du concept l'ambition du projet).

Dans la vraie vie, on s'est vite rendu compte de trois choses : 1) KM en fait ça veut dire kilomètres et les "réunions Miles" ça coûte cher, 2) quand le vocabulaire autorisé est enfin validé, l'entreprise a déjà été restructurée deux fois et personne ne comprend un traître mot de la taxonomie officielle (à commencer par le mot taxonomie), 3) personne (en dehors des informaticiens) n'aime "ranger" les informations dans un système de classement.

Si personne n'a envie de faire l'effort de classer les informations, on a par contre culturellement l'habitude de coller des étiquettes. De petits malins ont donc trouvé une astuce géniale : plutôt que de dépenser du temps et de l'argent à créer une taxonomie officielle qui sera obsolète dès sa sortie et que personne ne va utiliser, laissons les gens étiqueter le contenu librement, avec leur propre vocabulaire. C'est le concept de folksonomie, la "taxonomie des gens". Notez que "les gens" est également un ingrédient de base du web 2.0 (tout est lié on vous dit).

Et là, miracle, ça fonctionne ! En fait c'est tellement simple que même des dindes y arrivent, c'est vous dire. La preuve en image :

tagada

Je ne vous dirais pas où j'ai trouvé ce splendide nuage de tags (qui est une façon de présenter les tags les plus populaires et de naviguer dedans), mais avouez que ça vous donne instantanément une idée du contenu et de l'ambiance, sans parler d'une furieuse envie d'explorer tout ça plus avant ! Essayez donc de faire ça avec une approche KM classique ;-). Au passage, j'illustre l'axiome qui veut que lorsqu'une technologie est utilisée par l'industrie du sexe, elle fera des petits chez la ménagère de moins de cinquante ans (ah, le Minitel rose !).

P.S.
- Je sens que je tiens un concept de série, là.
- On trouve vraiment tout dans Wikipedia, une véritable application web 2.0 avec une interface d'informaticien 1.0. Mais avouez que c'est quand même moins drôle qu'ici.

11 commentaires

Principe de réalité et bon sens terrien sont toujours les bienvenus. Ton billet m'a d'ailleurs fait penser à celui de Manuel cet été http://www.groupereflect.net/blog/archives/2006/08/le_web_20_la_cb.html
Sinon, oui, tu tiens là une série ;)

Ce qui est intéressant (attention, je ne porte pas de jugement sur le fait, je rapporte juste) c'est la façon dont les tags sont construits/déconstruits par les utilisateurs, comme le goûtu "lechemoilevolantrené!!!".

Ce qui me fait penser à http://ideant.typepad.com/ideant/2005/04/tag_literacy.html ou http://www.dlib.org/dlib/january06/guy/01guy.html , deux études sur l'usage des tags dans des applications comme Flickr et del.icio.us.

Lesquelles montrent à quel point l'usage est complexe: 28 à 40% de tags mal orthographiés, 10% hors conventions (pluriels), usage des dates comme tag (20051201), transcodages ratés pour mots de langues différentes, etc...

Ce qui me gène toujours un peu, c'est cette vague impression que derrière le concept de Folksonomie théorisé après-coup, il y a peut-être une réalité un peu moins reluisante de bonne vieille flemme de la part des concepteurs.

Quand je vois des tags comme "20051201", je ne vais pas jeter la pierre à l'utilisateur qui a trouvé un truc pour satisfaire son besoin. Par contre, je me pose des questions sur l'implémenteur ou le designer qui n'a pas réussi à faire remonter suffisement ce besoin-là dans son application. Pareil pour la distribution des tags: les utilisateurs entrent ce qu'ils veulent, tant mieux. Mais combien de concepteurs ont pris la peine de mettre en place de quoi suggérer et faire converger un peu les tags ?

@Ol : très vrai mais j'ai repoussé ce genre d'explication (y compris tags vs catégories) pour plus tard. C'est dur d'évangéliser simplement dès que tu commences à entrer dans le détail, et encore plus de le faire sur le ton que j'ai choisi d'adopter ;-).

Encore que j'avais en tête un morceau sur la revanche des CKO quand le monde sera tellement couvert d'étiquettes persos qu'on ne verra plus rien derrière :-).

@Ol : j'ajouterais (je me fais un commentaire pense-bète à moi-même :p) que le problème de l'entropie existe déjà sur internet (et dans le monde en général). Ca favorise toujours ceux que l'éducation a doté du sens du discernement, et savoir qualifier l'information sera aussi important que savoir la chercher aujourd'hui. Je suis optimiste sur un point : amener plus de gens à réfléchir sur la façon de qualifier une information ne peut que les amener à améliorer leur discernement et leur capacité à (re)trouver une information.

(Le web 2.0 c'est aussi avoir des commentaires plus intelligents que le billet qui les a provoqués ;-)

À la mode oui (chez certains), nouveau de quelle que façon que ce soit : non. Crowdsourcing, taxonomie et tags ouverts, ça existait déjà sur minitel :)

je trouve que le gros problème des tags dont l'émission est laissée au utilisateurs, c'est : le nombre et la contrambiguité. C'est lié. Contrambiguité, parce qu'il y a comme un excès de désambiguisation sémantique, donc pour une même chose désignée plusieurs tags vont exister. D'où prolifération, en lus de la prolifération liée au nombre des choses désignées. La solution ? Il n'y en a peut-être pas de satisfaisante. Si l'administrateur établit une classe de tags, tel utilisateur va peut-être ne pas trouver dans la liste préétablie le tag qui désigne "sa" chose. Et l'administrateur ne peut présumer des infos qui vont rentrer, donc des catégories de choses désignables. Il y a quand même une sorte de "gestion naturelle", ie les utilisateurs ont en commun un champ de vocabulaire "tagesque", ça régule un peu. Et puis je présume que devant un certain nombre de tags, les utilisateurs vont avoir le réflexe d'utiliser un tag existant. Effet de seuil. Mais cette régulation naturelle ne suffit pas, et parfois on se demande s'il ne faudrait pas un truc pour "tagger les tags", ou une sorte de cartographie sémantique pour les présenter. Oui, voilà, une cartographie dynamique, ce serait pas mal... et alors, dans le cas d'un blog eg, on pourrait imaginer de remplacer la notion de catégorie par celle de zone sémantique sur la carte générée.

Il n'y a pas que les informaticiens qui aiment ranger, il ya aussi les bibliothécaires... C'est d'ailleurs notre métier ;-)

Par rapport aux tags/folksonomies etc., il faut bien reconnaître que nous allons avoir besoin du "crowdsourcing" pour indexer ce que nous ne sommes pas capables de faire (parce que c'est trop fin, trop détaillé, que ça prend trop de temps). La plupart de nos usagers sont des gens très biens qui sont capables de faire ce travail, parfois mieux que nous.

Par contre, il faudrait envisager de combiner le système de tags en "langage courant" avec les taxonomies professionnelles, comme le suggère Got : http://www.lespetitescases.net/la-folksonomie-c-est-limite et http://www.lespetitescases.net/skos-l-avenir-de-la-folksonomie-y

Enfin pour qu'une folksonomie ait une chance d'être valide, il faut utiliser la masse pour compenser l'incurie de certains utilisateurs. Ce n'est donc pas les tags les plus récents mais les plus souvent attribués qu'il faudrait organiser en nuage.

@francois: Héhé, ça fera un bon film "CKO, le retour" - il revient, et il n'est pas content.

Sur l'argument de l'inévitable entropie, je suis partiellement convaincu: j'ai l'impression qu'on a deux choses distinctes ici. D'une part la croissance désordonnée du contenu - et là, je suis tout à fait d'accord, c'est là, c'est inévitable et c'est tant mieux, mais l'autre aspect me semble un peu différent. L'entropie des tags et autres folksonomies, elle n'est plus sur du contenu, sur de la donnée, mais sur de la meta-data. L'impact est plus violent. S'en sortir par le discernement et la pédagogie ? Moui, pourquoi pas, mais comme tu dis, si on se retrouve face à un monde d'étiquette (vision fugitive d'un village entièrement couvert de post-its), ça ne va pas être gagné démarrer des cercles vertueux.

Pour ce qui est de l'effet de masse / fréquence sur l'organisation des tags, je reste dubitatif (ou alors il faut que les système y mettent du leur pour pousser dans la bonne direction - del.icio.us est l'un des rares a avoir exploité ça dès le départ).

Faire des liens entre les folksonomies avec des ontologies, pourquoi pas, mais le travail nécessaire m'a l'air guère moins énorme que catégoriser directement proprement. Là encore, c'est dommage de voir très peu de systèmes combiner saisie libre toujours possible -et- proposition de tags -et- de vraies taxonomies dans le même temps pour essayer de faire converger les entrées.

Finalement, peut-être qu'une des manières les plus prometteuses de nettoyer des folksonomies c'est effectivement d'utiliser l'effet de masse, mais par un biais un peu différent, en faisant du judo sur ce beau bordel, façon ESP Game / Google Image Labeler http://radar.oreilly.com/archives/2006/09/more_on_google_image_labeler.html

Quelques pistes et un peu d'optimisme :
- "It's good enough". Franchement, le KM est mort à cause de gens qui cherchaient la perfection ou la pureté, alors que le mode "c'est assez bien comme ça" fonctionne tout à fait dans beaucoup de cas (notamment en entreprise).
- Mon système de blog me propose déjà une saisie libre avec assistance (les tags déjà entrés sont proposés automatiquement pendant la saisie). On peut imaginer le même système appliqué à un groupe homogène de blogueurs (dans une entreprise par exemple)
- Dans un groupe homogène (ex. entreprise), je suis moins pessimiste que vous sur l'entropie, je pense que les gens du terrain seront à même de maintenir un vocabulaire cohérent et plus proche de leurs besoins qu'une taxonomie officielle centralisée.
- Exactement comme Google est capable de corriger les fautes d'orthographe, ou Exalead d'extraire de la sémantique d'un contenu, je peux déjà imaginer de futurs systèmes qui aideront ou assisteront automatiquement le classement et la recherche.
- Ca va s'améliorer au fur et à mesure de l'utilisation.

bonsoir...je viens d'atterir ici en cherchant "Nicolas Voisin Pile", à propos de sa "technique" de pointe pour digérer sur un blog appelé "Pile" du contenu pris sur d'autre blogs tout en y rajoutant un petit plus marketing: le joli tag à son nom...
Je trouve l'exercie plus que "douteux", j'avais laissé courir au moment de la pile Freemen vu que les billets n'étaient pas auto-proclamés "Nicolas Voisin" inside...mais là, ça devient du grand n'importe quoi! Dans Technorati c'est l'incendie, il y a plus de billets tagués "Nicolas Voisin" que tagué "normalement"...ça sent la dérive ou c'est moi qui stress pour rien...???
Merci de m'éclairer...
ps: même Glazman revient dans technorati "lié" à Nicolas Voisin...suis pas sur qu'il apprécie...
http://technorati.com/search/glazman%20pile

Laisser un commentaire

En laissant un commentaire, vous acceptez la politique des commentaires de ce blog.

Archives mensuelles

Notes récentes