Sciences de l'information

You are currently browsing the archive for the Sciences de l'information category.

Avec un peu de retard, je vous suggère une entrevue de Jon Udell avec Stuart Weibel d’OCLC qui nous entretient de Dublin Core et WorldCat.

Rien de nouveau pour ceux qui connaissent déjà Dublin Core et surtout pas une entrevue qui vous permettrait de connaître son utilité et ses possibilités d’utilisation.

La partie intéressante de l’entrevue à mon avis, tourne plutôt autour de WorldCat, WorldCat Identities et toute la question des URL et des liens permanents sur le Web.

Weibel parle de l’habitude que les gens ont prise sur le Web de diriger les liens vers les sites commerciaux comme Amazon lorsqu’il mentionne un livre. Weibel croît, et avec raison, qu’il serait plus avantageux d’envoyer son lien vers WorldCat qui, de toute façon, offre un lien vers des sites Web commerciaux par la suite. À moins d’être un partenaire d’Amazon et de bénéficier de revenus associés au référencement.

J’utilise cette stratégie depuis longtemps, notamment parce que les OPAC ne permettent pas de « deep link », mais aussi pour encourager les internautes à utiliser leurs bibliothèques. De plus, WorldCat offre un résultat géographiquement significatif. Ainsi, les lecteurs en Europe obtiennent des résultats liés aux bibliothèques à proximité de chez eux, tandis que nous à l’Université de Montréal, on obtient des résultats centrés au Québec.

Pour ce qui est de WorldCat Identities, je suis plutôt sceptique à l’idée de vouloir l’utiliser pour faire aboutir mes liens sur le Web. Pour moi, un lien doit servir à enrichir le texte et permettre au lecteur de poursuivre sa lecture selon ses connaissances et ses besoins informationnels. Je ne crois pas que de savoir ce qu’une personne a publié et qui est répertorié dans WorldCat (parce qu’on peut avoir du contenu publié qui n’est pas dans WorldCat), ne permet pas d’augmenter de façon significative sa connaissance d’une personne. Je préfère employer la section à propos sur la personne si elle a un blogue, ou encore mieux, son entrée dans Wikipedia.

WorldCat Identities est plus utile pour les aspects traditionnels du catalogage bibliographique et du contrôle d’autorité.

La visualisation de la fréquence des termes par la création d’un nuage de « tags » est un outil fréquemment employé dans le contexte du Web 2.0. Voici un outil développé par OCLC pour analyser une page Web et en faire ressortir les termes les plus fréquemment employés.

Voici un exemple que j’ai essayé avec le site de l’EBSI:Vous pouvez remarquer que l’outil a de la difficulté avec l’analyse de la langue française, car il retire les apostrophes et conserve plusieurs mots vides.

Un deuxième essai, mais cette foi-ci avec la page d’accueil du site de la Library of Congress donne un résultat plus intéressant:Alors, amusez-vous et testez vos sites préférés. Vous pouvez aussi lui soumettre des textes que vous possédez sur votre ordinateur pour qu’il crée un nuage de vos courriels ou de vos travaux. Imaginez voir apparaître la redondance dans l’utilisation de certains mots dans vos travaux en quelques secondes…

On devait s’y attendre. Après le site Wikipedia qui est venu perturber les éditeurs d’encyclopédies, voici qu’un nouveau projet vient perturber le catalogage de livres.OpenLibrary

Open Library est un projet ambitieux de création d’une bibliothèque contenant tous les livres. Comme il est pratiquement impossible de réaliser le projet au niveau physique, les instigateurs du projet ont lancé un site Web hébergé par l’Internet Archive. Le site donne accès aux livres du domaine public pour le téléchargement, des liens vers des sites commerciaux pour l’achat et des liens vers les bibliothèques pour l’emprunt par l’entremise de WorldCat.

Le projet se veut un effort collaboratif pour le catalogage. Le catalogue initial est un amalgame de notices provenant de la Library of Congress et d’éditeurs ayant contribué avec leurs catalogues. L’énergie des internautes est par la suite dirigée vers un site où il est possible d’ajouter des documents ou d’enrichir les documents existants de nouvelles métadonnées. Le site est en fait un Wiki structuré où les espaces modifiables sont prédéfinis.

Une chose est dérangeante, ils ont créé un nouveau schéma de métadonnées. Plutôt que d’utiliser un format existant et au minimum normalisé, ils ont combiné ce qu’ils considèrent comme étant l’essentiel du MARC avec l’ONIX pour créer futurelib. Les problèmes ont déjà commencé à apparaître. Un commentaire sur la page expliquant le schéma mentionne qu’il n’y a pas de champ dans la base de prévu pour les publications en séries. Si vous souhaitez contribuer à la discussion, vous pouvez rejoindre la liste de discussion sur les questions en lien avec la bibliothéconomie.

Pour ceux qui doutent de la survie à long terme du projet. Vous pouvez consulter la bio d’Aron Swartz sur LISNews. C’est quelqu’un qui a plusieurs projets derrière lui.

Pour ceux qui sont intéressés par les aspects techniques du projet, vous pouvez consulter la description de l’architecture technologique ainsi que le code source du projet.

Ce billet a été publié sur le blogue collaboratif EBSI 2.0 en premier lieu et importé par la suite sur mon blogue personnel.

Bonne nouvelle via Michael Geist pour terminer la semaine. La Canadian Library Association annonce sa politique sur le libre accès pour faire suite aux recommandations contenues dans le rapport du groupe de travail sur la question.

  • CLA will providefor full and immediate open access for all CLA publications, with the exceptionof Feliciter and monographs The embargo period for Feliciter is one issue, and the embargo policy itself will bereviewed after one year. Monographs will be considered for open accesspublishing on a case-by-case basis.
  • CLA actively encourages its members to self-archive in institutional and/or disciplinaryrepositories and will investigate a partnership with E-LIS, the Open Archivefor Library and Information Studies.
  • CLA willgenerally provide for the author’s retention of copyright by employing Creative Commons licensing or publisher-authoragreements that promote open access.
  • CLA willcontinue its long-standing policy of accessibility to virtually all CLA informationexcept for narrowly defined confidential matters (e.g. certain personnel orlegal matters).

Ce qui m’a marqué de cette nouvelle, c’est le fait que le Feliciter sera disponible en ligne lorsqu’une nouvelle édition est publiée. J’espère que la CBPQ et l’ASTED songent à la même stratégie, car c’est dommage de « dissimuler » du Web autant d’information pertinente.

Pour ceux qui ont accès à la version « papier » d’ARGUS, je vous suggère la lecture de l’article sur la Baladodiffusion et les bibliothèques de Véronique Parenteau paru dans le numéro printemps-été 2007. Pour ceux qui ont accès à Repère, …bein… ils n’ont toujours pas indexé le numéro d’automne 2006, donc il sera disponible en ligne d’ici à la fin de notre maîtrise probablement.

Ce billet a été publié sur le blogue collaboratif EBSI 2.0 en premier lieu et importé par la suite sur mon blogue personnel.

Les moteurs de recherche sur le Web sont un marché lucratif et plusieurs joueurs tentent l’aventure. Deux nouveaux sites utilisent une stratégie visant à inclure la participation des internautes dans l’amélioration des résultats de recherche.

Mahalo est un moteur de recherche qui n’utilise pas un nouvel algorithme, mais le travail d’êtres humains. Les résultats de recherche sont assemblées sur une page par des auteurs qui collectent des informations et des sites d’intérêts pour créer une bibliographie à partir d’une multitude de sources. On pourrait faire l’analogie que Mahalo est à la bibliographie ce que Wikipedia est à l’article encyclopédique. Comme le site est devenu public en mai, il est très pauvre en contenu. Un exemple de résultats pour Nicolas Sarkozy est disponible. Son aspect collaboratif provient du fait que les auteurs proviennnent du grand public et qu’ils sont payés pour rédiger les pages de résultats. Si l’aventure vous intéresse, le Mahalo Greenhouse est peut-être pour vous.

De son côté, Spock est un moteur de recherche pour trouver une personne ou des informations sur une personne. Dans un univers où être en mesure d’identifier quelqu’un sur le Web peut être difficile, ce moteur veut faciliter l’opération. Malheureusement, le site n’est pas encore public et nécessite une invitation. La mienne ne fonctionnait pas, mais une démonstration vidéo des fonctionnalités de Spock mérite qu’on s’y attarde. Son aspect collaboratif provient notamment du fait que le visiteur inscrit peut associer des descripteurs (tags) et voter sur la pertinence des descripteurs associés par d’autres internautes.

« Older entries § Newer entries »