Métadonnées
Dernière mise à jour le
5/05/10
Ressources générales
| Les métadonnées HTML | Le
libre accès | Le Dublin Core | XML
| OAI-PMH | TEF (thèses
électroniques françaises) | URI | RDF
| Licence Creative Commons | Open
Directory Project | RSS
Documentation personnelle sur le thème des métadonnées,
issue d'un remarquable cours de Catherine Morel-Pair, de l'INIST-CNRS,
mai 2006 (1) : "Métadonnées
et ressources électroniques : principes, standards, utilisations".
Ressources générales
Understanding Metadata, NISO, 2004,
http://www.niso.org/publications/press/UnderstandingMetadata.pdf
Panorama : des métadonnées pour les ressources électroniques,
Morel-Pair C., octobre 2005,
hal.ccsd.cnrs.fr/docs/00/04/04/73/PDF/Metas_panorama_CMO.pdf
Des métadonnées pour bien utiliser les ressources électroniques,
Journée d'information AFNOR/CG46, 7 juin 2005, Bibliothèque
nationale de France,
www.bnf.fr/pages/infopro/journeespro/no-Afnor2005.htm
Les métadonnées HTML
Sur Abondance : la théorie
; la pratique de la meta Description,
de la meta Keywords
et de la meta Robots
La liste complète expliquée sur SelfHTML : fr.selfhtml.org/html/entete/meta.htm
Le Dublin Core
Normalisation internationale ISO 15836-2003, : http://www.niso.org/kst/reports/standards?
step=2&gid=None&project_key=9b7bffcd2daeca6198b4ee5a848f9beec2f600e5
Site officiel : www.dublincore.org
Un tableau synthétique parfait, en français, sur le site
de l'OpenWeb : www.openweb.eu.org/articles/dublin_core/
- DC simple : 15 éléments caractérisés
par leurs propriétés, norme ISO
- DC qualifié : ajout de qualificatifs (DCTERMS,
refinements, qualifiers, extensions) caractérisés
- DC étendu : + éléments issus dautres standards
Les éléments de base :
- Descriptifs du contenu : Title, Description, Subject, Coverage,
Type, Language
- Administratifs : Creator, Contributor, Publisher, Rights, Source
- Instanciels : Date, Format, Identifier, Relation
Quelques normes d'écriture :
XML
Pour s'amuser (?) à générer du XML, à bricoler
des DTD, à regarder de beaux schémas et des arbres :
XML Homespy : www.altova.com/support_freexmlspyhome.asp
("home license" gratuite, mais remplir le formulaire pour obtenir
une "key access")
Archives ouvertes (OAI-PMH)
Site de la communauté : www.openarchives.org/
Le libre accès à l'information scientifique et technique,
par :
- la recherche avec un moteur spécialisé ("moissonneur"),
- dans un ensemble d'archives (les "entrepôts")
- qui stockent des documents compatible OAI-PMH (DC-XML)
- ou alimentées par autoarchivage (exemple de Hal, en SHS : http://halshs.ccsd.cnrs.fr/).
Avantages : Conformité à des standards, maintenance
simplifiée, contrôles centralisés réguliers,
interopérabilité et visibilité
Documentation :
TEF (Thèses électroniques françaises)
Projet ministériel de valorisation et pérennisation, avec
une chaîne de production unique et automatisée, pour un document
enrichi avec des métadonnées descriptives et de gestion
(administratives et juridiques, conservation). Utilisation d'une feuille
de style OAI-PMH et Unimarc.
Plateforme de saisie STAR (ABES et CINES)
Seconde version (mars 2006) : www.abes.fr/abes/documents/tef/recommandation/tef.pdf
Les URI, identifiants uniques des ressources
Plusieurs systèmes :
- PURL (Persistent URL) = purl.org/ (association
de bibliothèques étatsuniennes)
- identifiant unique OAI-PMH
- Système Handle
- URN (W3C)...
Léger problème : pas reconnu par les navigateurs web...
RDF (Ressources Description Framework)
Donner du sens au web en représentant les données et leurs
relations (W3C). Idée du "web sémantique". 2006
: pas d'applications web globales, mais nombreuses applications spécifiques.
Descriptions (beaucoup avec l'espace de nom Dublin Core) :
- de ressources (images,audio, annuaires, musées)
- de droits d'usage : licences Creative Commons ; éléments
OAI-PMH dc:rights (projet)
- de personnes et réseaux (cartes de visite électroniques
VCards - >W3C...)
- de domaines de connaissances : taxonomies et ontologies (topics maps)
Licence Creative Commons
"Creative Commons propose gratuitement des contrats flexibles de
droit d'auteur pour diffuser vos créations." C'est un cadre
juridique au partage sur le web, pour les oeuvres de l'esprit, l'équivalent
des licences de type "libre" pour les logiciels.
Sur les sites, on peut "publier" (choisir sa licence) et "chercher"
parmi les sites sous "Creative Commons".
Une fois la license choisie (parmi 6 modèles), le site génère
du code autour de l'icône à placer sur le site, contenant
du DC et du RDF, qu'il convient d'extraire et de placer dans le <head>
de la page.
Open Directory Project
Répertoire mondial des ressources web, sur une base de données
RDF, dont le schéma intègre le schéma DC. Les soumissions
sont faites par des bénévoles, avec un formulaire qui génère
du RDF. Voir www.dmoz.org/
RSS
Le RSS est un format de "syndication" : il permet d'afficher
automatiquement, dans une page, de l'information provenant d'autres sites,
éventuellement triée, filtrée, et bien sûr
mise à jour.
Notes
(1) Voir en ligne son article "Panorama : des métadonnées
pour les ressources
électroniques", en http://hal.ccsd.cnrs.fr/docs/00/04/04/73/PDF/Metas_panorama_CMO.pdf
|