À propos du Thésaurus

À propos du Thésaurus

Bienvenue au Thésaurus des sujets d'Affaires autochtones et du Nord Canada (TSA) qui a été mis au point pour rendre plus efficace l'extraction de données d'Affaires autochtones et du Nord Canada (AANC). Un thésaurus des sujets est une liste de mots‑clés sujets qui peut servir à indexer ou à classer des documents concernant un sujet particulier. Ces mots‑clés sujets peuvent ensuite être utilisés par des moteurs de recherche pour obtenir des résultats pertinents sur un sujet donné. Le TSA comporte des liens entre certains mots‑clés et expressions comme des termes génériques, des termes spécifiques, des descripteurs, des non‑descripteurs ou des termes associés. Ces liens visent à aider les indexeurs ou les classificateurs à trouver les mots‑clés sujets les plus pertinents pour décrire la « matière » des documents. Ils peuvent également être utiles aux chercheurs en proposant des descripteurs et des termes associés pour préciser une recherche.

Le TSA est un thésaurus bilingue de termes qui décrivent le travail d'AANC. Il compte plus de 2 800 termes en anglais et plus de 2 900 termes en français, dont près de 1 300 descripteurs dans chaque langue. En outre, il est conforme aux normes et aux conventions internationalement reconnues pour la construction de thésaurus (Guidelines for the construction, format and management of monolingual controlled vocabularies [ANSI / NISO Z39.19-2005], Principes directeurs pour l'établissement et le développement de thésaurus monolingues [ISO 2788:1986] et Principes directeurs pour l'établissement et le développement de thésaurus multilingues [ISO 5964:1985]).

Contenu et objet

Le TSA porte sur des domaines précis déterminés lors d'un examen de manuels, de politiques, de publications et d'autres ressources d'information provenant de divers organismes du Ministère. À la suite de cet examen, certains termes ont été extraits pour servir à la classification par sujets dans divers systèmes d'information d'Affaires autochtones et du Nord Canada, comme des sites internet et intranet d'AANC.

Les concepts suivants n'ont pas été ajoutés au TSA : les noms géographiques, les titres (p. ex. noms de programmes), les noms propres (p. ex. noms d'entreprises) et les acronymes, sauf s'ils sont d'usage courant. Ils ne font pas partie du thésaurus pour diverses raisons. Certains termes peuvent changer fréquemment au fil du temps et être difficiles à conserver. D'autres termes ne relèvent pas du domaine couvert par le thésaurus parce qu'ils ne concernent pas le « sujet » traité et sont davantage liés au « contexte ». Certains termes sont plus adaptés à un champ de métadonnées distinct, parce qu'une source faisant autorité existe déjà au sein du Ministère (p. ex. noms de Premières nations, lieux géographiques, noms de programmes).

Le TSA est principalement destiné aux gestionnaires de contenu, aux bibliothécaires, aux indexeurs et aux spécialistes des métadonnées à AANC, qui doivent choisir des termes de sujets normalisés répondant aux besoins en matière de métadonnées pour indexer les ressources d'information d'AANC. La fonction principale du thésaurus est de normaliser la forme et le sens des termes de sujets pour qu'un concept ou un sujet soit toujours représenté de la même manière dans les ressources de métadonnées d'AANC.

Langue

Dans le TSA, le français et l'anglais ont la même importance : aucune d'entre elles ne domine ou ne constitue la langue « source ». Les versions française et anglaise sont parallèles, sauf dans le cas des non‑descripteurs où il n'est pas nécessaire d'avoir le même nombre de synonymes dans les deux langues. Il faut une équivalence exacte seulement pour les descripteurs. Ceux‑ci sont toujours au masculin en français.

Structure

Le TSA est organisé selon un format normalisé où les relations équivalentes (EMPLOYER, EMPLOYÉ POUR), hiérarchiques (terme générique, terme spécifique) et associatives (terme associé) entre les termes sont clairement présentées et déterminées par des indicateurs de liens normalisés. Un thésaurus contient aussi des synonymes ou des termes « d'introduction » (non‑descripteurs) que les chercheurs ou les indexeurs peuvent utiliser comme points d'entrée, au lieu des descripteurs désignés. Ces termes « orientent » les utilisateurs vers le « descripteur » qui est régulièrement utilisé pour décrire ou indexer des ressources d'information sur un sujet ou un concept particulier. Le TSA compte également des relations d'équivalences interlinguistiques (équivalences en anglais et en français) pour les descripteurs.

Les termes sont également classés en fonction de catégories sémantiques générales qui sont utilisées dans le Thésaurus des sujets de base du gouvernement du Canada.

Dans le TSA, les termes en anglais respectent l'orthographe en vigueur au Canada. Ils sont le plus souvent au pluriel, sauf les concepts abstraits ou les entités qu'on ne peut pas compter. En revanche, la plupart des termes en français sont au singulier par convention linguistique.

Tous les termes sont présentés dans un ordre direct, au lieu d'être inversés, comme dans un discours naturel (p. ex. « droits de récolte », au lieu de « récolte, droits »).

Exemple d'un enregistrement tiré du TSA:

Traités historique

ANGLAIS:

Historic treaties

Catégorie sémantique :

Histoire et archéologie

Employé pour :

Traité numéroté

Traité de paix et d'amitié

Traité antérieur à la Confédération

Terme générique :

Traité

Terme associé :

Document historique

Histoire

 

Maintenance et mise à jour

Le Thésaurus des sujets d'AANC est géré et mis à jour par la Bibliothèque ministérielle, Affaires autochtones et du Nord Canada.

Directives d'indexation

Les indexeurs qui utilisent le Thésaurus devraient suivre les règles d'indexation suivantes pour assurer l'uniformité de l'accès par sujet aux ressources d'information. Pour obtenir de plus amples renseignements sur la façon d'indexer les ressources d'information du gouvernement du Canada conformément aux normes du Conseil du Trésor du Canada, veuillez consulter les Lignes directrices relatives à la mise en place des métadonnées pour la découverte de ressources Web du gouvernement du Canada. Ces lignes directrices présentent l'indexation de ressources Web. Cependant, la plupart des renseignements fournis peuvent s'appliquer à l'indexation d'autres types de ressources d'information.

Le Thésaurus des sujets d'AANC est essentiellement un outil de vocabulaire contrôlé postcoordonné, bien que certains concepts soient précoordonnés. Un vocabulaire précoordonné consiste en des concepts complexes qui ont été créés comme des termes composés dans le thésaurus au moment du développement de celui‑ci. Un vocabulaire postcoordonné est principalement formé d'une combinaison de concepts unitaires. Prenons par exemple le terme « emploi des jeunes ». Dans le cas d'une postcoordination, ce concept pourrait être indexé ou recherché à l'aide de deux termes comme « jeunes » et « emploi ». Toutefois, dans le cas d'une précoordination, un organisme peut trouver nécessaire de présenter le concept comme une expression (p. ex. « emploi des jeunes »).

Les indexeurs qui utilisent le Thésaurus doivent garder présent à l'esprit les points suivants :

Spécifique c. général

Il faut éviter d'utiliser des termes génériques comme « droits » lorsqu'un terme spécifique est plus approprié. Par exemple, dans le cas d'un document qui porte sur les droits issus de traités, on utilisera le descripteur « droits issus de traités », au lieu de « droits ». Cependant, si le document traite du droit en général, l'ajout de termes spécifiques ne sera probablement pas pertinent. L'indexeur doit évaluer l'importance attachée à un concept dans un document; dans le cas d'un concept qui n'est pas complètement développé ou qui n'est mentionné qu'en passant, une indexation plus générale est justifiée.

En règle générale, un document ne devrait pas être indexé avec des termes génériques et spécifiques appartenant à la même chaîne hiérarchique. Toutefois, l'utilisation des descripteurs « droits » et « droits issus des traités » serait nécessaire, par exemple, pour indexer une ressource relative aux droits en général, mais qui comprend également une section importante sur les droits issus de traités.

Emploi d'un nombre suffisant de descripteurs de sujets pour décrire de manière exhaustive le contenu d'un document

Plusieurs descripteurs sont souvent nécessaires pour traduire de manière exhaustive le sujet d'un document. Par exemple, un document indexé portant sur l'aide apportée par le gouvernement du Canada aux Premières Nations en matière d'approvisionnement en eau potable sécuritaire, propre et fiable sera représenté par la série suivante de descripteurs :

Utilisation des eaux, Approvisionnement en eau, Eau, Qualité de l'eau, Eau potable, Norme, Autochtones

Dans la mesure du possible, chaque notion essentielle traitée dans un document devrait être représentée par un descripteur.

Utilisation de la structure sémantique du Thésaurus

Il faut consulter la liste de termes génériques, spécifiques et associés et les notes explicatives jointes à chaque terme de sujet choisi comme terme d'indexation. Les relations entre les termes permettent d'en clarifier le sens et proposent d'autres termes d'indexation pouvant être utiles.

Cohérence

Lorsqu'on utilise des descripteurs dans l'élément de métadonnées « sujet » de systèmes ou de bases de données d'information, il faut les entrer tels qu'ils sont présentés dans le TSA.

En règle générale, seule la première lettre d'un terme d'indexation prend la majuscule. Des conventions sont également observées dans le TSA quant à l'utilisation du singulier et du pluriel des termes. En anglais, les noms dénombrables (qui peuvent être soumis à la question « combien? ») sont généralement au pluriel, alors que ceux qui sont non dénombrables (qui peuvent être soumis à la question « combien? »), de même que les concepts abstraits, sont au singulier. En français, la plupart des termes sont au singulier.

Langue d'indexation

Les documents en anglais doivent être indexés à l'aide de la version anglaise du Thésaurus : les documents en français doivent l'être au moyen de la version française. Les documents bilingues devraient être indexés dans les deux langues.

Changements et ajouts 

Pour obtenir une copie de la liste détaillée des changements et des ajouts, veuillez communiquer avec Rachel Clarke. Rachel.Clarke@canada.ca

Personne‑ressource

Si vous avez des commentaires à formuler, des ajouts ou des modifications à proposer, ou si vous souhaitez discuter du contenu du Thésaurus des sujets d'AANC, veuillez communiquer par courriel avec Rachel Clarke, à Rachel.Clarke@canada.ca

 

Date de modification :