Stratégie pour un programme de préservation numérique

1. Introduction

Bibliothèque et Archives Canada (BAC) acquiert, gère, préserve et fournit un accès durable au patrimoine documentaire du Canada et agit à titre de dépositaire permanent du gouvernement du Canada, à la fois pour les publications et les documents à valeur historique ou archivistique. BAC est le seul organisme du gouvernement du Canada avec le mandat national, enchâssé dans sa législation, de préserver à long terme le patrimoine documentaire ; habilitant ainsi le bibliothécaire et archiviste du Canada à veiller à ce que celui-ci soit accessible à long terme aux Canadiens.

Les collections de patrimoine publié et d’archives à BAC contiennent un vaste éventail de contenus textuels, audiovisuels, Web et d’images dans une multitude de formats, qui sont gérés à l’aide de nombreux logiciels, d’équipement informatique et de systèmes d’exploitation variés, tous sujets à l’obsolescence technologique ainsi qu’à la détérioration des médias. L’Archive numérique de BAC se situe au Centre de préservation à Gatineau et sert de dépôt pour ses collections numériques permanentes. Il ne contient qu’une fraction des collections numériques acquises par BAC au fil des ans. Il reste encore beaucoup à faire pour s’assurer que toutes les collections du patrimoine documentaire numérique sont préservées à la hauteur du mandat confié à BAC.

Le présent document décrit comment BAC entend élaborer un programme de préservation numérique entièrement opérationnel.

Plus de 10 pétaoctets de matériel numérique sont conservés sur bandes LTO dans les chambres fortes du Centre de préservation. Ils sont constitués principalement de fonds documentaires et audiovisuels numérisés.

2. Définition et portée

La préservation numérique se définit comme (en anglais seulement) « la gestion active du contenu numérique dans le temps pour en assurer l’accès continu. » (en anglais seulement) Afin de garantir un accès continu au patrimoine numérique, le personnel affecté à la préservation numérique doit surveiller de manière proactive ce patrimoine et intervenir afin de le protéger de l’obsolescence technologique.

BAC suit la norme internationale ISO 14721:2012 Modèle de référence pour un système ouvert d’archivage d’information (en anglais seulement). Le modèle de référence de l’OAIS décrit les rôles et fonctions d’un dépôt d’archives numériques et aide à définir les éléments clés requis pour la mise en place d’un programme de préservation numérique. BAC utilise le modèle de référence de l’OAIS pour déterminer la portée de son programme de préservation numérique.

Conformément à la définition qu’en donne le Digital Curation Centre (DCC) Lifecycle Model (en anglais seulement), la préservation numérique à BAC fait partie d’un ensemble de fonctions dans le cycle de vie numérique. Les fonctions qui nous concernent dans le modèle du DCC se limitent à l’ingestion, la préservation, l’entreposage et la transformation. La présente stratégie ne couvre pas l’ensemble du cycle de vie numérique. Les acquisitions de documents numériques et la découverte numérique dépassent également la portée de cette stratégie et seront traitées séparément dans de futurs documents stratégiques. Bien que la préservation numérique ne soit pas directement responsable de l’ensemble du cycle de vie numérique, nous continuerons d’offrir des orientations et des conseils à nos collègues afin d’assurer l’intégration des diverses composantes. 

Figure 1 : Illustration de la portée organisationnelle et du positionnement de la Solution de préservation numérique (SPN) à BAC.
voir ci-dessous texte équivalent
Figure 1 - texte équivalent

Ce graphique montre qu’en tant que composante de la gestion du cycle de vie des documents numériques, le Programme de préservation numérique joue à la fois un rôle opérationnel et un rôle-conseil en appui aux autres directions générales.

Cette nouvelle stratégie pour le programme de préservation numérique appuie une partie de la  stratégie numérique de 2015 de BAC, plus spécifiquement le volet conservation numérique. La stratégie numérique de 2015 prévoit que « BAC sera doté d’un dépôt numérique fiable… ». Un des résultats de la plateforme de conservation numérique proposée dans la stratégie de 2015 est que BAC respecte les normes relatives aux dépôts numériques fiables.

3. Vision stratégique pour la préservation numérique

D’ici 2024, BAC aura un programme de préservation numérique durable conforme à la norme ISO 16363 : Audit et certification des référentiels numériques de confiance (en anglais seulement).  ISO 16363 est une norme internationale basée sur la norme ISO 14721. C’est une liste de livrables pour un programme de préservation numérique; elle fournit un ensemble de critères que les organisations doivent respecter pour mettre en œuvre un dépôt numérique fiable.

Les facteurs habilitants que BAC doit améliorer pour atteindre les objectifs de son programme de préservation numérique sont indiqués dans l’énoncé de vision ci-dessous.

Figure 2 : Illustration de la vision de l’état final.
voir ci-dessous texte équivalent
Figure 2 - texte équivalent

Description : Notre vision idéale du Programme de préservation numérique est que BAC dispose d’un programme de dépôt numérique fiable internationalement reconnu qui comprend toutes les fonctions du modèle OAIS, y compris les veilles technologiques, la vérification de l’intégrité et de la planification de la préservation.

Les principales composantes du programme sont :

  • Ressources de préservation numérique
    • Bien financé d’une année à l’autre;
    • Nombre adéquat d’employés pour effectuer le travail;
    • Toutes les compétences requises en place : planification de la préservation, migration, veille technologique, etc.
  • Solutions techniques
    • Capacité de 300 téraoctets par mois;
    • Possibilité de croissance d’au moins 30 % par année;
    • Processus automatisés dans la mesure du possible;
    • Prise en charge de toutes les fonctions de préservation numérique.
  • Pratiques, plans et politiques opérationnelles
    • Procédures entièrement documentées et approuvées;
    • Normes formellement adoptées;
    • Ensemble complet de politiques, de normes, et d’outils opérationnels approuvés et mis en œuvre.
  • Gestion des collections
    • 3 copies séparées géographiquement;
    • Plan de gestion des collections existantes développé et appuyé par les ressources nécessaires;
    • Flux de travail ininterrompus de l’acquisition à la préservation;
    • Nouvelles acquisitions immédiatement prêtes à être préservées;
    • Ententes de préservation numérique en place.

Les éléments essentiels à l’élaboration d’un programme de préservation numérique sont définis dans la norme ISO 16363. Pour concrétiser cette vision, BAC devra :

  • mettre en œuvre des solutions techniques durables;
  • établir un cadre de gestion des collections afin de s’assurer que les collections numériques soient systématiquement préservées;
  • documenter l’élaboration du programme, une exigence essentielle pour la certification ISO 16363;
  • concevoir et mettre en œuvre le cadre organisationnel nécessaire au programme, tout en rationalisant les processus opérationnels;
  • obtenir les ressources humaines et financières appropriées.

Alors que nous commençons à façonner l’avenir de la préservation numérique au sein de BAC, cette stratégie fournit le cadre pour gérer et coordonner les mesures nécessaires pour amener progressivement l’organisation à un certain niveau de maturité. Chaque phase est subdivisée en un ensemble de livrables interdépendants et de points de contrôle pour que la haute gestion puisse valider le bien-fondé de l’approche.

Figure 3 : Illustration du cadre global pour un programme de préservation numérique durable.
voir ci-dessous texte équivalent
Figure 3 - texte équivalent

Ce diagramme consiste d’une séquence d’actions et de points de décision en vue de réaliser un programme de préservation numérique qui respecte la norme ISO 16363.

La section ci-dessous décrit les mesures que BAC doit prendre pour surmonter les défis en matière de préservation numérique.

3.1 Phase 1 : Collecte d’information

Cette phase constitue le point de départ du processus de développement du programme. Les principales activités consisteront à explorer, cerner et documenter les besoins et les enjeux opérationnels de la préservation numérique. Il s’agit d’un exercice fondamental pour la définition des problèmes et des exigences du programme. Les principaux résultats de cette phase consisteront à déterminer la taille et l’étendue des enjeux numériques auxquels BAC est confronté, à définir les besoins technologiques et à effectuer une analyse des lacunes dans la documentation des politiques, afin de répondre aux exigences de la norme ISO 16363.

Les exigences opérationnelles en matière de préservation numérique, finalisées en juin 2017, serviront de point de départ aux discussions en vue de rationaliser les processus opérationnels et de concevoir des solutions technologiques propres à soutenir la préservation à long terme des collections numériques. Ce document fournit des informations sur la taille et la portée des technologies requises et sert de catalyseur pour l’évolution du programme. Il fournit également à la haute direction des informations lui permettant de prendre des décisions d’investissement pour l’infrastructure de la préservation numérique.

Dans le cadre de l’inventaire des collections numériques, plusieurs profils de collections ont été créés afin d’avoir une meilleure compréhension des collections numériques acquises par BAC depuis les années 1970. Ces profils permettent à BAC de :

  • Quantifier les collections numériques, incluant l’arrérage des collections à préserver;
  • Établir les responsables de ces collections;
  • Découvrir où elles se trouvent;
  • Établir les formats de fichier et leurs autres caractéristiques;
  • Déterminer si elles sont préservées ou non;
  • Évaluer les risques de leur perte définitive.

Les connaissances acquises grâce à ces profils de collections permettront de décrire l’ampleur des travaux requis pour préserver ces fonds numériques et serviront à la planification de la préservation future

Une analyse des lacunes de politiques sera effectuée au cours de cette phase afin de déterminer les priorités en matière d’élaboration de plans opérationnels, de procédures et de pratiques. Cette analyse guidera BAC dans l’établissement d’un cadre stratégique officiel pour la préservation du patrimoine documentaire numérique canadien.

3.1.1 Facteurs de réussite de la phase 1

Un des principaux résultats de la phase 1 consiste en la création d’une feuille de route qui orientera l’élaboration et la mise en œuvre du programme en décrivant les étapes prévues pour le développement de la capacité de préservation numérique. Ce document décrira les principales activités à réaliser, les rôles et responsabilités, la séquence de leur exécution et les échéanciers généraux.

Phase 1 : Collecte d’information

Solutions techniques

But : Déterminer ce que doit comporter le système et cerner l’ampleur du problème.

Mesures à prendre / livrables : Établissement des besoins opérationnels en matière de préservation numérique et une analyse des options.

Gestion des collections numériques

But : Déterminer la taille et la nature des collections numériques et évaluer le risque de leur perte permanente.

Mesures à prendre / livrables : Inventaire des collections numériques pour le patrimoine publié, les archives privées et les documents gouvernementaux.

Pratiques, plans et politiques opérationnelles

But : Recenser les lacunes dans les politiques et la documentation connexe, comme première étape pour satisfaire aux exigences de la norme ISO 16363 en matière de preuve documentaire.

Mesures à prendre / livrables : Analyse des lacunes dans les instruments de politiques pour la préservation numérique.

Point de décision : Phase 1

La feuille de route pour le développement d’un programme de préservation numérique durable nous aidera à établir des estimations de temps et de coûts pour le reste de la stratégie.

3.2 Phase 2 : Développement du programme

Cette phase vise à obtenir une précision supplémentaire sur les estimations obtenues au cours de la phase 1 et à préciser à quoi ressemblera le programme. Lorsque nous arriverons à la phase 2, l’ampleur et la portée du problème seront mieux comprises. Les prochaines étapes consistent à concevoir et à fournir une capacité de préservation numérique.

Solutions techniques : D’après les exigences opérationnelles en matière de préservation numérique établies au cours de la phase 1, la phase 2 permettra de déterminer les technologies et l’infrastructure requises pour le système de préservation numérique et se concentrera sur l’analyse et de la conception de solutions. Les aspects de la conception technique de l’infrastructure de stockage, des réseaux, des plateformes et des applications ainsi que l’interopérabilité et l‘intégration avec les autres systèmes de BAC seront inclus. Les coûts et les efforts inhérents à la mise en place d’un nouveau système seront analysés, et les options seront présentées à la haute gestion pour la prise de décision.

En se basant sur l’inventaire des collections numériques, BAC élaborera un plan de gestion des collections pour établir les priorités en matière de traitement de l’arrérage des collections numériques, les exigences relatives à leur préservation et le niveau d’investissement requis pour chaque collection. L’une des principales activités de cette phase consistera à effectuer un échantillonnage plus détaillé des collections afin d’évaluer la corruption et la perte de données. Il faudra également élaborer des spécifications et des normes techniques pour préserver les différents types de contenu.

Un plan d’élaboration des pratiques, des procédures et des politiques opérationnelles sera publié à la phase 2 en fonction de l’analyse des lacunes effectuée à la phase 1. Les décisions relatives aux politiques qui ont des répercussions sur les coûts, y compris le nombre d’exemplaires, l’entreposage et la diversité des emplacements géographiques, seront précisées. Les flux de travail, les processus et les procédures seront détaillés afin de permettre aux objets numériques de cheminer de manière fluide de l’acquisition à la préservation, puis à la découverte.

3.2.1 Facteurs de réussite de la Phase 2

À la fin de la phase 2, BAC aura clarifié l’orientation de son programme. BAC aura défini ce qui constitue des services modulables et une infrastructure évolutive pour le programme. Le niveau d’investissement pour la technologie, l’infrastructure et les ressources requises aura été déterminé ainsi que les modèles d’établissement des coûts. Cette phase s’articulera sur la base de connaissances de l’étendue du contenu numérique à préserver, du nombre d’employés requis, des collections à prioriser, des nouvelles collections à traiter, des options de calcul des coûts pour exécuter le programme et des budgets appropriés.

Phase 2 : Développement du programme

Solutions techniques

But : Concevoir des solutions technologiques potentielles en fonction des exigences opérationnelles établies au cours de la phase 1; effectuer des preuves de concept; évaluer les investissements technologiques et l’infrastructure nécessaires.

Mesures à prendre / livrables : Analyse et conception de la solution technologique pour définir les technologies matérielles et logicielles requises pour la préservation à long terme.

Gestion des collections numériques

But : Établir les priorités pour la préservation des collections actuelles et intégrer la planification pour les nouvelles collections.

Mesures à prendre / livrables : Plan de gestion des collections numériques.

Pratiques, plans et politiques opérationnelles

But : Élaborer les politiques et les instruments subalternes.

Mesures à prendre / livrables : Plan de développement pour les pratiques, les plans et les politiques opérationnelles.

Points de décision : Phase 2
  1. Développement organisationnel et conception. L’un des livrables de cette phase consistera en un plan organisationnel détaillé précisant les capacités du programme, incluant les aptitudes et compétences requises pour le personnel affecté à la préservation numérique.
  2. Ressources humaines et financières. BAC obtiendra des ressources durables pour le programme.

3.3 Phase 3 : Mise en œuvre du programme

À cette étape, BAC sera prêt à commencer la mise en œuvre du programme avec en main une vision commune, des engagements institutionnels, le soutien de la direction, des capacités organisationnelles, des flux de travaux cohérents et des ressources spécialement affectées au programme.

D’ici la fin de la phase 3, BAC aura atteint son objectif de mettre en place un Programme de préservation numérique durable et un dépôt numérique fiable, axés sur les pratiques exemplaires nationales et internationales ainsi que sur les normes de l’industrie.

3.3.1 Facteurs de réussite de la Phase 3

Pour l’infrastructure technique, la conception technique aura été réalisée et BAC disposera de données opérationnelles complètes pour mettre en œuvre le concept élaboré. Le résultat de cette phase sera une solution technologique pleinement fonctionnelle pour soutenir la préservation numérique.

Selon les décisions prises dans le Plan de gestion des collections au cours de la phase 2, BAC sera doté des outils décisionnels et de l’infrastructure nécessaire pour respecter les priorités en matière de préservation des collections. Le plan de gestion des collections devra être mis à jour régulièrement au fur et à mesure que d’autres collections seront acquises. Le plan de gestion des collections deviendra une composante essentielle de la planification de la préservation et des flux de travail administratifs.

BAC élaborera et mettra en œuvre des politiques sur la préservation numérique qui seront intégrées aux activités de l’organisation. Il mettra également en œuvre un calendrier pour l’évaluation des politiques et des programmes s’inscrivant dans le cadre d’un cycle d’examen continu.

BAC procédera, de manière formelle ou informelle, à un exercice de vérification et de certification des dépôts numériques fiables, conformément à la norme ISO 16363 (en anglais seulement), afin d’évaluer les progrès réalisés dans la mise en œuvre du programme. La méthode qu’adoptera l’organisation pour la vérification et la certification sera établie durant cette phase. Considérant l’ampleur de la collection numérique de BAC et l’importance de la documentation requise, une certification complète et formelle avec un vérificateur externe accrédité en vertu de la norme ISO 16919 (en anglais seulement) pourrait s’avérer très longue et onéreuse. BAC pourrait choisir d’autres méthodes, par exemple une certification informelle au moyen d’une évaluation par les pairs ou d’une auto-évaluation. BAC pourrait aussi choisir d’évaluer sa fiabilité, en procédant une collection à la fois.

Phase 3 : Mise en œuvre du programme

Solutions techniques

But : Mise en œuvre des solutions opérationnelles.

Mesures à prendre / livrables : Publier un appel de propositions pour une solution de préservation numérique; mettre en place une infrastructure de préservation numérique évolutive.

Gestion des collections numériques

But : Traiter les priorités en matière de préservation des collections.

Mesures à prendre / livrables : Exécuter le plan de gestion des collections de façon à ce que les collections actuelles et nouvelles soient conservées dans l’Archive numérique de BAC.

Pratiques, plans et politiques opérationnelles

But : Produire une documentation conforme aux exigences documentaires de la norme ISO 16363.

Mesures à prendre / livrables : Création de pratiques, de plans et de politiques opérationnelles maintenues à jour; établir le niveau de certification ISO comme un des points de décision; publication de preuves documentaires pour respecter les exigences de la norme ISO 16363; évaluation du programme pour s’assurer que les objectifs de celui-ci sont atteints.

La stratégie pour un programme de préservation numérique sera révisée à mesure que les produits seront livrés à chaque phase, ou lorsque le programme sera stabilisé et fera partie intégrante de l’organisation.

4. Conclusion

L’approche stratégique de BAC en matière de préservation numérique devra être ajustée continuellement au fil de l’évolution du programme. Les plans et les services de préservation doivent être régulièrement révisés et mis à jour si l’on veut assurer une harmonisation continue avec le mandat et les objectifs stratégiques de l’organisation. Les améliorations permanentes apportées aux services afin de tenir compte du contenu numérique patrimonial et des nouvelles acquisitions doivent faire partie des cycles de planification organisationnelle et être rationalisées par rapport aux modèles de prestation de services dans l’écosystème numérique.

Afin d’assurer la survie du patrimoine documentaire du pays, BAC doit impérativement faire preuve de constance quant à son engagement à l’égard de ses obligations en matière de préservation numérique. Les conséquences et les coûts potentiels de l’inaction seront principalement l’échec de BAC à remplir son mandat et ses obligations envers les citoyens canadiens et la perte irrémédiable d’une partie de notre patrimoine national.

Date de modification :