Dans le cadre de son  séminaire Archives audiovisuelles et recherche le consortium ArcMC réfléchir à la question de l’archivage de l’audiovisuel  produit par la recherche et à des fins de recherches. Après avoir consacré une séance à l’éditorialisation et à la diversité des stocks numériques, à la question des droits, accès et utilisation des archives numériques, cette séance avait pour thème la structuration des données audiovisuelles dans le cadre de programme de recherche.

Pour aborder ce sujet deux équipes sont venues présenter leurs travaux, démarches et réflexions. Deux démarches différentes qui montrent les possibilités mais aussi les enjeux et les difficultés de penser la structuration des données audiovisuelles comme outils de recherche et levier de la réflexion scientifique.

Première présentation

Aurore Després et Sébastien Jacquot du laboratoire ELLIADD  de l’Université de Franche-Comté :
Conception, structuration et développement du Fonds d’Archives Numériques Audiovisuelles FANA Danse contemporaine.

 Aurore Després, chercheur en esthétique de la danse a commencé son exposé en rappelant que si l’élaboration du Fonds d’Archives Numériques Audiovisuelles FANA Danse contemporaine a débuté en 2008, le lancement de l’édition numérique a eu lieu seulement en 2014. Actuellement, la ressource FANA  présente, en 310 documents audiovisuels pour un volume d’environ 270 heures, deux catalogues :

  • Le fonds numérique audiovisuel Dominique Bagouet – Carnets Bagouet (qui est à la base du développement et de la structuration de FANA Danse Contemporaine.
  • Le fonds numérique audiovisuel de la chorégraphe Ingeborg Liptay

Deux autres catalogues sont en cours de structuration : celui des chorégraphes Mark Tompkins pour la Cie IDA et d’Olivia Grandville pour la Cie La Spirale de Caroline.

 Elle a ensuite rappelé les grands principes qui ont guidé ce travail :

  • Principe 1 : L’importance de penser un métalangage qui préside à la structuration des données car il porte des enjeux épistémologiques, politiques, techniques essentiels
  • Principe 2 : L’élaboration d’un fonds d’archives est un travail du temps sur le temps. Cela demande donc les moyens institutionnels de se donner ce temps.
  • Principe 3 : L’articulation constante du conceptuel et du technique, de la démarche scientifique et de la réalisation technique et informatique ; une collaboration entre chercheur et développeur numérique en plus d’une collaboration entre l’équipe scientifique et les acteurs concernés (dans le cas du fonds Bagouet, la collaboration avec Anne Abeille de l’association Les Carnets Bagouet a été essentielle).

 Contexte et partis pris opérés

Comme le rappelle Aurore Després, il existe aujourd’hui beaucoup de traces des créations chorégraphiques et des spectacles de danse contemporaine, mais l’état de ces traces a du mal à se transformer en archives et donc en documents, et si quelques politiques d’archivage se mettent en route, elle parle de contexte encore « anarchivistique ». Cette situation conduit à une situation où la non citation du document audiovisuel de la danse est une pratique bien trop fréquente, alors même que la plupart des chercheurs se réfèrent à des documents vidéos dans le travail. De ce constat peut jaillir un discours qui amalgame souvent le spectacle et la vidéo : au présent on considère que l’œuvre est le « spectacle » mais au passé l’œuvre devient la « vidéo » sans pourtant être mentionnée comme telle.

 L’élaboration de ce projet repose sur deux partis pris :

  • Poser la triple nature de l’archive audiovisuelle numérique en danse qui a conduit à structurer les données en métadonnées et à envisager le phénomène global de remédiatisation : un « fait chorégraphique » se voit remédiatisé par une « image en mouvement » elle-même remédiatisée par le numérique. Remédiatisation de l’archive numérique audiovisuelle qui lui semble importante de concevoir, plus généralement, pour l’ensemble des arts vivants.
  • La structuration et présentation des données au plus proche des usages et des contextes autour d’un composé contextuel appelé « œuvre de référence »

 

Remédiatisation. La triple nature de l’archive audiovisuelle numérique en danse :

Les œuvres en danse contemporaine sont des archives vivantes qui ne cessent d’être reprises, d’être réactualisées, par là, un fonds de cette nature travaille nécessairement la citation. Ces archives sont des données audiovisuelles, mais englobent des données chorégraphiques à restituer, dans les métadonnées tout autant. Ainsi, la question de l’auteur : qui est l’auteur de l’archive audiovisuelle en danse, le réalisateur ou le chorégraphe ?   Pour répondre à cette question, il convient de penser la triple nature de ces archives qui engendre une double remédiatisation :

  • Les protodonnées correspondent à l’acte chorégraphique

Premier phénomène de remédiatisation : Le transfert des formes et contenus d’un médium vers un autre

  • Les données sont les images en mouvement qui restitue l’acte chorégraphique

Deuxième phénomène de remédiatisation avec le passage au numérique

  • Les métadonnées structurant la restitution numérique de cet ensemble.

support Aurore1.jpg
1 Double remédiatisation. ©Aurore Després, FANA Danse Contemporaine, Université de Franche-Comté

 

La structuration du catalogue

Considérer ces différents aspects sous un angle égalitaire, représente un enjeu politique et épistémologique, et conduit à des choix « atypiques » dans l’élaboration du fonds :

  • En premier lieu, une double description des données audiovisuelles : au lieu d’amalgamer l’audiovisuel et le chorégraphique sur une seule fiche, le choix a été fait de les séparer afin de mieux les articuler ensuite. Le catalogue présente donc des doubles fiches pour un même objet audiovisuel : La première pour la description du contenu de l’acte filmé (spectacle, film, répétition, formation, médiation, promotion), la seconde pour la description du type de document (captation, adaptation/fiction, documentaire, compilation).

 

support Aurore2.jpg
2 Double description des données. ©Aurore Després, FANA Danse Contemporaine, Université de Franche-Comté

  • Un autre élément structurel du catalogue repose sur la catégorie virtuelle d’ « œuvre de référence ». Cette notion conceptuelle s’avance comme une porte d’entrée à toutes les occurences filmées d’une « œuvre » chorégraphique. Elle permet de connecter entre elles un certain nombre de fiches, c’est-à-dire à la fois des actes chorégraphiques filmés que des documents audiovisuels s’y référant.
  • Enfin la structuration globale du fonds, sur ce modèle relationnel, permet de lier les personnes, les auteurs, les œuvres de référence, les fiches « document » et les « fiches chorégraphiques ».

La fonction de recherche se fait en mode plein texte et non sur vocabulaire contrôlé.

Enfin un gros travail a été fait pour permettre une citabilité précise des documents : Chaque fiche possède sa propre référence de citation. De plus il est possible de citer un moment, extrait précis du document audiovisuel ( via l’utilisation de Time Code spécifique).

support Aurore3.jpg
3 Liens entre les métadonnées. ©Aurore Després, FANA Danse Contemporaine, Université de Franche-Comté

 

Les moyens et outils techniques et informatiques développés.

 Sébastien Jacquot est l’ingénieur d’études qui s’est chargé de la réalisation de ce projet. Il a tenu à rappeler que ce type de projet s’inscrit sur du long terme, il s’agit d’une co-construction permanente entre chercheur et technicien difficilement envisageable, sans un appui personnel permanent.

 Ce projet repose sur deux couches principales de système : serveur et client.

Support_Sebastien1.jpg
4 Architecture des couches FANA ©Sébastien Jacquot, FANA Danse Contemporaine, Université de Franche-Comté

 

  • Côté serveur : Une base de données et des fichiers audiovisuels, un serveur HTTP (page Web), un serveur de base de données (pour les métadonnées) et un serveur de diffusion vidéo.
  • Côté client : Une interface Web, un lecteur vidéo (qui décode les flux audio et vidéo).

Au niveau de la couche serveur et des fichiers dédiés à la diffusion, le format FLV (Adobe Flash) a été utilisé et les flux vidéo et audio sont encodés en H.264 et AAC.

Le serveur de streaming a été développé en langage PHP. Il est protégé par mot de passe car l’accès aux vidéos pour des questions de droits se fait sur demande. Les vidéos sont stockées hors de l’espace publié, et ne sont donc pas accessibles directement par des requêtes vers le serveur.

Pour la construction des pages Web et la structuration des métadonnées cela a été réalisé en PHP et MySQL a été choisi pour le système de gestion de bases de données. Le serveur HTTP utilisé pour envoyer les pages Web au client est Apache.

La couche client correspond à tout ce qui est offert dans le navigateur : notamment un lecteur multimédia avec deux implémentations, une en Flash et une en HTML 5. L’interface utilise AJAX car cette technologie permet de faire des requêtes vers le serveur et de mettre à jour uniquement des zones dans une page ce qui vient alléger la navigation (pas besoin de retélécharger à chaque fois la totalité des pages et moins de requêtes vers le serveur de base de données.)

Support_Sebastien2.jpg
5 Modèle relationnel simplifié des tables SQL ©Sébastien Jacquot, FANA Danse Contemporaine, Université de Franche-Comté

Pour la viabilité et visibilité de cet outil, Sébastien Jacquot réalise aussi un travail de veille technologique. Les prochaines étapes sont de plusieurs ordres :

  • S’affranchir du plugin Flash pour rendre le système plus léger et compatible avec IOS et Android.
  • Un rapprochement avec les plateformes de recherche de la TGIR Huma-Num : Nakala, Isidore, ainsi qu’avec le service de Web archivage de la BNF.

 

Première présentation : discussions

Cette présentation a interpellé l’ensemble des participants de la séance de Séminaire. Alain Bertho souligne la pertinence de ce choix de double description des données qui s’inscrit bien dans les préoccupations de ce séminaire qui a déjà souligné au cours des séances précédentes, la nécessité d’arrêter de penser les archives audiovisuelles comme les archives papier ( un document, une indexation , une fiche).

Didier Francfort souligne pour sa part que ce modèle est intéressant pour penser un type de pratiques culturelles où il y a interactions entre différents niveaux du système production/ diffusion/réception. Si on veut penser le processus de réception comme un processus actif, il faut absolument faire cette autre démarche qui est celles des fiches multiples.

Patrick Deshayes revient sur la question de la désignation des auteurs qui se trouve facilité par ce système de double description.   Il pose aussi la question de l’indexation des vidéos pour lequel Sébastien Jacquot signale que pour le moment seules les frames clés (key frames) sont indexées dans les fichiers eux-mêmes et permettent le déplacement dans les vidéos et le séquençage. Patrick Deshayes a alors évoqué le logiciel Ligne de temps proposé par l’ IRI du centre Georges Pompidou Ce logiciel permet de découper la vidéo. Si le schéma classique un plan/une coupe est très cinématographique, d’autre ligne de temps peuvent être inventées. Par exemple l’entrée de personnes sur scènes, etc….

Damien Poïvet de l’équipe de Canal-U souligne les difficultés que peuvent induire ce système de double fiche avec les connexions à des sites agrégateurs ; au moment du moissonnage il risque d’y avoir une perte de l’information produite. L’équipe de FANA , face à la perte de l’information s’est posée cette question et s’interroge actuellement sur la pertinence et la manière de signaler leurs données. Damien Poïvet leur propose par exemple de développer à côté de leurs catalogues, une présentation spécifique des données qui permettent de donner un nombre suffisant d’informations à l’agrégateur, qui dans la plupart des cas renvoie vers le site d’origine de production et d’exposition des données, les agrégateurs sont seulement des point d’accès et ce serait dommage de passer à côté.

Deuxième présentation

Didier Francfort de l’université de Lorraine, Panagiota Anagnostou, docteure en science politique et en sociologie et Elsa Sadet, documentaliste à la discothèque de la ville de Paris:
Le projet « Disque Exil » : un programme en début de parcours, quelles questions, quels enjeux , quels choix ?

C’est Didier Francfort, professeur d’histoire contemporaine à l’Université de Lorraine qui s’est chargé de présenter le projet Disque Exil, qui répond à un appel à projet ANR-DFG (franco-allemand), en cours d’évaluation, sous l’acronyme DEACAM. (Disque-Exil : A Cross-boarder Approach to Music Circulation).

Il s’agit, dans un premier temps, de mener une étude comparative franco-allemande sur l’histoire culturelle des migrations à partir de l’analyse de l’usage social des disques. Le programme consiste à emprunter, répertorier, cataloguer, indexer, numériser (de manière séléctive) et restituer des collections de disques de familles migrantes. Ce travail multidisciplinaire dépasse l’opposition entre réception, représentation et pratiques. La réception est considérée comme une pratique active, l’appropriation comme une production créatrice.

Les hypothèses de travail :

– Prendre en compte les effets de triangulation : par exemple décrire la complexité de la culture d’un communiste d’origine italienne vivant près de Longwy aimant la musique américaine. Pas d’échelle d’intégration univoque.

– Mettre en valeur la compléxité des configurations identitaires et l’importance des phénomènes de construction non nationales (régionales, internationales, professionnels, etc.).

– Analyser les usages sociaux individuels et collectifs des disques, ainsi que leurs contenus, pour comprendre les logiques de circulations des personnes, des musiques, des idées et des objets.

Dispositif envisagé pour la structuration du corpus:

– Pour le catalogage : utilisation des principes de classement des documents musicaux. Le PCDM4, est utilisé par des institutions gérant des collections thématisées et cohérentes (Bibliothèques de Paris, BnF, etc.). Il permet, avec certains enrichissements, une approche comparative et un traitement logique du « désordre » des collections privées.

– Pour l’indexation : large recours au tagging, dans une logique de folksonomie, prenant en compte l’« expérience esthétique » (Jean-Marie Schaeffer), le classement opéré par les usagers eux-mêmes, ainsi que les émotions et l’association avec des souvenirs personnels.

Une discothèque pilote :L’Institut d’Histoire Culturelle Européenne à Lunéville(Château des Lumières à Lunéville) abrite provisoirement la discothèque d’un particulier. Cette collection d’environ 1000 pièces reflète plusieurs niveaux de l’histoire de l’immigration en France (grands-parents juifs polonais, nombreux contacts avec l’immigration italienne, parcours militant…). Pour le moment, des nombreuses propositions de prêt de disques ont été présentées (particuliers, associations, partis politiques, syndicats, bibliothèques municipales, paroisses…). Le caractère participatif de la recherche et l’intégration des structures associatives et territoriales au programme est à cet égard un atout considérable.

 

Deuxième présentation : discussions

La question des niveaux de collections.
Serge Wolikow interroge alors l’équipe de DEACAM sur la façon dont il envisage de combiner l’unité des collections privées et la somme des collections réunies au sein du corpus afin que cet ensemble puisse être travaillé à la fois de façon transversale et particulière .
Panagiota Aganostou prend alors la parole pour souligner que l’équipe prend en compte trois différents niveaux d’analyse qui articulent la monographie et l’approche comparée :

  • L’analyse du disque comme objet : contenu / contenant / métadonnées (étiquettes, inscriptions manuelles, dédicaces, éléments de datation, interprétation musicale…)
  • L’analyse de la logique interne de la collection : usages et représentations par leur propriétaire. Des entretiens avec les propriétaires seront effectués évoquant aussi bien les conditions d’acquisition, leur contexte que certains disques ayant disparu des collections.
  • Enfin, l’analyse de l’ensemble des collections dans une approche comparative des cultures migrantes de deux côtés de la frontière.

La question du tagging
DEACAM est un projet participatif. En suivant les principes de la folksonomie et en intégrant une dimension franco-allemande multilingue les personnes des familles migrantes participent pleinement à l’analyse de leurs cultures.

Cette question du tagging a suscité une discussion qui est venue conclure cette séance de séminaire. Aurore Desprès a demandé s’il était prévu de réaliser des nuages de tags prédéfinis, par exemples avec les émotions. Reprenant sa propre expérience autour du Fonds Bagouet, elle souligne qu’il est difficile mais important de réussir à trouver une homogénéité des tags, et un juste équilibre entre le trop plein d’informations venant masquer les données et le manque de renseignements risquant de faire perdre des données.
Alain Bertho a lui souligné que s’il n’est pas nécessaire de savoir dès le départ qui pourra tagger les documents, il en revanche important de penser dès le départ la structuration des données pour permettre dans le futur un système de tagging multiple et collaboratif. Il s’agit là d’un enjeu conceptuel et technique primordial mais délicat. Quel est par exemple le degré de séparation des données concernant les pochettes de disques et le disque et comment le faire apparaitre ? Le taggage fait partie du catalogage et il ne peut donc pas être pensé de manière indépendante.
Cela pose aussi la question du référencement d’un disque qui appartient à plusieurs collections, dans ce cas comment envisager le système de taggage, afin de réussir à différencier les différentes sources ?

En répondant à ces questions le Projet DEACAM qui se met en place permettra peut-être d’aboutir au terme de son travail à l’élaboration d’une proposition de description de discothèque qui puisse être ensuite être proposé de manière plus large à d’autres équipes de chercheurs travaillant sur le même objet. Les deux institutions porteuses sont l’Université de Lorraine et l’Université J. Gutenberg de Mayence  avec l’équipe AMA (Archiv für die Musik Afrikas), la diversité des autres partenaires de ce projet semble être propice à l’élaboration de cette initiative culturelle et scientifique.