Retour sur le hackathon de la BnF

Hackathon de la BnF, Édition 2017

180

Le week-end du 25 et 26 novembre 2017 avait lieu la seconde édition du hackathon de la Bibliothèque Nationale de France.

Dans le cadre de la semaine de l’innovation publique, il s’agit de faire émerger un concept innovant autour du thème de la musique, en s’appuyant sur les collections musicale de Gallica.

Le projet lauréat sélectionné par le jury de la BnF sera développé durant l’année et intégré à l’offre numérique de la BnF.

L’édition de l’année 2016 avait été remporté par l’équipe Gallicarte.

Déroulement

Le hackathon prend place entre 13h le samedi avec l’arrivée des participants et 16h le lendemain, avec la présentation finale devant le jury. Un peu plus de 24h, avec un emploi du temps serré, ponctué de rendez-vous :

  • Samedi, 14h : Brainstorming entre les participants

  • 15h : Présentation des ressources par les équipes de la BnF

  • 16h : Présentation des concepts sous forme de «pitchs»

  • 16h30 : Formation des équipes

  • 19h : Première présentation devant le jury

  • Dimanche, 11h : Seconde présentation devant le jury

  • 16h : Rendu final devant le jury

  • 17h30 : Le jury présente son choix et remet le prix du hackathon

Naissance des idées

Une fois les problèmes logistiques de l’arrivée réglés, une salle équipée de tableaux blanc est mise à la disposition des participants.

Le but est de commencer à poser des idées, écrire, schématiser, échanger, mélanger les premiers concepts…​ Et déjà quelques idées fortes émergent. Quelques leaders aussi !

600
Figure 1. Brainstorming (Twitter Florent Poinsaut)

Avec un groupe d’étudiants, nous parlons de «Dataviz» autour des métadonnées musicales. Nous dessinons quelques schémas. Avec une participante, nous évoquons le «VJing» ou «l’art de mixer la vidéo sur de la musique».

Un premier concept nous apparaît : Diffuser des contenus visuels en fonction d’une piste sonore, un peu à la manière des antiques plugins de visualisation de Winamp. Voilà une première idée qui me tient à cœur, j’essaye de fédérer autour!

600
Figure 2. Plugin de visualisation graphique Winamp Geiss

Puis au détour d’un tableau que j’observe, Marc me présente son concept : Visualiser du son sous la forme d’un spectrogramme. Je suis enthousiaste car je vois une convergence possible, et j’essaye de le convaincre de former une équipe ensemble.

Formation des équipes

Motivé par mes camarades étudiants, je me plie à la tradition du «pitch» et présente un concept encore flou, entre «Dataviz», spectrogramme sonore et animation visuelle.

Les participants hésitent, les groupes se décomposent, se recomposent. Finalement une équipe de 10 personnes s’assemble autour de l’idée de «Visualiser la musique». Reste à définir un objectif clair, à trouver un nom, une tactique de réalisation…​

Il est 17h.

Les ressources de la BnF et des partenaires

Assis par terre dans le grand hall ouest, au pied des globes de Coronelli, nous assistons à une présentation des ressources numériques mises à notre disposition :

  • Un accès aux catalogues de la BnF (en plus de data.bnf.fr qui est public)

  • Un accès aux API des partenaires du Hackathon avec :

    • La Sacem

    • Deezer

    • L’INA

    • Doremus

800
Figure 3. Présentation générale (Twitter Bnf)

Des cours accélérés sont dispensés à ceux qui le souhaitent, notamment pour comprendre les rudiments de SparQL.

J’en profite pour saluer l’implication remarquable des volontaires pendant ces deux jours ; disponibles pendant toute la durée de l’événement, certains ont passés des heures à débugger de complexes requêtes pour interroger les divers catalogues et résoudre toute sortes de problèmes.

Le projet Musiviz

Le concept

Nous avons pour objectif de faciliter et d’enrichir par l’image la navigation à travers les documents audio de Gallica, en exploitant autant la matière sonore du document que ses métadonnées.

La matière sonore est rendue visible par le calcul d’un spectrogramme. Il s’agit d’une décomposition temps-fréquence qui permet une visualisation précise d’un audiogramme sans nécessité de l’écouter. Cette représentation du son permet de distinguer d’un coup d’œil une voix d’un instrument, de repérer des interprétations différentes d’une même œuvre, de quantifier un rythme ou même de juger la qualité de l’enregistrement.

spectro
Figure 4. Spectrogramme

Les métadonnées permettent quand à elles d’interroger automatiquement data.bnf.fr et d’obtenir en retour un flux d’images en rapport avec le document sonore. Cette mise en images enrichit l’écoute par l’apport d’un contexte : photos d’époque, partitions, manuscrits ou articles de journaux.

L’Équipe

Notre atout principal fut la diversité de nos compétences, ce qui nous a permis d’adresser avec plus de sérénité les divers aspects de ce projet.

En effet, parmi les parcours et métiers variés, nous avions à disposition des compétences clés : Spécialistes des catalogues, musicologues, spécialistes de l’analyse du son, et développeurs. Il nous manque cependant un graphiste.

Pour ma part, exerçant dans le domaine du développement logiciel, j’ai pu apporter ma contribution en terme d’organisation projet et de mise en œuvre des développements.

Une excellente cohésion entre les 10 membres et l’équipe, une motivation et une forte implication font le reste ; malgré le timing serré et la fatigue, nous obtenons rapidement des résultats encourageants.

Notre équipe se compose de Marc Bernot, Marc Bourgeois, Jordan Chacelas, Philippe Gambette, Paul Kaelblen, Florian Le Bourdais, Anthony Le Clezio, Bénédicte Percheron, Karl Pineau, Bastien Rennesson.

Organisation

Au vu des compétences disponibles, plusieurs «mini-pôles» projet ont émergés :

  • Recherche musicale : Sélection d’œuvres pour une démonstration plus percutante

  • Data : Extraction des données et métadonnées depuis les collections et catalogues

  • Développement : Site web et back-end

  • Analyse du son : Extraction des spectrogrammes et données audio

Enfin, certains prennent part épisodiquement à la préparation des présentations pour les rendus intermédiaires

600
Figure 5. Présentation intermédiaire (Twitter Coline Blanpain)

Avec un point d’équipe toutes les deux heures, nous définissions conjointement les objectifs, de façon réaliste. Certaines idées trop coûteuses ont été mises de côté, pour se concentrer sur l’essentiel et tenir le délai imposé.

600
Figure 6. L’équipe au travail la nuit (Twitter Louisa Torres)
600
Figure 7. L’équipe au travail la nuit

Avec les prémisses d’un prototype fonctionnel, les premières victimes du sommeil vont prendre un peu de repos vers 6h.

Réalisation de Musiviz

Le projet s’apparente à un «Proof-of-Concept» construit autour d’une sélection musicale étudiée par nos musicologues. Nous avons fait le pari de la qualité démonstrative du prototype au détriment d’une exhaustivité de recherche dans les catalogues BnF.

Cela nous permet de concentrer nos efforts autour d’un prototype fonctionnel sur un périmètre réduit, mais bien plus réaliste au regard de la complexité du requêtage en temps réel des catalogues et des temps de réponses peu adapté au contexte web.

L’équipe «Data» se concentre sur une extraction des données, tâche rendue ardue par une appropriation difficile du langage SparQL pour naviguer dans les catalogues.

Avec Karl, nous prenons en charge la réalisation d’un démonstrateur Web basé sur Angular pour la partie front-end. Pour le back-end, j’utilise spring-boot pour créer une API Rest. Celle-ci permet de faire le lien entre le front-end et la sélection de données MySQL stockée localement.

Ce stockage local présente l’avantage d’être bien plus réactif pour notre démonstrateur, mais requiert un enregistrement préalable des données issues des catalogues. L’extraction des données est assurée par l’équipe «Data», tandis que nous les transformons pour les insérer dans des tables optimisées pour l’affichage.

Du côté Analyse du son, notre spécialiste écrit des scripts pour précalculer les spectrogrammes et extraires diverses données audio (bpm, qualité…​)

Remise du prix

Nous avons la grande joie de remporter ce hackathon à coté d’autres projets tout aussi intéressants et d’équipes passionnées.

Cet évenement est une expérience humaine très enrichissante, qui bouleverse nos habitudes : Il s’agit de trouver rapidement des capacités de collaboration efficaces et égalitaires. J’en tire de nombreux enseignements personnels.

La dynamique du groupe et son esprit d’équipe ont permis de finaliser le prototype du projet Musiviz en quelques heures.

Seule la fatigue accumulée pendant ce long WE reste un obstacle pour retenter l’aventure.

600
Figure 8. Présentation finale (Facebook Bnf)
600
Figure 9. Remise du prix (Facebook Bnf)

Le prototype

600
Figure 10. L’interface Musiviz
comments powered by Disqus