Qu’est-ce qu’une transcription accessible ?

Qu’est-ce qu’une transcription accessible ?

Ou comment rendre votre contenu audio véritablement accessible

Zoom sur une solution d’accessibilité absolument indispensable pour :

  • être en conformité avec le RGAA et l’EAA
  • être accessible aux personnes sourdes, malentendantes, sourdaveugles, dys, aveugles et malvoyantes etc.
  • améliorer votre référencement

C’est la transcription !

Que vous proposiez des podcasts, des contenus audio ou des vidéos au public, la transcription est obligatoire pour les rendre accessibles.

Sans tarder, zoom sur cette solution d’accessibilité souvent mal comprise, trop peu souvent proposée et pertinente.

Sommaire :

  1. Une transcription accessible
  2. Les difficultés
  3. Comment produire une transcription accessible

Une transcription accessible : définition

Une transcription, c’est un texte qui accompagne un contenu audio afin de permettre de le rendre accessible à un grand nombre de personnes :

  • les personnes sourdes ou malentendantes
  • les personnes concernées par la surdicécité (troubles visuels et auditifs)
  • les personnes ayant des troubles ou des difficultés liés à l’attention
  • les personnes qui ont du mal à se concentrer sur un audio
  • les personnes qui ont des difficultés de compréhension du français oral
  • les personnes empêchées de lire les sous-titres pour une vidéo
  • les personnes qui, pour une raison ou une autre, préfèrent lire plutôt qu’écouter

Tellement de personnes l’utilisent que la transcription est un des critères de base de l’accessibilité, c’est-à-dire le niveau A dans le RGAA, dont je vous ai déjà parlé : le référentiel général d’amélioration de l’accessibilité, qui nous sert de base pour rendre les sites et services numériques accessibles à toutes et à tous.

Et en parlant de ce fameux RGAA, comment définit-il une transcription accessible, ou en tout cas une transcription conforme aux critères d’accessibilité ?

Selon le RGAA, la transcription est un “Contenu textuel associé à un média temporel (c’est-à-dire un contenu audio ou vidéo) par la technique appropriée (texte codé en HTML ou dans un fichier texte qui se trouve dans la même page ou consultable suivant un lien). Ce contenu donne accès à l’utilisateur (de manière indépendante de la consultation de l’objet multimédia) à :

  • La totalité de ce qui y est exprimé oralement ;
  • Toutes les informations descriptives nécessaires à une compréhension équivalente de l’action.

Ces informations textuelles doivent être présentées dans l’ordre chronologique de leur apparition dans le média temporel.”

Ce court paragraphe nous donne beaucoup d’informations tout en laissant quelques zones d’ombre que je vais m’efforcer de lever avec vous.

De plus, dans la catégorie “Critères et Tests”, le RGAA rajoute la notion de pertinence, nécessaire à toute transcription (et à tout sous-titrage, si vous vous souvenez de mon article dédié au sous-titrage Sourd et Malentendant)

S’il vous intéresse, le voici :

Mon article sur le SME

Pour tenter d’y voir plus clair, voyons en premier lieu ce que n’est pas une transcription selon le RGAA :

  • un résumé du contenu audio type synopsis sur les plateformes
  • une transcription automatique générée par l’intelligence artificielle non éditorialisée (et donc non pertinente)
  • un article de blog justement trop éditorialisé (car les informations n’apparaîtraient pas dans l’ordre chronologique)
  • un texte support qui ne peut se comprendre sans le son et qui ne permet donc pas une “compréhension équivalente” de l’action.

Comme pour les sous-titres, une bonne transcription accessible ne s’improvise pas et doit avant tout permettre aux personnes empêchées d’écouter de comprendre le contenu audio. Mais alors, comment faire ?

Les difficultés et erreurs communes

On voit de plus en plus de transcriptions, notamment car c’est utile aux personnes… mais aussi aux robots ! Notamment les robots d’indexation qui vont venir référencer votre contenu sur Internet.

Cependant, rares sont les transcriptions proposées sur Internet réellement accessibles. L’un des facteurs sont les nombreuses questions que l’on peut se poser face à un contenu à transcrire et les difficultés qui s’ensuivent.

Cet été, j’ai eu le plaisir d’intervenir pour les collaborateurs de l’ENS Editions sur l’accessibilité audiovisuelle, dans le cadre de leur série de webinaires sur l’accessibilité. Dès le premier épisode, l’équipe a eu à coeur de rendre ces webinaires et leurs replays accessibles. Ils ont donc fait appel à moi pour le sous-titrage, mais avant cela, ont d’abord tenté de produire une transcription accessible.

Les personnes chargées de cette transcription ont fait un résumé des difficultés rencontrées lors de la création de cette transcription, que j’ai trouvé extrêmement intéressantes :

  • Un excès de confiance dans la transcription automatique. Avant de se lancer, on pense souvent qu’il n’y aura que quelques corrections à appliquer à la transcription automatique pour produire une transcription accessible, ce qui conduit à :
  • Un manque de temps. Produire une transcription accessible prend du temps car les modifications et corrections à apporter à une transcription automatique sont nombreuses.
  • Une méconnaissance du milieu de la transcription et des prestataires à qui faire appel
  • Une méconnaissance du niveau d’éditorialisation à apporter au document. Produire une transcription en tout point fidèle à l’audio est indispensable, mais il faut aller plus loin.

Retrouvez ce webinaire quand il sera mis en ligne et plein d’autres ressources sur l’accessibilité sur la plateforme Canal U, la plateforme audiovisuelle de l’enseignement supérieur et de la recherche.

Accéder à la plateforme

Alors, comment surpasser ces difficultés et produire une transcription réellement accessible ?

Comment produire une transcription accessible

La plupart du temps (sauf en cas de transcription confidentielle, comme les transcriptions juridiques par exemple), nous partons d’une base générée par l’intelligence artificielle :

  • Soit par un système de reconnaissance vocale répandu (comme Whisper ou tout simplement la transcription de Word)
  • Soit par des systèmes propriétaires (un logiciel disponible au sein de votre organisation par exemple)
  • Soit par des logiciels de montage audio ou vidéo (que vous utilisez pour enregistrer votre podcast par exemple).

Une fois la base générée, nous allons pouvoir lui apporter des modifications afin que la transcription soit entièrement compréhensible et pertinente. Pour cela, nous allons commencer par la correction nécessaire de l’IA afin de s’assurer que les propos soient justes :

  • Écrire les propos que l’IA n’a pas saisis. Il arrive souvent que des phrases voire des paragraphes entendus à l’oral ne soient pas présents dans la transcription à cause d’un mauvais son ou autre.
  • Réécrire les passages où les personnes parlent en même temps. Lors d’une discussion naturelle, il arrive souvent que des propos se chevauchent. L’IA arrive rarement à les restituer correctement, il faut donc la corriger afin que l’on sache qui a dit quoi et à quel moment.
  • Corriger ses erreurs de mots. L’IA a souvent des difficultés avec les anglicismes, les sigles et acronymes, ainsi qu’avec certains mots selon votre prononciation, accent etc. Par exemple, l’IA ne me comprend jamais quand je dis le mot “sous-titres”… Dommage, car c’est peut-être l’un des mots que je répète le plus !
  • Corriger les disfluences verbales, comme les mots coupés, les phrases répétées ou recommencées, les syllabes répétées, les propos non lexicaux tels que « euh », « hum », ou les propos « réparés », c’est-à-dire quand le locuteur corrige ses propres erreurs de prononciation avant qu’un autre n’ait pu le faire. Garder toutes les disfluences verbales hachent beaucoup le discours et empêchent la compréhension pour un grand nombre de personnes. Une bonne transcription est avant tout un bon texte !
  • Vérifier la syntaxe, la grammaire et l’orthographe. C’est aussi essentiel pour l’accessibilité.

Je tiens à préciser que l’usage de l’IA comme base de travail n’est pas toujours recommandée pour les raisons suivantes :

  • Les propos retranscrits sont strictement confidentiels
  • La prise de son est trop mauvaise ou aléatoire pour que l’utilisation de l’IA nous fasse réellement gagner du temps
  • Le contenu est trop technique et le nombre d’erreurs est trop grand.

Ajoutons également l’indispensable réflexion écologique à avoir quand nous utilisons l’IA, quel que soit son usage. Comme vous avez sans doute vu passer, une requête à ChatGPT utiliserait 500ml d’eau, selon une étude de chercheurs de l’université de Riverside en Californie. C’est donc sans doute plus pour la génération d’une transcription automatique. Vérifions donc qu’elle nous fait réellement gagner du temps et des ressources.

Pour ma part, je l’utilise avec parcimonie en transcription et jamais en sous-titrage car elle ne me fait jamais gagner du temps.

En revanche, que l’argument écologique ne soit pas une excuse pour ne pas produire vos transcriptions : il est tout à fait possible d’en produire une sans utiliser l’IA ou les outils des GAFAM. Pour plusieurs de mes clients, je les produis sur des logiciels libres ou propriétaire, complètement à la main.

N’oublions pas l’intersectionnalité des luttes écologiques et pour le handicap.

Il est également tout à fait possible de partir d’un fichier de sous-titres si c’est une vidéo que vous voulez transcrire. Dans ce cas, vous pouvez convertir votre fichier .srt ou autre en format texte. N’hésitez pas à demander à votre prestataire de vous l’envoyer, l’exportation prend très peu de temps.

Une fois notre base corrigée ou notre fichier texte tiré des sous-titres en poche (ou plutôt sur l’ordinateur), nous allons devoir lui ajouter des précisions :

  • Ajouter les locuteurs (les personnes qui parlent) à chaque prise de parole, afin que l’on comprenne qui a dit quoi sans le son
  • Transcrire à l’écrit les éléments annexes sonores utiles à la compréhension (musique, bruit…) ainsi que les éléments visuels si le contenu est une vidéo.
  • Structurer le contenu avec des titres et un sommaire afin qu’il soit lisible par les lecteurs d’écran (et aussi parce que c’est bien plus pratique pour retrouver une information, plus digeste et que cela aide au référencement)
  • Si besoin, la transcriptrice peut rajouter des éléments utiles à la compréhension afin de rendre encore plus claire la transcription. Par exemple, on peut ajouter une explicitation des signes et acronymes, des références ou définir des notions complexes. Dans ce cas, il faudra bien préciser que c’est vous, en tant que transcriptrice, qui ajoutez un élément et que cet élément n’a pas été dit à l’oral.

Enfin, votre transcription doit être facilement accessible… dans le sens où il faut pouvoir la trouver et la lire ! Pour cela :

  • Ajouter un lien vers la transcription sur chaque plateforme où est disponible le contenu audio
  • La produire en respectant les critères d’accessibilité d’un fichier PDF si vous la diffusez sous cette forme
  • Si vous la diffusez sur Internet, veillez à ce que le site soit accessible
  • Parler de son existence ! Informez vos spectateurs que votre podcast, vidéo ou autre contenu est accessible via une transcription.

J’espère que ces conseils vous auront été utiles pour produire votre propre transcription ! Si vous manquez de temps, vous pouvez aussi tout à fait faire appel à une prestataire.

Attention par contre à la fiabilité de l’entreprise ou de la personne à qui vous faites appel. Certaines grandes plateformes de transcription ont des pratiques très douteuses. Méfiez-vous également des prix trop bas proposés par les plateformes (souvent signe d’une exploitation de travailleur) ou à l’inverse de prix trop hauts, ainsi qu’à des promesses d’une transcription “fiable 100 % IA”, comme j’ai pu le voir.

Comme on l’a vu, le travail d’éditorialisation d’une transcription prend du temps, IA ou pas IA. Souvent, ces fausses promesses vont soit décevoir avec un résultat médiocre, soit cacher une exploitation de travailleurs à l’autre bout du monde.

Comme la transcription est un travail beaucoup moins spécialisé que le sous-titrage, le marché est encore plus volatile. Prudence donc !

Services de transcription

Pas de commentaire encore
Recherche