Techno: Proposé le 14 mars 2025 par Max Bertin actualisé le 16 mars 2025.
Auditeur régulier, en direct ou en différé, d'une revue de presse internationale diffusée à la radio, j'ai souhaité retranscrire un point particulier se rapportant à une arrestation liée à la liberté d'expression pour le relire à tête reposée,
Pour ce faire, j'ai téléchargé le fichier audio de ladite revue de presse sur le site Riverside/transcription que j'utilise habituellement pour obtenir une transcription audio vers texte.
Comme à mon habitude, ne prenant pas pour argent comptant le fichier texte produit, je relis aux fins de corrections des erreurs ou imprécisions de transcription, de l'orthographe et de la grammaire.
S'il arrive que des mots manquent dans la transcription, c'est la première fois que je constate qu'un paragraphe entier est manquant.
Paragraphe reproduit ci-dessous, en rouge les mots manquants.Celle de Mahmoud Khalil, figure des manifestations pro-palestinienne sur le campus de Columbia à New York, arrêté samedi (8 mars 2025) par des agents fédéraux de l'immigration à New York. Il est aujourd'hui détenu en Louisiane, rapporte le New York Times. Aucune charge n'est retenue contre lui mais l'administration Trump l'accuse d'être lié au Hamas et a invoquée une loi rarement utilisée pour entamer une procédure d'expulsion.
Toute l'introduction de la partie relative à la remise en cause de la liberté d'expression est manquante. Ce qui peut rendre moins compréhensible le propos.
Croyant à une erreur, j'ai demandé une nouvelle transcription en téléchargeant à nouveau le fichier audio, mais j'ai obtenu le même résultat.
J'ai donc fait une troisième tentative, avec les mêmes fichiers audio d'origine sur un autre site: converter.app.
Et cette fois, j'ai obtenu la transcription complète du texte de la revue de presse.
Outre le fait que le texte non retranscrit sert d'introduction, son absence peut nuire à la compréhension du commentaire et qu'il est notable qu'il met en évidence une critique de la politique d'immigration de l'administration US sous l'impulsion de Trump. Est-ce en raison d'un problème technique ou au contraire d'un biais de l'algorithme de l'IA de reconnaissance.
Le biais algorithmique, particulièrement pour la reconnaissance vocale, est le chat noir de l'IA car elle peut être influencée par la manière dont les données sont collectées, selon les modèles d'apprentissage utilisés, ou même par des ajustements des concepteurs pour mitiger certaines interprétations controversées ou sensibles
commentaire : Ce défaut de transcription montre, encore une fois, qu'il faut toujours accepter avec circonspection la production d'un système basé sur une intelligence artificielle, même si comme moi vous en êtes un utilisateur régulier et généralement satisfait.
Mise à jour du 16 mars 2025 :
Après plusieurs essais infructueux de téléchargement de fichiers le 15 mars, le message suivant s'est affiché à chaque tentative de téléchargement "une erreur est survenue…"
Le 16 mars 2025, revenant sur mon site habituelRiverside/transcription. de transcription audio vers texte, j'ai pu, à nouveau, télécharger et obtenir la transcription de plusieurs fichiers audio. J'ai donc tenté une nouvelle transcription du fichier de la revue de presse, citée plus haut, pour finalement obtenir la même transcription sans le paragraphe d'introduction litigieux.
Commentaire : : Lorsque, dans un premier temps, je pensais qu'il s'agissait d'un problème d'ordre technique de Riverside, notamment à cause de l'impossibilité de télécharger des fichiers, il s'avère, après cette dernière transcription partielle, que je me trompais et qu'il s'agit plutôt d'un biais algorithmique Qaund il n'est pas involontaire, il est utilisé pour fausser ou déformer les résultats afin de leurrer le lecteur limitant les thèmes de conversation choisis. La méthode est habile puisqu'évitant une obstruction complète, trop visible, elle autorise une transcription partielle du message. Une nouvelle forme d'obfuscation. A chacun d'en tirer ses conclusions.
-