speech to text

J'ai testé 3 logiciels pour retranscrire de l'audio en texte avec IA ou transcripteurs humains

Dans le cadre de mon travail je devais faire retranscrire une longue vidéo en texte pour en faire les sous-titres et préparer une traduction. C’était trop compliqué et long de tout faire manuellement, j’ai donc cherché des outils ou des prestataires pour le faire à ma place.

Après quelques recherches, j’ai trouvé de nombreux outils gratuits, mais ils étaient tous basés sur de l’IA avec une limite de retranscription et une qualité assez inégale dans la durée. Coté prestataires, les délais étaient élevés et les tarifs aussi. J’ai fini par me diriger vers des outils qui combinent les 2 approches et proposent au choix une traduction IA ou une transcription humaine, mais s’occupent de toute la gestion des transcripteurs de façon transparente pour l’utilisateur (comme si c’était un outil automatique).

Voici les 3 outils de transcription audio en texte, qui sont pour moi les meilleurs en termes de qualité et de rapport qualité/prix.

  • DERICAM Microphone USB pour Ordinateur de Bureau et Ordinateur Portable, Micro PC à condensateur omnidirectionnel à 360° pour la Télé-conférence, Le Chat en Ligne, Podcasting, L’enregistrement, M1
    ♫Excellente Clarté Audio: Plug & Play, le microphone à condensateur recouvert de coton absorbant le son haute densité rend le son plus clair et plus lisse.Le microphone peut capter le son à 360 ° omnidirectionnel.De plus, il peut capter le moindre signal et reproduire votre voix avec éclat. parler face à face. ♫Performance Suprême: le microphone peut capter votre voix à une distance de 10 pieds, mieux que le microphone d’ordinateur traditionnel.Vous n’avez pas à parler plus fort directement au microphone de l’ordinateur portable du PC ou à vous répéter encore et encore, il suffit de poursuivre une conversation normale. ♫Conception Compacte et Portable: Design portable compact, il a à peu près la taille d’une petite main, il reste donc parfaitement sur la table de la salle de conférence sans prendre trop de place.Retournez simplement le microphone de conférence dans votre poche ou votre mallette. ♫Technologie d’annulation Avancée: la puce SMART haute performance intégrée peut bloquer efficacement le bruit et éliminer l’écho (C’est juste un microphone, pas un haut-parleur). ♫Utilisation Polyvalente: réunion en ligne, conférence et négociation d’affaires, chat vidéo / audio, skype, jeux et plus encore.C’est une excellente solution pour tous ceux qui ont besoin de faire de la visioconférence, d’enregistrer des réunions de bureau dans la salle de conférence / salle de réunion. Convient à toutes les occasions. Parfait pour les réunions, les interviews, le podcasting, l’enregistrement en home studio, YouTube, Twitch, skype, FaceTime, les jeux et plus encore.
  • HP Laptop 15s-fq0002sf PC Portable 15.6″ FHD (Intel Celeron, RAM 4 Go, SSD 128 Go, AZERTY, Windows 11 Famille en Mode S) Gris Ardoise, Microsoft 365 Personnel inclus pendant 1 an
    Windows 11 Famille en mode S FIN, LÉGER ET AUTONOME : Avec un poids de 1,65kg et une longue autonomie de batterie PERFORMANCE FIABLE TOUS LES JOURS : PC portable avec processeur Intel Celeron N4120, 4 Go de RAM et un stockage SSD de 128 Go SUPERBE ÉCRAN : Écran Full HD de 15,6 pouces (1920 x 1080) à micro-bords et antireflets SON HAUTE-QUALITÉ : Doubles haut-parleurs, HP Audio Boost et optimisation sonore signée Bang & Olufsen CHARGE RAPIDE : chargement d’environ 50% de la batterie en 45 minutes CONNECTIVITÉ : 1 port USB Type-C SuperSpeed + 2 ports USB Type-A SuperSpeed + 1 port HDMI 1.4b + 1 lecteur de cartes multimédias SD multiformat + 1 adaptateur secteur Smart Pin + 1 prise combinée casque/microphone 1 an de garantie

HappyScribe

J'ai testé 3 logiciels pour retranscrire de l'audio en texte avec IA ou transcripteurs humains

Happyscribe est un logiciel de transcription automatique qui permet de convertir facilement des fichiers audio et vidéo en texte. Il propose 2 types de services à savoir la conversion de fichiers audio en fichiers texte et du sous-titrage automatique de vidéos. Il fonctionne au choix soit via de l’IA, soit via de la sous-traitance avec des transcripteurs humains, mais vous n’aurez absolument rien à gérer.

C’est le logiciel de retranscription qui présente le meilleur rapport qualité/prix de ceux que j’ai testés.

Principales fonctionnalités d’HappyScribe

L’interface de l’outil est très claire :

  • L’outil édition est très facile à prendre en main. Il vous montre  les zones où la transcription a été difficile pour que vous n’ayez pas à tout relire à chaque fois et que vous relisiez uniquement les passages qui pourraient etre mal transcrits
  • Le logiciel propose deux modes de transcription. Il vous propose de réaliser la transcription de vos audios et vidéos automatiquement par IA ou de passer par des transcripteurs professionnels qui s’occuperont de tout

Avantages

  • Un logiciel puissant avec un mode édition très performant
  • Plus de 120 langues sont disponibles, c’est une des seules plateformes à proposer autant de langues
  • Plus de 45 formats d’importations et d’exportations sont compatibles avec l’outil
  • Aucune limite de poids/taille pour les fichiers
  • Très bonne précision de retranscription, 85% par l’IA et 99% par le professionnel

Inconvénients

  • L’outil est uniquement disponible sur internet, il n’y a pas d’application mobile

Prix et modes de facturation

Étant donné qu’il y a deux modes de retranscription, il y a deux tarifs différents :

  • Pour une retranscription automatique réalisée par une IA, c’est 0,20 € par minute
  • Pour une retranscription professionnelle, c’est 3€ par minute

Le logiciel propose aussi une formule entreprise, il suffit de contacter l’équipe de Happy Scribe sur leur site pour plus de détails.

Amberscript

J'ai testé 3 logiciels pour retranscrire de l'audio en texte avec IA ou transcripteurs humains #2

Amberscript est un logiciel de transcription d’audio et de vidéo. Il est d’une très grande précision de qualité professionnelle. De grandes sociétés comme Disney ou Netflix l’utilisent, mais l’outil reste simple à prendre en main que l’on soit professionnel ou non.

Principales fonctionnalités d’Amberscript

Une interface simple et une application mobile :

  • Le logiciel vous propose également deux modes de transcription. Il permet de réaliser la transcription de vos audios et vidéos automatiquement par IA ou par des transcripteurs professionnels
  • Le logiciel est utilisable aussi via une application mobile

Avantages

  • Un logiciel de qualité professionnelle, dans l’édition ou l’utilisation, tout est pensé pour être pratique et efficace, tout en restant facile à prendre en main
  • Plus d’une quarantaine de langues sont disponibles
  • On peut facilement distinguer les différents interlocuteurs du contenu audio ou vidéo grâce à une option
  • Une application mobile
  • Une formule pour l’essayer gratuitement

Inconvénients

  • Il n’y a pas de commande « copier – coller »

Prix et modes de facturation

Il existe plusieurs modes de facturation et donc plusieurs prix.

Deux formules basées uniquement sur de la transcription faite par une IA :

  • Prépayé : Vous pouvez choisir entre 1 heure et 100 heures de transcription audio à 10 € de l’heure 
  • Abonnement : 32 € par mois en abonnement annuel ou 40 € par mois en abonnement mensuel. Petit bonus par rapport au forfait prépayé, cette offre inclut 5 heures par mois d’audio et de vidéos en plus

Et une formule avec transcripteurs professionnels ::

  • Professionnel : À partir de 1,90 € par minute. Disponible en 11 langues et avec une précision de transcription de 99,99 %

Amberscript propose également une offre entreprise, disponible via devis sur leur site.

Sonix

J'ai testé 3 logiciels pour retranscrire de l'audio en texte avec IA ou transcripteurs humains #3

Sonix est un logiciel de transcription d’audio et de vidéo. Il est également réputé pour sa qualité professionnelle, et compte parmi ses clients des sociétés comme Google, Microsoft ou le groupe LVMH.

Contrairement aux 2 outils ci-dessus, Sonix est complètement automatisé et ne propose pas de transcription par des humains.

Principales fonctionnalités de Sonix

  • Un des logiciels les plus rapides du marché, il vous permet de retranscrire vos audios en texte automatiquement en quelques minutes seulement
  • Une qualité professionnelle, si autant de grosses entreprises l’utilisent c’est que sa qualité et sa précision sont vraiment bonnes

Avantages

  • Un logiciel de qualité professionnelle
  • Plus de 35 langues disponibles
  • Très précis, il reconnaît la ponctuation
  • Réduction de bruit, pour se focaliser sur l’audio
  • Possibilité d’utiliser le logiciel gratuitement pour 30 minutes
  • Disponible sans abonnement

Inconvénients

  • Sonix ne propose pas de transcription par des professionnels, mais uniquement par IA
  • Pas d’application mobile

Prix et modes de facturation

La formule standard à 10 $ de l’heure propose :

  • Stockage fichier de 10 GO
  • Possibilité de personnaliser des fichiers
  • Assistance par e-mail

La formule premium à 5 $ de l’heure et 22 $ par utilisateur par mois propose :

  • 50 Go de stockage
  • Possibilité de partager et de modifier la transcription
  • Téléchargement de média en masse

Sonix propose aussi une offre pour les entreprise. Pour avoir plus de détail, il suffit de demander un devis sur leur site.

Comme je vous le disais en intro, vous trouverez des foules de logiciels de retranscription sur la toile, gratuits ou à petits prix. Néanmoins ils ont tous des limitations assez importantes et je pense sincèrement qu’il vaut mieux passer par des logiciels payants, à petit prix, pensés intelligemment pour cet usage. Vous gagnerez beaucoup de temps, en particulier si vous avez ne serait-ce qu’une seule longue vidéo à retranscrire comme moi !

  • zealsound USB Microphone à Condensateur, Micro Gaming pour PC Phone Ordinateur Portable et PS4&5, avec Muet/Écho/Réduction du Bruit, pour Streaming, Enregistrement,Vocal,Podcast,Twitch, ASMR,K66 Noir
    【Forte compatibilité】(Inclus: Câble audio USB-A (1,8 m), adaptateur pour iPhone, adaptateur USB C).Ce microphone USB k66 est compatible avec Windows, Andriod, iOS, macOs, Chromes OS Lunex System. Il est compatible avec l’iPhone, l’iPad et l’MacBook; le microphone PC avec sortie USB permet une intégration directe avec ou ordinateur, Desktop, PS4 et PS5 ; tous les appareils de type C (téléphone portable, tablette et ordinateur portable). Et aucun pilote supplémentaire n’est requis. 【Excellente qualité sonore】 Le microphone stéréo offre une lecture claire et équilibrée sur une large réponse en fréquence et traite des SPL élevés, offre un son détaillé et fidèle pour le studio ou en déplacement. Caractéristique rénale pour un minimum de bruit et de contrôle des commentaires, offre une capture impeccable et précise. Convient pour les présentations, podcasts, skype, zoom, enregistrements, instantanés, jeux et flux en direct sur Twitch. 【Moniteur en temps réel】 La sortie casque stéréo de 3,5 mm du microphone de table offre une surveillance directe et sans latence. Il vous permet de surveiller l’entrée du microphone en temps réel. Idéal pour la maison studio, le karaoké, le jeu, le chant, le chat, la smule, la bande de garage, Skype, Discord, Yahoo, l’enregistrement YouTube, la recherche de Google Voice, la réunion zoom, la classe en ligne et le stream. 【Microphone de bureau professionnel】: avec bouton de réduction du bruit et bouton de volume/Echo réglable, lumière LED intégrée pour indiquer l’état de fonctionnement. La puce DSP offre un système simple et efficace pour les applications vocales, podcasting, ASMR et voix Over. 【Le kit d’accessoires comprend】1* K66 micro en streaming robuste et durable en métal de qualité studio 1* support de microphone externe en métal, ; 1*câble audio usb (1.8m) ; 1 adaptateur USB-C ; 1* adaptateur de micro pour iphone; 1*pare-brise en mousse de microphone; 1* manuel d’utilisation et support technique gratuit.
  • Veetop Micro PC USB pour Ordinateur, Micro Gamer, PC Micro pour Vidéoconférence, Enregistrement Vocal, Podcasting, Skype, Youtube, Jeux, Streaming
    Le microphone usb Veetop peut capturer clairement les sons de toutes les directions grâce à l’utilisation de la technologie d’enregistrement omnidirectionnelle, il utilise une puce intelligente de réduction du bruit, qui peut capter un son clair et réduire le bruit de fond et l’écho Le micro usb a une transmission claire du signal vocal, grâce au microphone à condensateur USB extra large. Prise spatiale à 360 degrés, peut être utilisée en conjonction avec une variété de logiciels tels que l’enregistrement, le chat vidéo et l’entrée vocale. Convient pour PS4, Discord, Chat, Podcast, Skype, YouTube, jeux, etc Notre micro pour pc est compatible avec tous les systèmes d’exploitation (Windows, Linux, Mac OS) et il est pas besoin de pilote ou logiciel installé, il suffit de brancher le microphone USB dans n’importe quel port USB disponible Notre microphone usb a une conception d’interrupteur à un bouton indépendant sur la base, de sorte que vous pouvez facilement contrôler le microphone marche / arrêt, et pas besoin de le faire fonctionner sur l’ordinateur. Il est également un choix idéal pour les micros pc tels que ps4 et ps5 Votre satisfaction est notre priorité. Si vous avez quoi que ce soit avec notre micro ordinateur n’hésitez pas à nous contacter, notre service clientèle vous répondra dans les 24 heures

votes
Noter cet article
S’abonner
Notification pour
guest

Commentaires
Commentaires en ligne
Afficher tous les commentaires