banner

Nouvelles

Jul 05, 2023

Les 2 meilleurs logiciels de dictée de 2023

Inscrivez-vous à la newsletter quotidienne de Wirecutter, The Recommendation, pour courir la chance de gagner le Miele Complete C3 Calima à 800 $, un aspirateur-traîneau agile que nos experts apprécient depuis longtemps après des années de tests rigoureux. Thermes et conditions d'application.

Le logiciel de dictée facilite la navigation sur votre ordinateur et la communication sans taper une seule phrase.

Cette flexibilité est excellente si vous avez simplement besoin d'une pause de votre clavier, mais elle est particulièrement importante pour les personnes souffrant de troubles du traitement du langage ou de handicaps physiques. Envoyer un texte rapide ou taper un mémo peut être difficile, voire totalement irréalisable, si vous avez une dextérité manuelle limitée ou des douleurs chroniques, mais ce type de logiciel peut rendre ces tâches relativement faciles.

Après avoir examiné 18 options, nous avons constaté que Apple Voice Control et Nuance Dragon Home 15 sont plus précis, efficaces et utilisables que tous les autres outils de dictée que nous avons testés.

Mais la technologie derrière le logiciel de dictée (également appelé logiciel de synthèse vocale ou de reconnaissance vocale) présente quelques défauts. Ces applications ont des courbes d'apprentissage difficiles, et le biais inhérent que les humains y programment signifie que leur précision peut varier, en particulier pour les personnes ayant divers accents, sociolectes et dialectes comme l'anglais vernaculaire afro-américain, ou des troubles de la parole. Néanmoins, pour ceux qui sont capables de travailler dans les limites de la technologie, nos choix sont les meilleures options disponibles pour de nombreuses personnes qui ont besoin d'aide pour utiliser un outil de traitement de texte.

Le contrôle vocal d'Apple est plus facile à utiliser et produit des transcriptions précises plus fréquemment que la concurrence. Il offre également un hub de commande robuste qui facilite les corrections.

Le contrôle vocal d'Apple est installé avec macOS, iOS et iPadOS, il est donc gratuit pour tous ceux qui possèdent un appareil Apple. Lors de nos tests, il a produit des transcriptions précises la plupart du temps, en particulier pour les locuteurs aux accents américains standard. Les outils concurrents de Google, Microsoft et Windows ont obtenu en moyenne 15 points de moins que les logiciels d'Apple dans nos tests de précision. Parmi notre panel de testeurs, ceux qui avaient une dextérité manuelle limitée ont adoré les fonctionnalités de technologie d'assistance de Voice Control, qui facilitaient la navigation dans le système d'exploitation et la modification des messages en mode mains libres. Mais bien que l'expérience offerte par Voice Control soit la meilleure que nous ayons trouvée pour les appareils Apple, elle a souvent mal compris des mots ou des phrases entières prononcées par des testeurs avec des accents régionaux ou américains ou des troubles de la parole tels que le bégaiement. Bien que de tels problèmes de précision soient attendus pour la modélisation de la reconnaissance vocale qui s'est historiquement appuyée sur des sources de données homogènes, d'autres outils (en particulier, Nuance Dragon Home 15, disponible uniquement pour Windows) ont légèrement mieux performé à cet égard. L'outil d'Apple peut également être légèrement en retard si vous exécutez simultanément plusieurs programmes gourmands en ressources processeur, ce qui, selon nos panélistes, a ralenti leur productivité.

Publicité

Dragon Home 15 est l'outil de dictée le plus précis que nous ayons testé pour tous les systèmes d'exploitation, mais son prix élevé est beaucoup à avaler.

À 200 $, Nuance Dragon Home 15 est l'outil de reconnaissance vocale le plus cher que nous ayons testé, mais c'est la meilleure option pour les personnes qui possèdent des PC Windows. Comme avec tous les logiciels de dictée que nous avons essayés, l'utilisation de Dragon Home implique une courbe d'apprentissage au début, mais le didacticiel Dragon fait un excellent travail pour vous aider à démarrer. Notre panéliste souffrant de troubles du traitement du langage a déclaré que Dragon Home était l'une des options de dictée les plus précises qu'ils aient essayées, et que les fonctionnalités de commande robustes leur permettaient de naviguer rapidement dans leur machine. Comme notre choix Apple, Dragon Home a eu des problèmes avec divers dialectes américains et accents internationaux ; il a mieux fonctionné pour les testeurs aux accents américains "neutres". Il a également eu du mal à éliminer tous les bruits de fond, bien que vous puissiez atténuer ces problèmes en utilisant un microphone ou un casque externe. Bien que Dragon Home ait produit les transcriptions les plus rapides de tous les outils que nous avons testés, ce n'était pas un point positif sans réserve : la moitié de nos panélistes ont déclaré qu'ils préféraient les transcriptions en temps réel plus lentes à la méthode de transcription phrase par phrase de Dragon Home, car ils trouvaient que ses pauses plus longues entre l'apparition des phrases sur leur écran étaient gênantes.

Le contrôle vocal d'Apple est plus facile à utiliser et produit des transcriptions précises plus fréquemment que la concurrence. Il offre également un hub de commande robuste qui facilite les corrections.

Dragon Home 15 est l'outil de dictée le plus précis que nous ayons testé pour tous les systèmes d'exploitation, mais son prix élevé est beaucoup à avaler.

En tant que rédacteur senior chez Wirecutter, j'ai passé cinq ans à couvrir des sujets complexes, à rédiger des articles sur des sujets tels que les tests ADN de chien, les lunettes anti-lumière bleue, les outils de désabonnement aux e-mails et les tactiques de manipulation technologique utilisées par les agresseurs domestiques. J'ai été l'un des premiers à adopter le logiciel de dictée au début, avec une version beaucoup moins raffinée du logiciel Dragon de Nuance. Comme d'autres personnes que j'ai interviewées pour ce guide, j'ai rapidement abandonné le logiciel en raison de ses performances médiocres et de sa courbe d'apprentissage difficile. Depuis lors, j'utilise occasionnellement des outils de dictée et d'accessibilité sur mes appareils pour envoyer des messages rapides lorsque mes mains sont collantes à cause de friandises ou couvertes de produits capillaires de ma routine matinale. Lors de la rédaction de ce guide, j'ai dicté environ un tiers du texte à l'aide des outils que nous recommandons.

Mais je ne suis pas quelqu'un qui dépend des outils de dictée pour communiquer, j'ai donc consulté divers experts des communautés de l'IA et du handicap pour mieux comprendre le rôle que ce type de logiciel joue pour rendre le monde plus accessible aux personnes handicapées. J'ai lu des articles et des études évaluées par des pairs, j'ai parcouru les forums sur le handicap que je fréquente pour obtenir des conseils sur ma douleur chronique et j'ai sollicité la contribution d'organisations d'affinité pour savoir ce qui fait un excellent outil de dictée. Et j'ai étudié les dernières recherches sur la technologie de l'IA et les biais de reconnaissance vocale de Harvard Business Review, de l'Institut d'intelligence artificielle centrée sur l'homme de l'Université de Stanford et du projet d'accessibilité vocale Urbana-Champaign de l'Université de l'Illinois, entre autres.

J'ai également discuté avec Meenakshi Das, défenseur des droits des personnes handicapées et ingénieur logiciel chez Microsoft, et Diego Mariscal, PDG de l'accélérateur de startups 2Gether-International, fondateurs handicapés, des limites des outils de dictée pour les personnes souffrant de divers handicaps. J'ai discuté de l'éthique de l'intelligence artificielle avec Sayash Kapoor, candidat au doctorat à l'Université de Princeton. J'ai assisté à une conférence du conseiller de Kapoor, Arvind Narayanan, PhD, intitulée "Les limites de l'approche quantitative de la discrimination". J'ai parlé avec Christopher Manning, codirecteur du Stanford Institute for Human-Centered Artificial Intelligence à l'Université de Stanford, de l'évolution des logiciels de dictée. Et j'ai consulté la rédactrice en chef de Wirecutter sur l'accessibilité, Claire Perlman, pour m'assurer que mon approche de ce guide reste accessible, nuancée et reflète les besoins de la communauté des personnes handicapées.

Enfin, j'ai réuni un panel de test de neuf personnes ayant divers degrés d'expérience dans l'utilisation de logiciels de dictée, dont plusieurs souffrant de troubles allant des troubles de la parole à la dextérité limitée des mains en passant par les traumatismes cérébraux graves. Nos testeurs ont également auto-déclaré des accents allant de l'Américain « neutre » au Louisianais « vague » en passant par l'Indien « perceptible ».

Les technologies d'assistance telles que les outils de synthèse vocale peuvent vous aider à tout faire, de l'envoi de textes mains libres en conduisant à la saisie d'un travail de fin de session sans jamais toucher votre clavier.

Nous avons rédigé ce guide en pensant à deux types d'utilisateurs : les personnes handicapées qui dépendent d'un logiciel de dictée pour communiquer et les personnes ayant l'usage libre de leurs mains qui utilisent occasionnellement ces outils lorsqu'elles doivent travailler sans être attachées à leur clavier. Cependant, nous mettons davantage l'accent sur les personnes handicapées, car les logiciels de dictée peuvent mieux servir cette population et peuvent, en fin de compte, leur faciliter l'accès au monde et la communication.

Les utilisateurs ayant une dextérité manuelle limitée ou inexistante, des différences de membres ou des problèmes de traitement du langage peuvent trouver un logiciel de reconnaissance vocale utile car il leur donne la liberté de communiquer dans leur environnement préféré. Par exemple, nos panélistes ayant des troubles d'apprentissage ont déclaré qu'ils aimaient vagabonder mentalement ou "vider leur cerveau" tout en utilisant un logiciel de reconnaissance vocale pour terminer des projets, et qu'ils se sentaient moins obligés de tout écrire parfaitement la première fois.

Pourtant, notre approche avait des limites : nous nous sommes concentrés sur la capacité de chaque outil à s'intégrer et à modifier des documents texte, plutôt que de naviguer verbalement sur un écran d'ordinateur entier, une fonctionnalité dont certaines personnes atteintes de paralysie cérébrale, de la maladie de Parkinson, de tétraplégie et d'autres troubles neurologiques ont besoin, surtout si elles n'ont pas de problèmes d'élocution et un contrôle moteur limité ou inexistant. Nos choix offrent certaines fonctionnalités d'accessibilité, telles que la navigation dans la grille, l'édition de texte et les commandes vocales, qui facilitent l'utilisation des appareils, mais tous ceux qui ont testé le logiciel pour nous n'ont pas utilisé ces fonctionnalités de manière intensive, et la majorité des logiciels de reconnaissance vocale que nous avons considérés ne disposent pas de ces options premium.

Outre l'absence de fonctionnalités d'accessibilité, il existe d'autres obstacles potentiels à l'utilité de ces logiciels, tels que la façon dont ils fonctionnent avec une gamme d'accents.

Les logiciels de reconnaissance vocale sont devenus de plus en plus disponibles dans les années 1980 et 1990, avec l'introduction de machines à écrire parlantes pour les malvoyants, de logiciels commerciaux de reconnaissance vocale et du traitement des appels à frais virés, selon Christopher Manning, codirecteur du Stanford Institute for Human-Centered Artificial Intelligence. Mais "la reconnaissance vocale était vraiment horrible", a-t-il déclaré. "Si vous étiez anglophone-indien, les chances [de vous comprendre] étaient à peu près nulles ; maintenant, ce n'est pas si mal."

Comme nous l'avons constaté dans nos tests, la définition de "mauvais" d'un individu peut varier considérablement en fonction de son accent et de sa capacité à parler. Et nos experts en intelligence artificielle ont convenu que les limites de la technologie de traitement du langage naturel (PNL) utilisée dans les logiciels de dictée sont mises à nu face à divers accents, dialectes et modèles de parole du monde entier.

Sayash Kapoor, un doctorant de deuxième année étudiant l'éthique de l'IA à l'Université de Princeton, a déclaré que les outils de PNL sont souvent formés sur des sites Web comme Reddit et Wikipedia, ce qui les rend biaisés contre les sexes marginalisés et les personnes noires, indigènes et autres communautés de couleur. Le résultat final est que la plupart des logiciels de dictée fonctionnent mieux avec les accents canoniques, a déclaré Manning, comme l'anglais britannique et américain. Nos experts nous ont dit que certains outils de synthèse vocale n'ont pas de modélisation fine pour différents dialectes et sociolectes, sans parler de l'identité de genre, de la race et de l'emplacement géographique.

En fait, une étude a révélé que les outils de synthèse vocale d'Amazon, Apple, Google, IBM et Microsoft présentaient des "disparités raciales substantielles", car le taux moyen d'erreurs de mots pour les locuteurs noirs était près de deux fois supérieur à celui des locuteurs blancs. Cette limitation affecte non seulement la facilité avec laquelle les locuteurs peuvent dicter leur travail, mais également l'efficacité avec laquelle ils peuvent corriger des phrases et donner des commandes de formatage, ce qui fait toute la différence entre une expérience utilisateur transparente ou douloureuse.

Le biais inhérent aux outils de reconnaissance vocale s'étend également aux obstacles à la parole. Wirecutter a approché plusieurs personnes souffrant de bégaiement ou d'autres types de troubles de la parole et du langage, tels que ceux résultant d'une paralysie cérébrale ou de la maladie de Parkinson, pour rejoindre notre panel de testeurs. Mais la plupart ont refusé, citant une histoire de mauvaises expériences avec les outils de dictée. L'avocate des personnes handicapées Meenakshi Das, qui bégaie, a déclaré qu'elle n'utilisait aucun outil de conversion de la parole en texte, car il reste encore du travail à faire à l'échelle de l'industrie pour rendre le logiciel vraiment accessible. (Das est ingénieur logiciel chez Microsoft, propriétaire de Nuance, la société qui produit notre choix pour les PC Windows.)

Das et Kapoor ont tous deux remarqué une tendance des accélérateurs à combler l'écart de biais pour les personnes ayant des accents, des troubles de la parole et des troubles du traitement du langage afin de permettre à ces groupes d'utiliser des outils de dictée. En octobre 2022, par exemple, l'Université de l'Illinois a annoncé un partenariat avec Amazon, Apple, Google, Meta, Microsoft et des organisations à but non lucratif sur le projet d'accessibilité vocale pour améliorer la reconnaissance vocale des personnes handicapées et de divers modèles de parole.

Mais jusqu'à ce que des outils de synthèse vocale véritablement inclusifs arrivent, les membres de ces groupes mal desservis peuvent consulter nos conseils pour tirer le meilleur parti des logiciels actuellement disponibles.

Nous avons sollicité des informations sur les outils de synthèse vocale de nos experts et lu des critiques de logiciels, des études évaluées par des pairs, des forums sur les personnes handicapées et des sites Web d'organisations pour savoir ce qui fait un excellent outil de dictée.

Nous avons identifié 18 progiciels de dictée et comparé leurs fonctionnalités, la compatibilité de la plate-forme, les politiques de confidentialité, le prix et les avis de tiers. Parmi les fonctionnalités que nous recherchions figuraient une grande variété de commandes vocales utiles, la facilité de navigation, la présence de commandes et de vocabulaire personnalisables, la prise en charge de plusieurs langues et des outils d'aide ou des didacticiels intégrés. Les programmes les mieux classés selon nos critères, offrant généralement un mélange de fonctionnalités robustes et une large disponibilité de plate-forme, ont fait partie de notre liste restreinte pour les tests :

Nous avons défini par défaut ces outils sur le paramètre anglais américain et avons utilisé chaque outil pendant quelques heures sur nos ordinateurs et appareils mobiles. Ensuite, nous avons évalué leurs performances en fonction de la précision, de la facilité d'utilisation, de la vitesse, des interférences sonores et de la compatibilité des applications. Nous avons mis l'accent sur les taux de précision, en effectuant une série de tests de contrôle pour voir dans quelle mesure les outils de dictée reconnaissaient des échantillons de 150 à 200 mots de discours informels, les paroles de la chanson "No One" d'Alicia Keys et le jargon scientifique d'une étude de vaccin évaluée par des pairs. À partir de là, nous avons fait progresser les outils de dictée avec les notes les plus élevées jusqu'à notre cycle de tests par panel.

Neuf panélistes ont testé nos demi-finalistes pendant trois semaines. Notre groupe diversifié de testeurs comprenait des personnes handicapées allant des troubles de la parole à la dextérité limitée des mains en passant par les traumatismes cérébraux graves. Ils ont déclaré avoir des accents allant de l'américain au catalan en passant par l'indien. Tous les panélistes avaient des degrés divers d'expérience préalable avec les logiciels de dictée.

Rencontrez nos testeurs :

Les panélistes ont envoyé des SMS, rédigé des e-mails et codé des logiciels à l'aide des divers outils de synthèse vocale, après quoi ils ont fourni des notes détaillées sur leurs expériences et identifié les outils qu'ils se sentiraient à l'aise d'utiliser régulièrement ou d'acheter eux-mêmes.

Pour arriver à nos choix, nous avons combiné les expériences des panélistes avec les résultats de notre tour de contrôle, ainsi que les recommandations de nos experts.

Le contrôle vocal d'Apple est plus facile à utiliser et produit des transcriptions précises plus fréquemment que la concurrence. Il offre également un hub de commande robuste qui facilite les corrections.

Prix:gratuitSystème opérateur:macOS, iOS, iPadOSLangues prises en charge :21 à 64 langues, selon les paramètres, y compris l'hindi, le thaï et plusieurs dialectes de l'anglais et de l'italien.

Apple Voice Control est facile à utiliser, surpasse les principaux concurrents de Google, Microsoft et Nuance, et offre des dizaines d'invites de commande pour une expérience plus fluide, une fonctionnalité particulièrement utile pour les personnes ayant une dextérité manuelle limitée. Étant donné que Voice Control est profondément intégré à l'écosystème Apple, il est plus accessible que la plupart des autres outils que nous avons testés. Il est disponible gratuitement sur macOS, iOS et iPadOS ; vous pouvez l'activer en allant surParamètres > Accessibilité sur votre appareil préféré. Une fois que vous l'avez activé, vous remarquerez peut-être qu'il fonctionne de la même manière que les fonctions Dictée et Siri de votre téléphone. C'est parce qu'ils utilisent les mêmes algorithmes de reconnaissance vocale. Cela signifie que la courbe d'apprentissage inhérente à tous les outils de synthèse vocale est légèrement moins difficile avec le contrôle vocal, en particulier si vous avez déjà utilisé Dictation ou Siri, car ils connaissent déjà vos modèles de parole. (Si vous vous demandez en quoi la dictée et le contrôle vocal diffèrent, la dictée est un outil de synthèse vocale qui omet les diverses fonctions d'accessibilité et de navigation du contrôle vocal.)

Lors de nos tests, Voice Control a régulièrement produit des transcriptions plus précises que la concurrence, notamment Nuance Dragon Home 15 (notre choix pour les PC Windows), Google Docs Voice Typing et Windows Voice Recognition. Dans nos tests de contrôle, il était précis à 87 % avec un discours décontracté et sans accent. Comparativement, Dragon Home était précis à 82 %, tandis que la reconnaissance vocale Windows n'était précise qu'à 64 %. Google Docs Voice Typing a fonctionné sur un pied d'égalité avec Voice Control, mais il a échoué à transcrire les contractions, l'argot et les symboles beaucoup plus fréquemment. La plupart des outils que nous avons testés, y compris Voice Control, étaient environ 10 % moins précis lors de nos tests de contrôle riches en jargon qui incluaient des mots scientifiques issus d'une étude immunologique. (Une exception notable à cet égard était Dragon Home, qui n'a montré aucune baisse notable avec un langage plus technique.)

La moitié de nos testeurs ont convenu qu'ils utiliseraient régulièrement le contrôle vocal et qu'ils paieraient même s'ils utilisaient un logiciel de dictée. Les mots spécifiques qu'ils utilisaient pour décrire le logiciel incluaient "précis", "bon" et "impressionnant". Pourtant, nos tests dans le monde réel ont poussé le contrôle vocal à ses limites, et le logiciel a souvent mal compris les mots ou les phrases des testeurs qui avaient des accents ou des bégaiements divers. Malheureusement, de tels problèmes de précision sont à prévoir pour la modélisation de la reconnaissance vocale qui s'est historiquement appuyée sur des sources de données homogènes. Mais les performances de Voice Control s'améliorent au fur et à mesure que vous l'utilisez, alors n'abandonnez pas immédiatement si vous trouvez des inexactitudes frustrantes au début.

La technologie d'assistance d'Apple était une fonctionnalité remarquable pour nos testeurs avec une dextérité manuelle limitée, car elle leur permettait de naviguer sur leurs machines et de modifier leurs messages en mode mains libres. Ces invites de commande ont une courbe d'apprentissage difficile, il est donc peu probable que vous ayez une expérience sans faille dès le départ. Mais demander "Que puis-je dire?" fait apparaître une bibliothèque qui filtre automatiquement les commandes contextuellement pertinentes en fonction de vos actions. Par exemple, la sélection d'un dossier du bureau produit une courte liste d'invites liées à l'accès aux fichiers (telles que "Ouvrir un document"), tandis que le déplacement du curseur vers un outil de traitement de texte fait apparaître "Type". L'interface vous permet de trier rapidement les commandes pertinentes, une fonctionnalité que certains panélistes ont trouvée utile.

Nos panélistes avec des accents ont obtenu des résultats de précision mitigés avec Apple Voice Control. Les testeurs avec des accents anglais non standard ou des difficultés d'élocution ont déclaré que les performances du logiciel d'Apple s'amélioraient lorsqu'ils parlaient lentement. "Lorsque vous l'utilisez pour taper, parfois les choses se gâtent", a noté le panéliste Franc, un hispanophone et catalan natif qui a testé le logiciel en anglais. De même, ma propre expérience de dictée de ce guide s'est avérée difficile : j'ai constaté que je devais trop énoncer mes mots pour empêcher Voice Control de capitaliser des mots aléatoires et de mal saisir la phrase occasionnelle.

Nos panélistes ont convenu qu'Apple Voice Control était l'outil le plus lent qu'ils aient testé pour la transcription de texte, bien que cette différence de vitesse ne soit qu'une question de secondes, pas de minutes. Parfois, les logiciels de reconnaissance vocale traitent une phrase complète, plutôt que des mots simples, avant d'afficher le texte à l'écran, une tendance qu'environ la moitié de nos panélistes ont trouvée frustrante. "C'était vraiment distrayant d'attendre de voir si [Voice Control] avait compris ce que j'avais dit", a noté la testeuse Vicki, qui souffre d'un stress répétitif qui rend la dactylographie difficile.

La rédactrice en chef de Wirecutter pour la couverture de l'accessibilité, Claire Perlman, qui a également fait partie de notre panel, a fait écho à ce sentiment. Elle a déclaré que le temps de latence était marginal au début de sa session, mais qu'il devenait sensiblement douloureux au fur et à mesure qu'elle utilisait le logiciel. Claire a également noté que son MacBook Pro 2019, équipé d'un processeur Intel Core i5 quadricœur à 1,4 GHz, surchauffait lors de l'exécution de Voice Control pendant de longues périodes. "Le décalage que je ressens actuellement est très distrayant et me donne l'impression de devoir ralentir mon processus de pensée afin de le taper correctement", a-t-elle déclaré. Nous avons tenté de reproduire ce problème avec un MacBook Pro 2019 équipé d'un processeur Intel Core i7 à six cœurs à 2,6 GHz, et après une heure d'utilisation, nous avons constaté que le processus de reconnaissance vocale d'Apple oscillait entre 54 % et 89 % de notre CPU et que l'utilisation d'Apple Dictation variait de 1 % à 35 %, confirmant que la plate-forme robuste nécessite beaucoup de puissance de traitement. Cela dit, vous constaterez peut-être que le décalage disparaît lorsque vous fermez d'autres programmes gourmands en ressources processeur, tels que Chrome ou un jeu.

Comme nous l'avons mentionné précédemment, utiliser avec succès les invites de commande de Voice Control nécessite de l'expérience et de la finesse. Les testeurs qui ont lu le guide de démarrage rapide et regardé les didacticiels YouTube ont rapporté l'expérience la plus facile. "Il y a une courbe d'apprentissage", a déclaré le testeur Chandana, qui a un accent indien. Mais le logiciel "Que puis-je dire?" écran a été d'une grande aide, Chandana a déclaré : "J'ai pu utiliser de nombreuses fonctions que je voulais utiliser auparavant, mais je ne savais pas que je pouvais."

Enfin, le contrôle vocal fonctionne mieux dans les propres applications d'Apple, et certaines personnes peuvent trouver cette limitation inhérente difficile ou ennuyeuse. "Je l'ai trouvé plus précis dans Pages et iMessage que Google Docs et WhatsApp", a noté Claire. Dans un seul exemple, bien que Voice Control ait correctement capturé les commandes dictées telles que "Sélectionner une ligne" ou "Supprimer" dans Pages, il ne pouvait pas les exécuter dans Google Docs.

Dragon Home 15 est l'outil de dictée le plus précis que nous ayons testé pour tous les systèmes d'exploitation, mais son prix élevé est beaucoup à avaler.

Prix:200 $ par licenceSystème opérateur:les fenêtresLangues prises en charge :Anglais, français, allemand (selon la région d'achat)

Nuance Dragon Home 15 est notre choix pour les utilisateurs de PC Windows car il surpasse les outils de dictée Microsoft Word et Windows en termes de précision, traite et affiche rapidement les transcriptions, et offre un module de formation utile et une sélection d'invites de commande pour vous mettre rapidement à niveau. Contrairement à la plupart des autres logiciels de dictée de nos tests, il fonctionnait bien avec un langage technique riche en jargon, un avantage qui pourrait le rendre utile pour les personnes qui travaillent dans les sciences. (Si vous avez utilisé des versions antérieures de Dragon dans le passé, vous serez heureux de savoir que Dragon Home 15 représente une amélioration significative par rapport aux générations précédentes.)

Nos panélistes ont déclaré que Dragon Home était l'un des outils de reconnaissance vocale les plus précis qu'ils aient essayés, le décrivant comme "extrêmement précis", "fiable" et, dans au moins un cas, "sans défaut". Claire Perlman de Wirecutter, qui souffre d'arthrogrypose, a déclaré : "J'ai été vraiment époustouflée par la précision de Dragon. Il n'y a eu que deux ou trois erreurs pendant tout le temps que je l'ai utilisé." Nos tests de contrôle ont trouvé des résultats similaires. Dragon Home était précis à 82 % dans la transcription d'un discours informel (légèrement derrière Apple Voice Control, qui produisait une précision de 87 %), et dans la transcription d'un langage technique, il n'a pas montré la forte baisse de précision que nous avons constatée avec d'autres logiciels, y compris les outils de contrôle vocal et de dictée d'Apple.

Les transcriptions de Dragon Home sont apparues avec un minimum de temps de latence sur les écrans des testeurs, alors que des outils comme Otter et Windows Voice Recognition prenaient deux fois plus de temps pour produire des phrases ou des phrases. Mais les panélistes ont trouvé que la transcription phrase par phrase de Dragon Home était mitigée. Certains testeurs ont préféré voir des phrases ou des phrases entières apparaître simultanément à l'écran. "La vitesse combinée à la précision signifiait que je n'avais pas l'impression de devoir prêter une attention constante à ce qui se passait à l'écran et que je pouvais plutôt me concentrer sur mes pensées et mon écriture", a déclaré Claire. D'autres testeurs ont préféré les transcriptions en temps réel, mot par mot : "Il y a certainement eu des moments où j'étais assis là à tambouriner des doigts et à attendre", a déclaré Ben Keough, rédacteur en chef de Wirecutter. Dragon Home vous permet d'ajuster pour moins de temps de latence ou une meilleure précision en allant àOptions > Divers > Vitesse vs Précision.Mais nous n'avons pas remarqué de différence de performances lorsque nous avons modifié ce paramètre lors de nos tests de contrôle.

Comme tous les logiciels de dictée que nous avons testés, Dragon Home nécessite un peu de savoir-faire pour tirer le meilleur parti de ses fonctionnalités et obtenir les meilleures performances, mais sa multitude de commandes vocales d'accessibilité était une caractéristique préférée de nos panélistes. Contrairement à la plupart des options que nous avons testées, Dragon Home se lance avec un bref didacticiel qui vous explique comment l'utiliser, de la configuration de la meilleure position du microphone à la dictée de texte en passant par l'utilisation des invites de ponctuation.

Vous pouvez revoir le didacticiel à tout moment si vous avez besoin d'un rappel, que le panéliste Juan a trouvé utile avec sa lésion cérébrale traumatique et ses problèmes de mémoire à court terme. "Le didacticiel vous donne un bon départ sur ses fonctionnalités", a-t-il déclaré. Claire Perlman, de Wirecutter, a déclaré : « J'utilisais Dragon il y a des années, et à l'époque, entraîner le système à reconnaître votre voix était un processus onéreux. Cette fois, j'ai trouvé l'ensemble du processus de configuration et d'entraînement vraiment utile et très rapide. Et j'avais l'impression que je pouvais vraiment le faire fonctionner en mode mains libres.

Le plus gros inconvénient de Dragon Home est qu'il coûte 200 $ par licence. Les experts avec lesquels nous nous sommes entretenus ont déclaré que cette barrière à l'entrée peut rendre l'utilisation de ce logiciel impossible pour de nombreuses personnes handicapées, y compris celles qui ont un revenu limité car elles ne peuvent pas trouver de travail à distance adapté à leur handicap. De plus, devoir télécharger et activer le logiciel peut être un problème qui rappelle aux personnes handicapées que leur situation est une réflexion après coup à l'ère numérique, en particulier par rapport à Apple Voice Control ou même à la reconnaissance vocale Windows, qui sont intégrés aux systèmes d'exploitation des appareils.

Ce logiciel est compatible uniquement avec le système d'exploitation de bureau Windows ; vous ne pouvez pas l'installer sur Android, les systèmes d'exploitation d'Apple ou ChromeOS. (C'est-à-dire, à moins que vous ne partitionniez votre disque dur, mais dans ce cas, vous courez le risque de ralentir le système d'exploitation, ce qu'un panéliste avec une partition de disque a expérimenté.) Il est livré avec un abonnement d'introduction d'un an à Dragon Anywhere (150 $ après la première année), qui fonctionne avec les appareils iOS et Android, mais cette version mobile du logiciel ne peut se synchroniser qu'avec Dragon Professional (500 $), pas la version Home que nous recommandons. Cette limitation complique la formation des appareils de bureau et mobiles avec le vocabulaire personnalisé et les particularités de la parole d'un utilisateur. De plus, comme nos panélistes n'ont pas testé Dragon Anywhere, nous ne pouvons pas commenter sa convivialité ou sa précision.

Dragon Home n'est pas un outil de reconnaissance vocale que vous pouvez utiliser immédiatement. La première fois que vous chargez le logiciel, il vous invite à suivre une série de courts didacticiels. Cela signifie qu'il est important de réserver un peu de temps pour se familiariser avec le programme avant de se précipiter pour écrire, par exemple, une note de service ou une dissertation en retard. (Cela dit, quel que soit l'outil de synthèse vocale que vous choisissez, nous vous recommandons de vous familiariser avec celui-ci avant de vous lancer dans un projet à forte teneur en texte.)

Bien que Dragon Home soit le logiciel de dictée compatible Windows le plus accessible et le plus précis que nous ayons testé, il a parfois échoué dans ses transcriptions, en particulier pour les testeurs qui n'utilisaient pas de microphone ou de casque dédié. Nuance recommande d'acheter son casque USB Dragon (35 $) ou son casque Bluetooth Dragon (150 $) pour la meilleure expérience et indique que les utilisateurs peuvent améliorer le taux de précision du programme en apportant des corrections au texte via une invite vocale et en exécutant sa fonction de réglage de la précision pour optimiser ses modèles de langue. À en juger par nos tests, nous pouvons dire que tout micro dédié de haute qualité correctement positionné améliorera vos résultats. Même ainsi, un panéliste qui utilisait un casque filaire a remarqué que Dragon Home ne pouvait pas capturer divers noms comme "Yeiser", mais n'avait aucun problème avec des noms traditionnellement anglos comme "Brady".

Enfin, ce logiciel de dictée n'est disponible qu'en trois langues (anglais, français et allemand), rappel brutal que l'accessibilité n'est pas toujours accessible à tous. Dans ces contraintes, vous pouvez spécifier une région linguistique pour vous assurer que l'orthographe correspond à votre région préférée, comme l'anglais canadien par rapport à l'anglais américain. Ou vous pouvez dépenser 500 $ pour une licence individuelle Dragon Professional, qui offre également un accès en néerlandais, italien et espagnol. (La possibilité d'acheter une licence de langue préférée peut varier selon l'endroit où vous vivez.)

Nos panélistes ont convenu qu'aucun logiciel de dictée n'est parfait, mais pour la plupart, la fonctionnalité de ces programmes s'améliore au fur et à mesure que vous les utilisez. Voici comment tirer le meilleur parti de votre outil de synthèse vocale :

Vous renoncez à une certaine confidentialité lorsque vous parlez dans un microphone afin qu'un outil de synthèse vocale puisse transcrire vos mots. Comme c'est le cas lorsque vous parlez au téléphone, toute personne à proximité peut entendre ce que vous dites. Et de nombreux outils de dictée intègrent votre audio dans leurs algorithmes d'apprentissage pour améliorer leur service ou pour vous vendre quelque chose. Dans certains cas, une entreprise peut même remettre tous vos enregistrements et transcriptions de synthèse vocale aux forces de l'ordre. En fin de compte, si vous traitez des données sensibles et que vous disposez d'un autre moyen de communication, ce qui, nous le savons, n'est pas possible pour de nombreuses personnes qui ont besoin de ces outils, il est préférable de ne pas partager vos informations avec un programme de synthèse vocale. Bien sûr, nous pourrions dire la même chose à propos de l'envoi de textes non sécurisés ou du téléchargement de documents dans le cloud également.

Voici ce que les créateurs de nos choix font de vos données :

Le contrôle vocal d'Apple traite les dictées et les commandes uniquement localement, sur votre appareil, de sorte qu'aucune donnée personnelle n'est partagée ou enregistrée avec un tiers. Mais certaines informations que vous parlez dans les programmes frères Dictation et Siri peuvent transmettre aux serveurs d'Apple. (Étant donné que de nombreuses personnes, dont plusieurs de nos panélistes, utilisent Dictation et Siri, nous avons conclu que les différences méritaient d'être soulignées.)

En règle générale, Apple ne peut pas accéder aux enregistrements audio Dictation et Siri que vous composez sur votre appareil, sauf si vous dictez dans un champ de recherche ou si le service nécessite un accès à une application tierce. Apple peut collecter des transcriptions de demandes Siri, des transcriptions de dictée, des adresses IP et des informations de contact pour effectuer des tâches d'application, améliorer ses services et commercialiser ses produits. Et chaque fois qu'Apple interagit avec une application tierce, telle qu'un service de transcription pour les notes de réunion, ces données vocales peuvent être envoyées à Apple, ou vous pouvez être soumis aux conditions générales et à la politique de confidentialité de cette application. Lorsque vous vous inscrivez à "Améliorer Siri et Dictée" d'Apple, les enregistrements audio et les transcriptions qu'Apple enregistre sont accessibles à ses employés, et les données sont conservées pendant deux ans, bien que l'entreprise puisse prolonger la conservation au-delà de cette période à sa discrétion.

Apple utilise également votre audio et vos transcriptions pour commercialiser des produits et des services. Vous pouvez refuser d'autoriser Apple à examiner vos fichiers audio sousLes paramètres du système(Paramètressur les appareils mobiles)> Confidentialité et sécurité > Analyses et améliorations ; vous pouvez supprimer votre historique de six mois en passant parLes paramètres du système(Paramètressur les appareils mobiles)> Siri et recherche > Siri et historique de dictée . Avec iOS 14.6, cependant, selon Gizmodo, Apple peut toujours collecter des données d'analyse même si vous vous désabonnez.

En ce qui concerne les informations partagées avec des tiers, certains fournisseurs doivent supprimer les informations personnelles à la fin de la transaction ou prendre des mesures non divulguées pour protéger vos données. Et Apple peut divulguer vos informations aux organismes chargés de l'application de la loi, comme l'exige la loi.

Nuance, qui possède le logiciel Dragon, collecte régulièrement des données de dictée. Le service peut accéder à toutes les informations sensibles que vous dictez, y compris les dossiers médicaux ou les informations exclusives, et ne nécessite pas toujours votre consentement direct pour le faire. Par exemple, dans sa politique de confidentialité, Nuance déclare : "Si nous traitons des données personnelles pour le compte d'un tiers qui a un accès direct au patient, il incombera au tiers d'obtenir le consentement." Et des "extraits" d'enregistrements audio sont examinés par des personnes qui transcrivent manuellement les données afin d'améliorer les services de Nuance. Nuance conserve les données pendant trois ans après que vous avez cessé d'utiliser les services, et vous pouvez demander à l'entreprise de supprimer votre enregistrement de données.

De plus, bien que Nuance collecte des données électroniques telles que votre adresse IP et vos informations d'enregistrement pour commercialiser ses produits, la société affirme qu'elle ne vend pas de données clients à des tiers. Cependant, les affiliés et partenaires de Nuance peuvent avoir accès aux données par l'intermédiaire de sa division des ventes ou de sa division de service client. Et comme Apple, Nuance peut partager des données personnelles pour se conformer à la loi.

Au-delà du logiciel de dictée en particulier, assurez-vous d'examiner les politiques de conservation des données de tout logiciel dans lequel vous dictez (qu'il s'agisse de Microsoft Word, Google Docs ou autre), qui relèvent des pratiques de confidentialité du fabricant.

Apple Dictation (macOS, iOS, iPadOS) fonctionne de la même manière que notre choix, Apple Voice Control, mais il lui manque les fonctionnalités robustes que beaucoup de gens veulent dans un outil de synthèse vocale, y compris les fonctions de raccourci clavier.

Nous ne pouvons pas recommander Microsoft Word Dictate, Otter ou Windows Voice Recognition en raison de leurs temps de latence de transcription et de leurs taux de précision inférieurs à la normale, qui variaient de 54 % à 76 %, loin derrière les 87 % d'Apple Voice Control et les 82 % de Dragon Home. De plus, la plate-forme d'Otter n'est pas un excellent choix pour la dictée de documents, car elle ne s'intègre pas bien aux outils de traitement de texte ; il est mieux adapté au sous-titrage d'événements en direct.

L'outil Braina Pro était populaire au milieu des années, mais son site Web est obsolète et il n'a pas eu d'avis d'utilisateurs depuis des années.

L'interface Google Assistant sur Gboard ne fonctionne qu'avec les appareils mobiles compatibles Gboard, ce qui signifie qu'elle est inutile pour les utilisateurs de bureau et toute personne ne possédant pas de smartphone Android ou iOS.

Lors de nos tests, Google Docs Voice Typing n'a pas réussi à capturer avec précision les sociolectes et les discours informels. Il ne fonctionne pas non plus bien pour les personnes ayant des troubles de la parole, a des fonctionnalités de formatage médiocres et est presque impossible à utiliser pour quiconque ne peut pas accéder à une souris et à un clavier.

Watson Speech to Text d'IBM est un service de transcription facturé à la minute après les 500 premières minutes. Et le plan gratuit supprime votre historique de transcription après un mois d'inactivité. Nous pensons que ces lacunes suffisent à le disqualifier.

La saisie vocale Windows n'est pas un outil aussi robuste que la reconnaissance vocale Windows, et nous avons constaté que ses commandes d'accessibilité étaient limitées.

Nous avons envisagé plusieurs applications spécifiques à Chrome, notamment Chromebook Dictation, Speechnotes et SpeechTexter, mais nous avons omis de les tester en raison de leurs fonctionnalités limitées et de leurs restrictions d'utilisation qui les rendaient inaccessibles à la plupart des gens.

Nous avons également envisagé les options suivantes, mais nous avons rapidement appris qu'elles étaient conçues pour des utilisations commerciales spécifiques :

Cet article a été édité par Ben Keough et Erica Ogg.

Meenakshi Das, défenseur des personnes handicapées et ingénieur logiciel, Microsoft, entretien textuel, 30 septembre 2022

Sayash Kapoor, doctorant, Center for Information Technology Policy, Princeton University, entretien téléphonique, 6 octobre 2022

Christopher Manning, co-directeur, Stanford Institute for Human-Centered Artificial Intelligence, Université de Stanford, entretien Zoom, 5 octobre 2022

Diego Mariscal, fondateur, PDG et directeur des personnes handicapées, 2Gether-International, entretien Zoom, 26 octobre 2022

Steve Dent, Amazon, Apple, Microsoft, Meta et Google pour améliorer la reconnaissance vocale des personnes handicapées, Engadget, 3 octobre 2022

Su Lin Blodgett, Lisa Green, Brendan O'Connor, Demographic Dialectal Variation in Social Media: A Case Study of African-American English (PDF), Actes de la conférence 2016 sur les méthodes empiriques dans le traitement du langage naturel, 1er novembre 2016

Prabha Kannan, est-ce encore mon tour ? Enseigner à un assistant vocal quand parler, Stanford Institute for Human-Centered Artificial Intelligence, Université de Stanford, 10 octobre 2022

Allison Koenecke, Andrew Nam, Emily Lake, Sharad Goel, Disparités raciales dans la reconnaissance vocale automatisée, Actes de l'Académie nationale des sciences, 23 mars 2020

Reconnaissance vocale pour l'apprentissage, LD OnLine, mémoire "Tech Works" du National Center for Technology Innovation (NCTI), 1er août 2010

Arvind Narayanan, The Limits Of The Quantitative Approach To Discrimination, James Baldwin Lecture Series, Department of African American Studies, Princeton University, 11 octobre 2022

Kaitlyn Wells

Kaitlyn Wells est une rédactrice senior qui plaide pour une plus grande flexibilité de travail en vous montrant comment travailler plus intelligemment à distance sans vous perdre. Auparavant, elle couvrait les animaux de compagnie et le style pour Wirecutter. Elle n'a jamais rencontré d'animal de compagnie qu'elle n'aimait pas, bien qu'elle ne puisse pas en dire autant des applications de productivité. Son premier livre d'images, Une famille ressemble à l'amour, suit un chiot qui apprend que l'amour, plutôt que votre apparence, est ce qui fait une famille.

par Signe Brewster

Nous avons constaté que le Temi basé sur l'IA est le meilleur service de transcription pour les personnes qui ont besoin d'une transcription lisible et abordable à titre de référence générale.

par Elissa Sanci

Une étiqueteuse peut rétablir l'ordre là où règne le chaos et fournir un contexte là où c'est nécessaire, et le meilleur est le Brother P-touch Cube Plus.

par Ben Keough

Si vous utilisez un logiciel de vidéoconférence pour les entreprises, vous devriez utiliser Zoom. Envie de sortir en famille ou entre amis ? Regardez Google Meet et Whereby.

par Ryan Whitwam

Les montres intelligentes pour téléphones Android semblent moins être un compromis que jamais, et nous avons d'excellents nouveaux choix de Samsung et Google.

Prix ​​: Système d'exploitation : Langues prises en charge : Paramètres > Accessibilité Prix : Système d'exploitation : Langues prises en charge : Options > Divers > Vitesse vs précision. Suivez le tutoriel. Sérieusement. Définissez votre langue principale. Pour une précision immédiate, énoncez. Pour un succès à long terme, parlez naturellement. Envisagez un microphone dédié. Faites attention à l'interrupteur marche/arrêt. Paramètres système Paramètres > Confidentialité et sécurité > Analyses et améliorations Paramètres système > Siri et recherche > Siri et historique de dictée
PARTAGER