Text to Speech et enregistrement

Discussion:

Text to Speech et enregistrement

(trop ancien pour répondre)

JppN

2023-08-04 20:24:19 UTC

Bonsoir,

Le contexte :
pour des aveugles, oraliser un texte écrit
la voix doit être "Espagnol, Amérique latine"
le choix actuel est la voix de Carlos/Mexique

J'ai un document texte que lit l'outil Speech to Text de High Sierra.
Mis à part le non respect des ponctuations, le résultat est correct à
l'oreille.
Je souhaite enregistrer ce qui est produit
Je dispose de Audacity et du "virtual audio device" Blackhole, et de
Soundflower.
Que ce soit via l'un ou l'autre , vers Audacity ou QuickTime, le fichier
audio résultant présente une réverbération insupportable.

Solution, suggestion ?

Merci

Jean-Pierre

Manfred La Cassagnere

2023-08-05 02:34:21 UTC

Post by JppN
Bonsoir,

Hello Jean-Pierre :)

Post by JppN
pour des aveugles, oraliser un texte écrit
la voix doit être "Espagnol, Amérique latine"
le choix actuel est la voix de Carlos/Mexique
J'ai un document texte que lit l'outil Speech to Text de High Sierra.
Mis à part le non respect des ponctuations, le résultat est correct à
l'oreille.
Je souhaite enregistrer ce qui est produit
Je dispose de Audacity et du "virtual audio device" Blackhole, et de
Soundflower.
Que ce soit via l'un ou l'autre , vers Audacity ou QuickTime, le fichier
audio résultant présente une réverbération insupportable.
Solution, suggestion ?

Piezo, de Rogue Amoeba, à télécharger/tester ici:

<https://rogueamoeba.com/piezo/>

Hth

--
Manfred

JppN

2023-08-05 04:06:33 UTC

Post by Manfred La Cassagnere
<https://rogueamoeba.com/piezo/>
Hth
-- Manfred

Bonsoir Manfred, le Macounet qui veille sur le bien-être de la tribu

Pas regardé ton lien, il se fait tard ici, mais, après pas mal de
recherches, j'ai résolu mon problème avec
https://www.narakeet.com/app/text-to-audio/?projectId=edc9b30a-66f5-431d-a04a-589cdd6cbd29

Un peu tordu vu les restrictions en mode free, mais ça le fait !

Si quelqu'un a besoin, faire signe ici où je serai ravi de partager mon
expérience

Un abrazo fuerte

M.V.

2023-08-05 07:01:58 UTC

Post by JppN
Je dispose de Audacity et du "virtual audio device" Blackhole, et de
Soundflower.
Que ce soit via l'un ou l'autre , vers Audacity ou QuickTime, le fichier
audio résultant présente une réverbération insupportable.
Solution, suggestion ?

J'utilise Blackhole (option Périphérique à sortie multiple) + QuickTime
(option Blackhole en entrée) et tout fonctionne sans souci.
Vérifie tes réglages.

--
🇺🇦 Michel Vauquois - <http://michelvauquois.fr> 🇺🇦
Y'a vingt ans, c'était difficile de choisir entre manger de l'ail et Brigitte
Bardot, mais avec le temps, c'est toujours l'ail qui gagne...
(Brèves de comptoir - Jean-Marie Gourio)

M.V.

2023-08-05 07:16:18 UTC

Post by JppN
Je dispose de Audacity et du "virtual audio device" Blackhole, et de
Soundflower.
Que ce soit via l'un ou l'autre , vers Audacity ou QuickTime, le fichier
audio résultant présente une réverbération insupportable.
Solution, suggestion ?

J'utilise Blackhole (option Périphérique à sortie multiple) + QuickTime
(option Blackhole en entrée) et tout fonctionne sans souci.
Vérifie tes réglages.

Version audio :
<https://www.dropbox.com/scl/fi/nhg3hw1jmovsje82iyli1/Version-audio.aifc.zip?rlkey=fz19glyn4vhvxeygon5tpilu2&dl=0>

--
🇺🇦 Michel Vauquois - <http://michelvauquois.fr> 🇺🇦
Y'a vingt ans, c'était difficile de choisir entre manger de l'ail et Brigitte
Bardot, mais avec le temps, c'est toujours l'ail qui gagne...
(Brèves de comptoir - Jean-Marie Gourio)

M.V.

2023-08-05 10:19:25 UTC

Post by M.V.
J'utilise Blackhole (option Périphérique à sortie multiple) + QuickTime
(option Blackhole en entrée) et tout fonctionne sans souci.

Pendant l'enregistrement, il fait régler le niveau du son de QT à zéro
(sinon, il y a de la réverbération plus ou moins importante suivant le
niveau sonore) :
<Loading Image...

--
🇺🇦 Michel VAUQUOIS 🐸 <http://michelvauquois.fr> 🇺🇦
Le temps nous presse sans trêve vers le trou final. (Pierre Desproges)

JppN

2023-08-07 03:05:21 UTC

Post by M.V.
J'utilise Blackhole (option Périphérique à sortie multiple) + QuickTime
(option Blackhole en entrée) et tout fonctionne sans souci.

Pendant l'enregistrement, il fait régler le niveau du son de QT à zéro
(sinon, il y a de la réverbération plus ou moins importante suivant le
<https://www.dropbox.com/scl/fi/kaiz05xnh2cidc9o8wzq8/Ecran-115.jpg?rlkey=sdgcn97zjejlx4b34ud50b1z0&dl=0>

c'est probablement là la source de mes soucis.
Merci !

JppN

2023-08-07 05:14:41 UTC

Post by M.V.
J'utilise Blackhole (option Périphérique à sortie multiple) + QuickTime
(option Blackhole en entrée) et tout fonctionne sans souci.

Pendant l'enregistrement, il fait régler le niveau du son de QT à zéro
(sinon, il y a de la réverbération plus ou moins importante suivant le
<https://www.dropbox.com/scl/fi/kaiz05xnh2cidc9o8wzq8/Ecran-115.jpg?rlkey=sdgcn97zjejlx4b34ud50b1z0&dl=0>

c'est probablement là la source de mes soucis.
Merci !

J'ai tout remis à plat.
Installé BlackHole 16ch
Reconfiguré le Multi-Output device avec Audio MIDI SetUp
Fait lire un texte en espagnol avec la voix Carlos
Enregistré avec QT10
Filtré un peu les basses avec Audacity
et …
<https://www.dropbox.com/s/14wbnr06caetybo/Carlos-Blackhole-QT10-%20Audacity.mp3?dl=0>

M.V.

2023-08-07 07:15:22 UTC

et …

et… c'est parfait ! ;-)

--
🇺🇦 Michel Vauquois - <http://michelvauquois.fr> 🇺🇦
Je n'accepte jamais un cadeau. Si ce qu'on m'offre était vraiment formidable, on
m'en ferait pas cadeau...
(Brèves de comptoir - Jean-Marie Gourio)

JppN

2023-08-07 03:01:33 UTC

Post by JppN
Je dispose de Audacity et du "virtual audio device" Blackhole, et de
Soundflower.
Que ce soit via l'un ou l'autre , vers Audacity ou QuickTime, le fichier
audio résultant présente une réverbération insupportable.
Solution, suggestion ?

J'utilise Blackhole (option Périphérique à sortie multiple) + QuickTime
(option Blackhole en entrée) et tout fonctionne sans souci.
Vérifie tes réglages.
<https://www.dropbox.com/scl/fi/nhg3hw1jmovsje82iyli1/Version-audio.aifc.zip?rlkey=fz19glyn4vhvxeygon5tpilu2&dl=0>

Téléchargé; double clic lance iTunes … et nada :-)

M.V.

2023-08-07 07:15:23 UTC

Post by M.V.
<https://www.dropbox.com/scl/fi/nhg3hw1jmovsje82iyli1/Version-audio.aifc.zip?rlkey=fz19glyn4vhvxeygon5tpilu2&dl=0>

Téléchargé; double clic lance iTunes … et nada :-)

Je le télécharge, le dézippe et l'ouvre dans QuickTime Player et… ça
fonctionne comme ça doit !

--
🇺🇦 Michel Vauquois - <http://michelvauquois.fr> 🇺🇦
Je demande qu'à te croire, mais faut que tu demandes qu'à pas mentir...
(Brèves de comptoir - Jean-Marie Gourio)

JppN

2023-08-07 12:49:13 UTC

Post by M.V.
Je le télécharge, le dézippe et l'ouvre dans QuickTime Player et… ça
fonctionne comme ça doit !

OK. format AIFF Compressé (Apple).
Étonnant quand même que iTunes ne sache pas le lire.

Le SpeechtoText natif de macos, au moins sous High Sierra, a le gros
défaut de ne pas tenir compte des ponctuations.
C'est meilleur sous les nouvelles versions ?

M.V.

2023-08-07 13:57:41 UTC

Post by JppN
C'est meilleur sous les nouvelles versions ?

J'ai fait, samedi, un essai avec la beta de Sonoma et QuickTime plante
systématiquement. Il est possible que ça provienne de Blackhole mais je
n'ai pas de certitude.
Je ferai un essai avec Ventura quand j'aurai le temps.
Avec Mojave, les ponctuations ne sont guère audibles comme tu as dû t'en
apercevoir avec mon enregistrement.

--
🇺🇦 Michel Vauquois - <http://michelvauquois.fr> 🇺🇦
Le problème c'est que NEXTSTEP sans le framework objet, c'est comme une
tarte aux pommes sans les pommes.
-+- Ol. in Guide du Macounet Pervers : Y'a pas de la Pomme dedans ?-+-

M.V.

2023-08-07 16:06:50 UTC

Post by JppN
Le SpeechtoText natif de macos, au moins sous High Sierra, a le gros
défaut de ne pas tenir compte des ponctuations.

Pendant que j'y (re-)pense : ce n'est pas le 'Speech to text' dont il
est question ici.
Le 'Speech to text', c'est 'Dictée' et ça consiste à traduire en texte
une parole.

Ici, il s'agit de 'Parole' (devenu 'Contenu énoncé' sous Ventura).

Post by JppN
C'est meilleur sous les nouvelles versions ?

En ralentissant légèrement le débit vocal, c'est pas pire ! ;-)
Pour les pauses dues aux virgules, je trouve ça assez correct mais pour
les points, c'est limite.

--
🇺🇦 Michel VAUQUOIS 🐸 <http://michelvauquois.fr> 🇺🇦
Votre Seigneurie, je ne peux pas multi-décoder la trans-particule parce que le
relais parabolique est sur le point d'empridouiller l'hétéro-écho baleiné !

JppN

2023-08-07 21:46:11 UTC

Post by JppN
Le SpeechtoText natif de macos, au moins sous High Sierra, a le gros
défaut de ne pas tenir compte des ponctuations.

Pendant que j'y (re-)pense : ce n'est pas le 'Speech to text' dont il
est question ici.
Le 'Speech to text', c'est 'Dictée' et ça consiste à traduire en texte
une parole.
Ici, il s'agit de 'Parole' (devenu 'Contenu énoncé' sous Ventura).

Oui, bon, les variations applesques ne sont pas mon propos.
Ici, sous 10.13.6; ça s'appelle Speech et c'est différent de Dictation

Post by JppN
C'est meilleur sous les nouvelles versions ?

En ralentissant légèrement le débit vocal, c'est pas pire ! ;-)
Pour les pauses dues aux virgules, je trouve ça assez correct mais pour
les points, c'est limite.

La grosse différence avec, par exemple Dragon, acheté par l'université
de mon épouse pour les étudiants aveugles, €1200 environ en 2010, qui
tenait compte des ponctuations mais incapable de lire/parler un PDF !
Très fort pour un logiciel sensé aider des étudiants d'université
handicapés.

M.V.

2023-08-08 07:19:39 UTC

Post by M.V.
Ici, il s'agit de 'Parole' (devenu 'Contenu énoncé' sous Ventura).

Oui, bon, les variations applesques ne sont pas mon propos.
Ici, sous 10.13.6; ça s'appelle Speech

Tout à fait et 'Speech' (traduit par 'Parole') n'est pas 'Speech to
text' (= 'De parole à texte') qui correspondrait plutôt à 'Dictée' /
'Dictation' mais… qui n'existe pas ! ;-)

--
🇺🇦 Michel Vauquois - <http://michelvauquois.fr> 🇺🇦
-Si Dieu existait vraiment, on ne trouverait pas toute cette famine sur terre.
- Dieu n'est pas cuistot
(Brèves de Comptoir - Jean-Marie Gourio)

JppN

2023-08-09 00:22:03 UTC

Post by M.V.
Ici, il s'agit de 'Parole' (devenu 'Contenu énoncé' sous Ventura).

Oui, bon, les variations applesques ne sont pas mon propos.
Ici, sous 10.13.6; ça s'appelle Speech

Tout à fait et 'Speech' (traduit par 'Parole') n'est pas 'Speech to
text' (= 'De parole à texte') qui correspondrait plutôt à 'Dictée' /
'Dictation' mais… qui n'existe pas ! ;-)

Mais si ! Accesibility/Dictation :-)
<Loading Image...

M.V.

2023-08-09 07:00:01 UTC

Post by M.V.
Tout à fait et 'Speech' (traduit par 'Parole') n'est pas 'Speech to
text' (= 'De parole à texte') qui correspondrait plutôt à 'Dictée' /
'Dictation' mais… qui n'existe pas ! ;-)

Mais si ! Accesibility/Dictation :-)

Relis mieux : je disais que 'Speech to Text' n'existait pas en tant que
tel.

--
🇺🇦 Michel Vauquois - <http://michelvauquois.fr> 🇺🇦
Il en est du romantisme fiévreux comme de la moule pas fraîche : quand on en
abuse, ça fait mal au coeur. (Pierre Desproges)

JppN

2023-08-10 06:31:32 UTC

Post by M.V.
Tout à fait et 'Speech' (traduit par 'Parole') n'est pas 'Speech to
text' (= 'De parole à texte') qui correspondrait plutôt à 'Dictée' /
'Dictation' mais… qui n'existe pas ! ;-)

Mais si ! Accesibility/Dictation :-)

Relis mieux : je disais que 'Speech to Text' n'existait pas en tant que
tel.

Oui, je me suis mélangé, le Speech de macos c'est TextToSpeech :-)

M.V.

2023-08-09 09:16:31 UTC

Post by JppN
Mais si ! Accesibility/Dictation

Juste pour info : depuis Mojave, 'Dictée' est désormais accessible
depuis la préf système 'Clavier'.

--
🇺🇦 Michel VAUQUOIS 🐸 <http://michelvauquois.fr> 🇺🇦
L'ennemi se déguise parfois en géranium, mais on ne peut s'y tromper, car
tandis que le géranium est à nos fenêtres, l'ennemi est à nos portes. (Pierre
Desproges)

19 Réponses
1 Vue
Permalink vers cette page
Désactiver le parsing amélioré

Navigation dans l'arborescence

JppN 2023-08-04 20:24:19 UTC

Manfred La Cassagnere 2023-08-05 02:34:21 UTC

JppN 2023-08-05 04:06:33 UTC

M.V. 2023-08-05 07:01:58 UTC

M.V. 2023-08-05 07:16:18 UTC

M.V. 2023-08-05 10:19:25 UTC

JppN 2023-08-07 03:05:21 UTC

JppN 2023-08-07 05:14:41 UTC

M.V. 2023-08-07 07:15:22 UTC

JppN 2023-08-07 03:01:33 UTC

M.V. 2023-08-07 07:15:23 UTC

JppN 2023-08-07 12:49:13 UTC

M.V. 2023-08-07 13:57:41 UTC

M.V. 2023-08-07 16:06:50 UTC

JppN 2023-08-07 21:46:11 UTC

M.V. 2023-08-08 07:19:39 UTC

JppN 2023-08-09 00:22:03 UTC

M.V. 2023-08-09 07:00:01 UTC

JppN 2023-08-10 06:31:32 UTC

M.V. 2023-08-09 09:16:31 UTC

À propos - jargon juridique

Loading...