Aller au contenu

Tts Sur Son Nas


Remylpat

Messages recommandés

  • Réponses 145
  • Créé
  • Dernière réponse

Meilleurs contributeurs dans ce sujet

Meilleurs contributeurs dans ce sujet

Salut Diaoul,

Je veux bien reessayer de compiler en esperant ne pas tout "failed" encore une fois mais peux tu me re-expliquer (ou me reguider) tout depuis le début.

ce que je dois installer sur mon syno ou ailleurs.

Ce que je dois lancer ...

ce que je récupere et ce que j'en fais .... ;-)

Meme en mode télégraphique ca me va.

En tout cas meme si pour le moment je vois pas ce que ca donne c'est super ce que vous avez (l'air) d'avoir fait.

Lien vers le commentaire
Partager sur d’autres sites

Bah j'ai rien fait pour l'instant mais disons que je peux faire en sorte que mon Syno répète ce que je dis avec un dictionnaire simple "Dial one one two" (du quickstart de julius par voxforge)

Je vais démarrer un projet Python pour gérer les actions à effectuer en fonction des phrases identifiées. J'hésite encore à le faire en django...

Lien vers le commentaire
Partager sur d’autres sites

  • 2 semaines après...

Bon, voici le lien du projet : https://github.com/Diaoul/Dobby

Un peu de détails sur mon Clapper paramétrable qui fonctionne avec pyaudio (module Python de portaudio) : https://github.com/Diaoul/Dobby/blob/master/triggers/clapper.py

Si vous avez des suggestions n'hésitez pas. Je trouve le code un peu lourd pour le Clapper

Lien vers le commentaire
Partager sur d’autres sites

Je viens de jeter un coup d'oeil (surtout au clapper) et je te tire mon chapeau c'est très bien écrit en tous cas vue de mon niveau c'est à qq années lumières de moi .....

J'ai presque honte d'avoir montré mon code .... qui bien qu'utilisant un concept similaire est largement moins élégant .... Passant sur la forme mais allons voir sur le fond le gros soucis que j'ai avec la reconnaissance de la voie c'est la qualité du micro.

En effet je me rends compte qu'un micro standard fonctionne assez mal dés que l'on s'écarte de quelques mètres (sans parler du soucis des bruits de fond), j'ai vue qu'il existait des micros dédiés à la reconnaissance vocal dans une pièce, mais c'est super chère !!!! Sans parler du principe du clapper ou il est difficile d'obtenir un équilibre entre les faux positifs (ma fille qui passe en criant dans le salon) et le fait de s'exploser les mains en clappant ....

Et toi de ton coté Diaoul tu as retrouver les même soucis ou c'est le mic de ma webcam qui est particulièrement pourrit ????

Lien vers le commentaire
Partager sur d’autres sites

Alors perso j'ai fait mes tests dans un environnement sans trop de bruit sur un micro d'un micro-casque USB. Comme tu dis, pour obtenir le même rendu que ça avec un mic de webcam ça va être difficile, surtout si on rajoute la distance.

J'ai aussi testé avec mon mic de webcam et oui c'est particulièrement pourrit !

J'avais vu un micro multidirectionnel dans les 30€, je pense que je testerai avec ça le temps voulu. Sinon, il y a sans doute la possibilité de retraiter le son pour enlever un maximum de choses (sauf la voix) avec quelques réglages sur la fréquence de la voix de l'utilisateur.

Pour être intéressant je pense qu'il faut qu'une distance d'environ 1 à 2m donne satisfaction, plus c'est vraiment avec un bon micro et pour une utilisation partout dans la pièce.

Tu noteras qu'avec le design actuel du Clapper, on peut lancer plusieurs Clapper sur différentes sources audio et récupérer le résultat dans la même event_queue. Je pense même stocker le numero du micro capté dans l’évènement ainsi que la Sequence qui a été matchée (pour une éventuelle utilisation ultérieure)

Lien vers le commentaire
Partager sur d’autres sites

Salut à tous,

Tout d'abord bonnes fetes ....

Je vois que tu as encore fais des étincelles Diaoul, un jour il faudra que qqn m'explique comment je peux vous aider pour tester ou autre, j'aimerais bien contribuer a ce projet.

Sinon l'idée du casque de Diaoul, me fait penser a qqc :

Pensez-vous que cela serait possible de faire fonctionner le "SiriLogy" (Siri + Synology) avec un casque/oreillette bluetooth ?

Je me dis ca car ca permettrait peut etre aussi d'avoir une utilisation plus personelle et surtout ca coute bcp moins cher qu'un micro multidirectionel.

D'un côté j'aime bien l'idee d'etre n'importe ou dans la piece et de dire le mot magique, d'un autre côté ca peut aussi gener les autre personnes autour de moi d'entendre la réponse du nas sur les enceinte, la TV ou tout autre device.

Donnez moi votre avis et mettez moi a contribution sans soucis.

Encore bravo

Lien vers le commentaire
Partager sur d’autres sites

A vrai dire, peu importe l'input et l'output dans Dobby, c'est entièrement paramètrable grace à portaudio et speech-dispatcher.

Le fichier de config est là pour ça.

Comme je disais, dans les Event levés par les Triggers (comme le Clapper), je vais intégrer le numéro de la source audio (micro) utilisée. Comme ça on pourra faire un traitement spécifique selon la source dans les Actions.

Par contre ce qu'il ne sera pas possible de faire avec le design actuel de Dobby c'est l'écoute et la réponse à plusieurs personnes simultanément. Dans ce cas le mieux ce sera de lancer plusieurs Dobby et plusieurs Julius.

Lien vers le commentaire
Partager sur d’autres sites

Ca me fait penser qu'en fait avec un micro blutooth attaché à la chemise ou une oreillette + micro à l'oreille, on résoudrait certainement les problèmes de Sp@ro sur la qualité du microphone en fonction de la distance !

De mon coté j'ai contacté http://www.acousticmagic.com pour savoir s'il m'était possible d'essayer un de leurs produits quelques jours afin de voir si le résultat est correct pour une utilisation 100% autonome.

J'ai pas à ma disposition de clé USB blutooth et je ne sais même pas si ce sera reconnu par Syno. Quelqu'un a-t-il la possibilité de tester ? Ca peut valoir le coup (et même le coût).

Lien vers le commentaire
Partager sur d’autres sites

j'ai une clé usb bluetooth et je dois avoir un micro/casque bluetooth aussi. Je peux bien tester tout ca la semaine prochaine si vous le voulez. par contre faudrait juste me guider pour l'installation

j'ai deja vu dans un forum parler d'un package "bluez" pour bluetooth il me semble. je retrouve mon dongle bluetooth j'install sur mon syno les ipkg et je vous dis si ca detecte qqc des lundi.

En // comment je fait tourner tout ton travail diaoul sur mon DS109 ?

Lien vers le commentaire
Partager sur d’autres sites

Voila les packages dispo pour le bluetooth via ipkg. Ca vous parle a vous ?

Package I-Ver P-Ver Comment install bluez-hcidump 1.42-1 Bluetooth packet analyzer. install bluez-libs 3.36-1 Bluetooth libraries. install bluez-utils 3.36-3 Bluetooth utilities. install bluez2-libs 2.25-1 Bluetooth libraries. install bluez2-utils 2.25-6 Bluetooth utilities. install py-bluez 0.9.2-1 Python wrappers around bluez. install py25-bluez 0.9.2-1

Python wrappers around bluez.

Lien vers le commentaire
Partager sur d’autres sites

De mon coté j'ai contacté http://www.acousticmagic.com pour savoir s'il m'était possible d'essayer un de leurs produits quelques jours afin de voir si le résultat est correct pour une utilisation 100% autonome.

À $250 le ticket d'entrée, ça calme un peu quand même. ohmy.png

Lien vers le commentaire
Partager sur d’autres sites

j'ai une clé usb bluetooth et je dois avoir un micro/casque bluetooth aussi. Je peux bien tester tout ca la semaine prochaine si vous le voulez. par contre faudrait juste me guider pour l'installation

j'ai deja vu dans un forum parler d'un package "bluez" pour bluetooth il me semble. je retrouve mon dongle bluetooth j'install sur mon syno les ipkg et je vous dis si ca detecte qqc des lundi.

En // comment je fait tourner tout ton travail diaoul sur mon DS109 ?

C'est loin d'être prêt pour un utilisateur. Eventuellement un power user qui n'a pas peur de mettre les mains dans le cambouis.

Ce que tu peux juste faire c'est voir si c'est reconnu sur ton Syno en bidouillant un peu.

À $250 le ticket d'entrée, ça calme un peu quand même. ohmy.png

Ca dépend, si c'est la solution ultime qui marche à la perfection, pourquoi pas. Et puis d'occasion ou un modèle équivalent chez la concurence ça doit se trouver.

Lien vers le commentaire
Partager sur d’autres sites

Je sais pas si je peux me considérer comme PowerUser mais je suis pas trop mal cablé et mon diplome d'ingé en informatique ne remonte pas a si loin ;-p

C'est côté linux que je seche un peu.

J'ai commencé a me documenter sur la partie bluetooth et j'ai hate de me remettre devant mon syno pour apairer une oreillette.J'ai trouvé qq bonnes pistes sur les QNAPs qui vont me servir de base.

Pour ce qui est de la partie Dobby je veux bien bidouiller mais comment je repars de ton github ou de qq chose d'autre ?

Lien vers le commentaire
Partager sur d’autres sites

Pour ceux que ça intéresse de faire des essais, le retour de acousticmagic :

Thank you for your interest in Acoustic Magic.

The Voice Tracker™ has been used successfully for voice control.

See: http://www.acousticmagic.com/user-comments.html#ccrosby

Our process for evaluation is for you to buy a Voice Tracker™, and we give you a full refund (excluding shipping) when you return it within 30 days.

Regards

Lien vers le commentaire
Partager sur d’autres sites

Un SPK de test est dispo ici : http://syno.diaoul.fr/SPKs/hastation

La procédure d'installation est simple :

  1. Installer le SPK
  2. Crééer un groupe d'utilisateur "audio" et mettre "root" dedans en éditant /etc/group

Il y a tout ce qu'il faut dedans, y comprit pyaudio pour faire tourner le clapper sur son Syno.

/usr/local/hastation/

Modifié par Diaoul
Lien vers le commentaire
Partager sur d’autres sites

Salut Diaoul,

Finalement je suis rentré un peu plus tot et je n'ai pas pu m'empecher d'installer ton spk.

Pour l'install tout c'est passé nickel.

J'ai bien créé le group et mis root dedans

J'ai bien qq repertoires (bin,include,openssl.cnf,share,etc,lib,sbin) dans /usr/local/hastation.

Je n'ai par contre pas trouvé de daemon a lancer ou quoi que ce soit me permettant de "runner" le prg. J'ai omis qqc ? Enfin je n'ai pas trouvé non plus ou se cachait le clappeur.

Je regarderais un peu plus demain.

Bonne nuit a tous

Lien vers le commentaire
Partager sur d’autres sites

Je t'ai dis qu'il n'y a pas de programme pour l'instant. C'est juste un tas de binaire cross-compilés pour bidouiller.

  • julius pour la reconnaissance vocale
  • espeak et flite pour le TTS
  • speech-dispatcher
  • python 2.7 avec les modules pyaudio et speechd

Si tu veux tu peux regarder les documentations de ces binaires et t'amuser avec. Il n'y a pas et n'y aura pas de programme tout fait dans ce SPK avant longtemps et ne t'en fais pas tu ne pourras pas le louper.

Lien vers le commentaire
Partager sur d’autres sites

Salut a tous,

Je commence a faire des tests avec les différents binaires de Diaoul, mais je rencontre un pb ave le micro.

J'ai une carte son terratec avec Line input intégré.

Pour identifier mon micro je fait ffmpeg -f oss -i /dev/dsp4 test.wav (methode Sp@ro)

J'ai bien mon micro de la carte son Terratec en /dev/dsp4 mais aucun son ne s'enregistre.

Lorque je lance alsamixer et que je unmute mon micro, j'entends bien le son dans mes HPs donc le micro fonctionne bien.

J'ai donc essayé de brancher ma camera USB comme vous. Le micro est detecté en /dev/dsp5 et si je fais un ffmpeg -f oss -i /dev/dsp5 test.wav j'ai bien ma voix recordé par mon micro de camera.

Vous n'auriez pas une idée sur comment activer l'entrée mic de ma carte USB ou d'ou cela pourrait provenir ?

Lien vers le commentaire
Partager sur d’autres sites

Essaye ce script pour lister tes devices :


import pyaudio

pa = pyaudio.PyAudio()

for i in range(pa.get_device_count()):

	print repr(pa.get_device_infos_by_index(i))

Pas sûr de la syntaxe des fonctions appelées, regarde la doc de pyaudio.

Modifié par Diaoul
Lien vers le commentaire
Partager sur d’autres sites

Voila l'output mais je t'avoue j'ai un peu du mal

ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.rear

ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.center_lfe

ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.side

ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.hdmi

ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.hdmi

ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.modem

ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.modem

ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.phoneline

ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.phoneline

ALSA lib pcm_dsnoop.c:612:(snd_pcm_dsnoop_open) unable to open slave

ALSA lib pcm_dmix.c:957:(snd_pcm_dmix_open) The dmix plugin supports only playback stream

Traceback (most recent call last):

File "inputdevice.py", line 5, in <module>

print repr(pa.get_device_infos_by_index(i))

AttributeError: PyAudio instance has no attribute 'get_device_infos_by_index'

si je fais un lsusb j'ai


DiskStation> lsusb

Bus 001 Device 004: ID 046d:08c7 Logitech, Inc.

Bus 001 Device 003: ID 0ccd:0077 TerraTec Electronic GmbH

Bus 001 Device 002: ID 05e3:0608 Genesys Logic, Inc. USB-2.0 4-Port HUB

Bus 001 Device 001: ID 1d6b:0002

Modifié par Remylpat
Lien vers le commentaire
Partager sur d’autres sites

Rejoindre la conversation

Vous pouvez publier maintenant et vous inscrire plus tard. Si vous avez un compte, connectez-vous maintenant pour publier avec votre compte.

Invité
Répondre à ce sujet…

×   Collé en tant que texte enrichi.   Coller en tant que texte brut à la place

  Seulement 75 émoticônes maximum sont autorisées.

×   Votre lien a été automatiquement intégré.   Afficher plutôt comme un lien

×   Votre contenu précédent a été rétabli.   Vider l’éditeur

×   Vous ne pouvez pas directement coller des images. Envoyez-les depuis votre ordinateur ou insérez-les depuis une URL.


×
×
  • Créer...

Information importante

Nous avons placé des cookies sur votre appareil pour aider à améliorer ce site. Vous pouvez choisir d’ajuster vos paramètres de cookie, sinon nous supposerons que vous êtes d’accord pour continuer.