Python3 Sesi Yazıya Çevirme

Dinarli · Ekim 13, 2017, 6:17ös

Abilerim kardeşlerim pythona yeni başladım. Amacım bilgisayarın mikrofonundan alınan bir sesi program içerisinde yazıya çevirmek istiyorum bunu nasıl yapabilirim birkaç module baktım ama hem ingilizcemin yetersizliğinden hemde yeni yeni bu tür işlere girişmem sebebiyle bir sonuca varamadım bu konuda yarımcı olursanız çok sevinirim

dildeolupbiten · Ekim 13, 2017, 8:00ös

Merhaba, hoşgeldiniz.

Konu hakkında çok bilgim yok, ancak kısa bir araştırma sonucunda yapmak istediğinizin aşağıda linkleri verilen modüllerle ilgili olduğu yönünde yorumlar okudum. Yalnız gereksinim olarak başka modüllere ihtiyaç duyuyorlar. Onları da kurmak lazım.

Gereksinimler:

PyAudio
PocketSphinx

Konuyla ilgili birkaç link de paylaşayım:

https://pythonspot.com/en/speech-recognition-using-google-speech-api/
https://pythonspot.com/en/personal-assistant-jarvis-in-python/

#!/usr/bin/env python3
# Requires PyAudio and PySpeech.

import speech_recognition as sr

# Record Audio
r = sr.Recognizer()
with sr.Microphone() as source:
    print("Say something!")
    audio = r.listen(source)

# Speech recognition using Google Speech Recognition
try:
    # for testing purposes, we're just using the default API key
    # to use another API key, use `r.recognize_google(audio, key="GOOGLE_SPEECH_RECOGNITION_API_KEY")`
    # instead of `r.recognize_google(audio)`
    print("You said: " + r.recognize_google(audio))
except sr.UnknownValueError:
    print("Google Speech Recognition could not understand audio")
except sr.RequestError as e:
    print("Could not request results from Google Speech Recognition service; {0}".format(e))

Yukarıdaki kodu çalıştırdığım zaman, “Say something!” diye bir yazı çıktı. Mikrofona doğru konuştum aşağıdaki çıktıyı verdi:

Say something!
You said: hello how are you hello

Process finished with exit code 0

PocketSphinx uygulaması: Bu modülle de mikrofona doğru konusursunuz ve konusmalarınız ekrana bastırılır. (Denendi)

from pocketsphinx import LiveSpeech
for phrase in LiveSpeech(): 
    print(phrase)

hasser · Ekim 14, 2017, 1:53ös

tts.speak api si işinizi görebilir

pipks · Ekim 18, 2017, 6:21ös

@dildeolupbiten ve @hasser üstatlar belirttiğiniz eklentiler sanırım sadece İngilizce konuşmaları ekrana yazdırıyor? bunu da belirtirseniz daha güzel olur bence.

dildeolupbiten · Ekim 18, 2017, 7:59ös

Evet sadece İngilizce konuşmaları ekrana yazdırıyor.

hasser · Ekim 18, 2017, 8:20ös

Ben şurdan esinlenerek önerdim:

Dinarli · Ekim 21, 2017, 7:07ös

Çok Teşekkür ederim usta konu sahibine yazdım inşallah olumlu işe yarar bir geri dönüş alabilirim.

Nil_ile_karantina_ke · Nisan 26, 2020, 11:24öö

elinize sağlık . çok güzel olmuş ben elimde bulunan mp3, waw,vb benzeri ses kayıtlarını yazıya çevirmek istiyorum türkçe sesler var onlardan bahsediyorum bunu python ile nasıl yapabiliriz

Wormer_King · Nisan 26, 2020, 11:32öö

benim proje örneğim var bu konuda gerekli değişiklikleri yaparak kullanabilirsiniz
https://forum.yazbel.com/t/Sesli asistan örneği

Tugberk · Nisan 26, 2020, 4:57ös

yerine r.recognize_google(audio,language="TR") yazarsanız Türkçe olarak çalışacaktır.

Kendi kullandığım kod:

#!/usr/bin/env python3

# NOTE: this example requires PyAudio because it uses the Microphone class

import time

import speech_recognition as sr


# this is called from the background thread
def callback(recognizer, audio):
    # received audio data, now we'll recognize it using Google Speech Recognition
    try:
        # for testing purposes, we're just using the default API key
        # to use another API key, use `r.recognize_google(audio, key="GOOGLE_SPEECH_RECOGNITION_API_KEY")`
        # instead of `r.recognize_google(audio)`
        print("Google Speech Recognition thinks you said " + recognizer.recognize_google(audio,language="TR"))
    except sr.UnknownValueError:
        print("Google Speech Recognition could not understand audio")
    except sr.RequestError as e:
        print("Could not request results from Google Speech Recognition service; {0}".format(e))


r = sr.Recognizer()
m = sr.Microphone()
with m as source:
    r.adjust_for_ambient_noise(source) 
stop_listening = r.listen_in_background(m, callback)

while True: time.sleep(0.1)
stop_listening(wait_for_stop=False)


# do some more unrelated things
while True: time.sleep(0.1)