Python3 Sesi Yazıya Çevirme

Abilerim kardeşlerim pythona yeni başladım. Amacım bilgisayarın mikrofonundan alınan bir sesi program içerisinde yazıya çevirmek istiyorum bunu nasıl yapabilirim birkaç module baktım ama hem ingilizcemin yetersizliğinden hemde yeni yeni bu tür işlere girişmem sebebiyle bir sonuca varamadım bu konuda yarımcı olursanız çok sevinirim

Merhaba, hoşgeldiniz.

Konu hakkında çok bilgim yok, ancak kısa bir araştırma sonucunda yapmak istediğinizin aşağıda linkleri verilen modüllerle ilgili olduğu yönünde yorumlar okudum. Yalnız gereksinim olarak başka modüllere ihtiyaç duyuyorlar. Onları da kurmak lazım.

Gereksinimler:

PyAudio
PocketSphinx

Konuyla ilgili birkaç link de paylaşayım:

https://pythonspot.com/en/speech-recognition-using-google-speech-api/
https://pythonspot.com/en/personal-assistant-jarvis-in-python/


#!/usr/bin/env python3
# Requires PyAudio and PySpeech.

import speech_recognition as sr

# Record Audio
r = sr.Recognizer()
with sr.Microphone() as source:
    print("Say something!")
    audio = r.listen(source)

# Speech recognition using Google Speech Recognition
try:
    # for testing purposes, we're just using the default API key
    # to use another API key, use `r.recognize_google(audio, key="GOOGLE_SPEECH_RECOGNITION_API_KEY")`
    # instead of `r.recognize_google(audio)`
    print("You said: " + r.recognize_google(audio))
except sr.UnknownValueError:
    print("Google Speech Recognition could not understand audio")
except sr.RequestError as e:
    print("Could not request results from Google Speech Recognition service; {0}".format(e))

Yukarıdaki kodu çalıştırdığım zaman, “Say something!” diye bir yazı çıktı. Mikrofona doğru konuştum aşağıdaki çıktıyı verdi:

Say something!
You said: hello how are you hello

Process finished with exit code 0

PocketSphinx uygulaması: Bu modülle de mikrofona doğru konusursunuz ve konusmalarınız ekrana bastırılır. (Denendi)

from pocketsphinx import LiveSpeech
for phrase in LiveSpeech(): 
    print(phrase)

tts.speak api si işinizi görebilir

@dildeolupbiten ve @hasser üstatlar belirttiğiniz eklentiler sanırım sadece İngilizce konuşmaları ekrana yazdırıyor? bunu da belirtirseniz daha güzel olur bence.

Evet sadece İngilizce konuşmaları ekrana yazdırıyor.

Ben şurdan esinlenerek önerdim:

1 Beğeni

Çok Teşekkür ederim usta konu sahibine yazdım inşallah olumlu işe yarar bir geri dönüş alabilirim.

elinize sağlık . çok güzel olmuş ben elimde bulunan mp3, waw,vb benzeri ses kayıtlarını yazıya çevirmek istiyorum türkçe sesler var onlardan bahsediyorum bunu python ile nasıl yapabiliriz

benim proje örneğim var bu konuda gerekli değişiklikleri yaparak kullanabilirsiniz
https://forum.yazbel.com/t/Sesli asistan örneği

yerine r.recognize_google(audio,language="TR") yazarsanız Türkçe olarak çalışacaktır.

Kendi kullandığım kod:

#!/usr/bin/env python3

# NOTE: this example requires PyAudio because it uses the Microphone class

import time

import speech_recognition as sr


# this is called from the background thread
def callback(recognizer, audio):
    # received audio data, now we'll recognize it using Google Speech Recognition
    try:
        # for testing purposes, we're just using the default API key
        # to use another API key, use `r.recognize_google(audio, key="GOOGLE_SPEECH_RECOGNITION_API_KEY")`
        # instead of `r.recognize_google(audio)`
        print("Google Speech Recognition thinks you said " + recognizer.recognize_google(audio,language="TR"))
    except sr.UnknownValueError:
        print("Google Speech Recognition could not understand audio")
    except sr.RequestError as e:
        print("Could not request results from Google Speech Recognition service; {0}".format(e))


r = sr.Recognizer()
m = sr.Microphone()
with m as source:
    r.adjust_for_ambient_noise(source) 
stop_listening = r.listen_in_background(m, callback)

while True: time.sleep(0.1)
stop_listening(wait_for_stop=False)


# do some more unrelated things
while True: time.sleep(0.1) 
3 Beğeni