Sesli asistan nasıl yapay zeka gibi yapılır?

Arkadaşlar merhaba,

Basit bir sesli asistan kodu hazırladım. Sesi dinliyor, onu Google ile yazıya çeviriyor ve if etiketi ile dediğimize göre yanıt veriyor.

Peki biz bunu nasıl daha da geliştirebiliriz? Yani yapay zeka gibi yapabiliriz? Mesela kişinin ne demek istediği algılansa, ona göre yanıt verilse falan. Mesela ben if etiketine “ne haber” yazdıysam ve kullanıcı “nasılsın” dediğinde de “iyiyim sen nasılsın” demesini istiyorum.

Bunun için, listeye keywordlar girilebilir. Ama bence bu çok acemice ve if etiketinin pratikleştirilmiş hali. Yani list veya if etiketiyle kelime girme dışında, daha çok yapay zekasal bir şey yapmak istiyorum. Dediğimi anlamışsınızdır umarım.

Nasıl yapabilirim? Hangi konuları öğrenmeliyim?

1 Beğeni

Kodu atar mısın ? Ona göre kodda ne olup olmadığına göre fikirlerimi belirtirim.

Kodluk bir şey yok ki burada? Ben kodu istemiyorum, sadece algoritmayı ve kodu nasıl yazabileceğime dair bilgi istiyorum.

Tamam, O zaman kendi düşüncelerimi yazacağım. Mesela bu yapay zeka bilgisayarın kamerasını da kullansın. Ve karşısına geçen kişinin kim olduğunu öğrenip kaydetsin. Mesela eğer yeni biri geçerse yeni kişiye ona nasıl hitap edeceğini sorsun. Veya Sadece belirli bir kullanıcının bu uygulamaya girmesini istiyorsan sesinden ve yüzünden tanıyan bir kod yazabilirsin. Veya parmak izinden(gerekli donanım varsa tabi). Mesela bu asistan bilgisayar ve internet açıkken arka plandan emaillere veya bazı sitelere girip işte oradan emaillerdeki spamları algıyayıp direk spam klasörüne atabilir. Benim şimdilik aklıma bunlar geldi.

Dediğimi tam anlamadınız sanırım. Sisteme eklenecek fikir değil, tek tek keyword kullanmadan, denilen şeyin ne olduğunun nasıl anlaşılacağını sormuştum.

ha tamam o zaman. Ama sanırım başka bir yol yok gibi.

yapay sinir ağlarını araştırabilirsin

1 Beğeni

Yapay sinir ağları in yanında makine öğrenmesini arastirmalisin yada geniş bir veri tabanına dayalı sorgulama kullanabilirsin gene işlem if e dayanır ama geniş bir cerceven olur

Bu konuda da çok güzel bir sey hazırlayacağim, hem de öyle google, sphinx e felan ihtiyacıniz kalmayacak

Ama kabaca şöyle: Akustik Fiziği(Fourier Dönüşümü)+Levenshtein vari benzerlik algoritmaları+Ses Sinyal Modülleri+İstatistiksel modüller.

Ya da hazır Scikit-Learn, Keras, Tensorflow gibi paketler.

Mantık ise şu:

Karmaşık Ses dalgasını(yani tek bir baskin genlikten oluşmayan) kaydeder ve hecelere bölersiniz.

Heceler genel olarak yuksek genliğe yakınsak seslerdir. Her dildeki Sesli, sessiz harflerin kombinasyonlarındaki(ab, ac… vs.) ya da tekil tam ses(a, e, ı… vs.) ya da yarım seslerin(b, c, d… vs.) sayısı bellidir.

Bunların birleştiği(string olarak) hece gruplarının(sesi düşmüş ve dildeki özgün ses uyumuna uygun bir kelime değil) gerçek kelimelere olan benzerliğini(Levenshtein gibi bir sürü benzerlik fonksiyonu var) bularak sesten kelimeye dönüşür.

Tabi bu işleme ek olarak algoritmadaki sonucun gerçek sonçtan farkını, yani hataları en aza indirmek için ya da sonuçları daha da mükemmelleştirmek için, farklı türde yollar da var ama sesten yazıya dönüşün mantığı budur.

Yazıdan sese de, algoritmanın sadece NLTK düzeyinde, arzu ettiğiniz yanıt mantığına göre tersten programlanması işte…

2 Beğeni