Llama , Longchain, Chroma ile yaptığım veride sonuç bulamama yada yanlış sonuç gelmesi

Selamlar,

Aşağıki linkteki adresten adım adım takip ederek Ollama ile yerel Büyük Dİl Modeli (LLM) uygulamamı oluturdum.

İş kanunu pdf ini kullanarak embedding’lerini vektör veritabanında oluşturdum.

Ollama modeli olarak erdiari/llama3-turkish adresindeki Llama 3 Türkçe modelini kullanıyorum

Basit bir soru sorduğumda ki bu sorunun nerdeyse tam hali mevzuat içerisinde geçiyor yanlış cevap alıyorum.

Örneğin :
Yıllık ücretli izin süresi kaç gündür ?
{
“message”: “Çıktı: 18”
}

Bu sorunun neden kaynaklandığı hakkında fikri olan var mı? LLama dil modeli Türkçe için yeterli düzeyde olmayabilir mi? Open AI kullanmak çözüm olabilir mi?

Cevaplarınız için şimdiden teşekkürler

Tutorial Linki : Build Your Own RAG App: A Step-by-Step Guide to Setup LLM locally using Ollama, Python, and ChromaDB - DEV Community

Yanlis cevaba yol acan girdi ve cikti neye benziyor?

Yıllık ücretli izin süresi kaç gündür ? sorusuna beklediğim cevap :
Yıllık ücretli izin süresi, Türkiye’deki İş Kanunu’na göre en az 14 gündür. Ancak işçinin çalışma süresine göre bu süre artabilir. Örneğin, işçi 1-5 yıl arasında çalışmışsa yıllık izin süresi 14 gündür. 5 yıldan fazla çalışmışsa her yıl için 1 gün eklenerek en fazla 20 güne kadar çıkabilir.
Aldığım cevap
18

Yanlis cevaba yol acan girdi ve cikti LLM acisindan bakildiginda neye benziyor?

LLM’e ne girip cikiyor?

Açıkçası varolan bir kodu denedğim için o kadar derinlemesine bilmiyorum. Kodu değiştirerek aşağıdaki repodan yeni bir çalışma buldum onunla fena sonuçlar almıyorum. Yine de chroma dan gelen veri oldukça başarılı olmasına rağmen LLM nin onu yorumlayp cevap vermesi başarılı değil. Belkiopen ai daha düzgün sonuçlar verebilir.