Merhaba django(drf) ile bir proje yapıyorum. Bunun için bir dış kaynaktan (mssql) veri çekip pandas ile düzenleyip api sunuyorum.
Projeyi farklı veri kaynakları eklenebilir şekilde ayarladım; eğer istenirse rdms verileri eklenerek ve query için istenen veriler tanımladığım sınıfların yeni nesnelerine eklenerek (yeni bir instance oluşturarak) farklı kaynaklardan veri çekilmesi sağlanabiliyor.
Ancak şöyle bir sıkıntım varki her seferinde iki milyon satır ve 50 sütun (sütunu azaltıp ihtiyaç duyduğum kadarını çekebiliyorum) veri çekmek üç dört dakika sürüyor ki bu da projeyi kullanışsız hale getiriyor.
Bunun için verileri çekip bu verinin sütun başlıklarını field* olarak ayarlayacağım yeni bir class oluşturmak ve o class ile kendi veritabanımda saklamak istiyorum. Her satırda bir nesneye dönüşecek.
Koda müdahale etmeden nasıl yapabilirim sorusu aklıma fonksiyonlar için kullanılan closure konusunu getirdi buna benzer bir yapıyla class üretebilir miyim?
Ya da django da bütün bir tabloyu (iki milyon satırı) tek bir nesne içerisinde saklayabilir miyim?
Ya da hız problemi için farklı bir öneriniz olur mu?
*-> türkçe karakterlerle ilgili de sıkıntım olacak. field isimlerini maketrans ile vb. türkçe karakterlerden arındırsam da sonra geri çevirmem de gerekebilir.