Pasaport/kimlik okuyucu cihaz ve yazılımı üzerinden veri okuma işlemi gerçekleştiriyoruz. Ancak mevcut yazılımın yetersizliği nedeniyle bazı sorunlar yaşamaya başladık. Bu nedenle cihazın taradığı görüntüleri işleyerek çözüm üretmek adına test çalışmalarına başladım.
Bu konuda tecrübe odaklı bazı tavsiyelere ihtiyacım var. Uzun vadede geliştirilebilir ve güçlü bir kütüphane kullanmak istiyorum, böylece ilerleyen süreçlerde benzer kısıtlamalarla karşılaşmadan çözüm üretebilelim.
Dil belirtmediginiz ve “tecrube odakli” dediginiz icin cozum odakli (dilden bagimsiz) bir cevap aradiginizi dusunuyorum. O halde oncelikle GIMP’i denemeniz gerek, cunku:
Icinde, bu tur isleri profosyonel olarak yapan insanlarin kullandigi her alet var veya kolayca eklenebilir.
Programin kendisi pipeline icin gorsel bir debugger olarak kullanilabilir (bu bir tahmin/dilek). Kullanilamasa bile, goruntuye yapilan her islem programin kendisinde mevcut, ve ani gorsel geri besleme ile¹ ince ayarlanabilir, tweak edilebilir.
Tek sorun, hakikaten kutuphane olarak kullanilabilir mi, bilmiyorum.
LISP tabanli bir scripting dili var (bilmiyorsaniz bile sorun degil; image processing pipeline yazmak basit, ve dilin referansi var). Bu script’ler komut satirindan headless da calistiriliyor diye hatirliyorum. Python binding’i varsa tercih edilebilir.
Bunun disinda, cok basit islemler haric tecrubem olmadigi icin “ImageMagick” demeyecegim.
“numpy ve scipy” diyebilirm ama. Numpy ile, matematiksel karsiligini bildiginiz her islemi yapabilirsiniz (kendim boyle kullanmis olmasam tavsiye etmem). Scipy da nispeten dusuk seviyeli bir kutuphane, ama goruntu manipulasyonu icin kullanilabiliyor. (Bu konuda tecrubem de sinirli, ama numpy’in kardes kutuphanesi oldugu icin beraber bahsetmekte bir sikinti goremiyorum.) Bu arda, resim dosyalarini okumak icin Pillow gibi bir kutuphaneye ihtiyaciniz olacak. Onda da bir takim basit islemler mevcut.
Bu arada tabi ki OpenCV de var. Ama ondaki algoritmalardan birini kullanmayacaksam sahsen pillow+numpy[+scipy] yolunu daha pratik buluyorum.
Yakın zamanda MediaPipe kütüphanesini kullandım. Yüz hareketlerini algılamada gayet başarılıydı. Sağ sol yukarı aşağı gibi temel hareketleri hassas bir şekilde algılayabiliyordu.
Eldeki eklemleri doğru şekilde tespit edebiliyordu. Elim kafamın arkasına gittiğinde takibe devam ediyordu. Eldeki açık parmak sayısında istediğim seviyeye ulaşamadı. Kafa hareketleriyle birlikte el hareketlerini de algılamasını istediğimde el hareketlerini anlamıyordu.
Lisansı ticari kullanıma açık. Kaynak kullanımı çok fazla değil. 16GB ram ile çok rahat çalışıyor. Projelerinizde kullanmanızı öneririm.