Bir yazılım fikri konusunda sizlere danışmak istiyorum. Gündemde agentlara sık sık rastlamaya başladık. Kendi aralarında yeni bir sosyal medya kuracak kadar ileriye gittiler. Ancak gündelik hayatta karşılaştığımız basit problemleri çözmekte ne kadar yetenekliler?
Bir süredir statik bir UI ile çalışan eski bir yazılım ile çalışıyorum. Belirli bir işi yapmak istediğimde aynı prosedürleri yapmak zorunda kalıyorum. Mesela rutin olarak bir rapor yazıyorum. Raporu yazarken belirli kutucuklara aynı şeyleri yazıyorum. Bunların çok küçük kısımlarındaki ifadeleri veya sayıları gerekirse değiştirebiliyorum. Sonrasında e-imza ile imzalıyorum. Sistem imzalama için rutin bir prosedür işletiyor.
İmzala tuşuna tıkla > Şifre ekranının gelmesini bekle > Şifreyi gir > Onaylama tuşuna bas > Ekrana onaylandığı ile ilgili yazı gelmesini bekle > Onaylama kutucuğunda tamam tuşuna bas > Rapor yazma ekranından çık
Elimde bunun gibi çeşitli prosedürler var. Sayılarını tam olarak bilmiyorum. Ama işi yapmaya başladığımda %80 yazılımın rutin işlemleriyle uğraşıyorum. Kullandığım yazılımı çeşitli sistemlerde kullanabiliyorum. Bazen win 10 bazen win11, bazen win7 kullanmak zorunda kalıyorum. Bilgisayarın ekran çözünürlüğü ve ekranın boyutu değişkenlik gösteriyor. Bir butonların boyutu ve konumu buna bağlı olarak yer değiştirebiliyor.
Ben bir otomasyon yazılımı istiyorum. Bu yazılım olmadığı için ben bu işleri zaten her gün yapıyorum. Arka planda benim yazdıklarımı ve tıkladığım yerleri inceleyip bir süre kendisine kullandığım sistemle ilgili UI elemanlarının şekilleri, yerleri, nitelikleri, birbirleriyle ilişkileri gibi veriler toparlasın. Benim hangi elemanlara daha sık tıkladığımı tespit etsin.
Bu veriler bir süre biriktikten sonra yanımda bu yazılımı yeni kullanmaya başlayan birisi gibi ben yaptığım işleri adım adım anlatayım ve benim öğrettiğim işleri yapmaya yetkisi olsun. Bu öğrettiğim işler dışında hiçbir şeye dokunmasın. Öğrettiklerimi de ben istediğim zaman yapsın.
Temel araç olarak pyautogui, OpenCV ve pynput kullanmayı planlıyorum. Henüz UI elemanlarını nasıl tespit edeceğini hangi algoritma ile yapacağımı bilmiyorum. Benim yaptığım işleri nasıl öğreteceğimi de bilmiyorum.
Daha önce Google, microsoft gibi şirketler benzer fikirlerle yola çıkmışlar. Ancak çok daha genel işler yapmasını bekledikleri için çok büyük yapay zeka modelleri oluşturmuşlar. 16gb ram ile çalışan bir bilgisayarda çalışmıyormuş. Ben bu kadar karmaşık bir iş istemiyorum. Sürekli tekrar eden işler yapıyorum. İzlesin, yapacağı işi de ben göstereyim. Ben istediğimde o yapsın.
Her türlü yorum ve önerinize açığım.
