request ile html kaynağa ulaşamıyorum bir türlü. Javascript ile veri yazdırıyor. Böyle durumlarda ne yapmam gerekiyor. Selenium hariçi bir öneriniz varmı lütfen ? Ulaşmaya çalıştığım html bölüm aşağıda.
Direk çekmek yerine zaman koy 10 saniye kadar sonra veriyi çek yüklenmesini bekle sistemin tamamen.
Bekleme koymak hiçbir işe yaramaz.
Eğer javascript ile site içeriği değiştiriliyorsa javascript’in yorumlanması gerekir. Maalesef requests modülü ile bu yapılamaz. Bu modül size içeriği getirir. Örneğin içerikte alert("test") şeklinde bir javascript kodu var. Bu kod sunucudan size doğrudan aktarılır. Bu kod ile ne yapılacağı size kalmıştır. Eğer siteye javascript desteği olan bir taryıcıdan giriş yapılmışsa tarayıcı bizim için bu kodu yorumlar ve ekrana ‘alert box’ içinde “test” mesajı bastırılır. Aynı şekilde requests modülü ile içerik getirilir fakat javascript yorumlanmaz.
Bu tarz sorunlarda site içeriği büyük ihtimal başka bir site veya sayfadan ajax benzeri bir metodla çekilir. Eğer bu şekildeyse javascript kodunda ajax ile içerik çekilen URL’e requests istek gönderirseniz istediğiniz içeriğe ulaşabilme ihtimaliniz yüksek.
Peki hocam direk tarayıcıda açmış gibi html kaynağa tam olarak ulaşma sansım varmı. Böyle bir modül veya farklı bir alternatif varmı, selenium hariçi. Zaten html kaynağa ulaşabilsem hiç sıkıntı olmayacakta.
Ayrıca https://pypi.org/project/dryscrape/ dryscrape modülü tam olarak bu işlemi yapıyormuş, fakat windows desteği yok diyorlar. Linux için sorun yaşayan arkadaşlar için belki çözüm olur diye yazıyorum.