arkadaşlar merhaba python kullanarak google üzerindeki belli bir kategorideki (örneğin doktor siteleri) sitelerden iletişim bilgisi çekmek istiyorum telefon mail vs.
Web Scraping olaylarını araştırdım deneme yaptım fakat olumlu sonuç alamadım yazdığım kod hedef site üzerinde belli başlı class isimlerini sorguluyor bu class ismi eşleşirse değerini alıp bana gönderiyor önceden belirlediğim bir site üzerinde bu işlemi yapsam işime yarardı fakat birden fazla site ile çalışacağım için haliyle class isimleri her sitede aynı olmayabiliyor
Bu kodu nasıl yazabilirim veya yapılabilir bir proje mi fikirlerinizi merak ediyorum
Farklı bir yöntem önerebilirim. Google maps api kullanarak kategoriyi doktor olarak ayarlarsan 1000km yakınındaki mapste kayıtlı tüm doktorların telefon no ,web site, adres gibi bilgilerini alabilirsin.
telefon mail gibi bilgileri çekebilmem için ekstra bir ayar yapmam gerekir mi hocam ve bu apiyi nasıl çalıştırabilirim
Tüm bilgileri json formatında veriyo istediğini çekebiliyosun kedi api dökümanları vardı bulursam paylaşıyım
import requests
url = "https://maps.googleapis.com/maps/api/place/nearbysearch/json?location=-33.8670522%2C151.1957362&radius=1500&type=restaurant&keyword=cruise&key=YOUR_API_KEY"
payload={}
headers = {}
response = requests.request("GET", url, headers=headers, data=payload)
print(response.text)
Burayı biraz incele istersen
teşekkür ederim hocam ama sanırım ücretliymiş bu api
sorunumu bu metotla çözdüm
# Telefon numaralarını yakalamak için regex deseni
phone_regex = r"(?<!\d)(?:\+\d{1,3}[-.\s]?)?\(?(?:\d{1,4}\))?[.\-\s]?\d{1,5}(?:[.\-\s]?\d{1,5}){1,3}(?:[.\-\s]\d{2})?(?!\d)"
# E-posta adreslerini yakalamak için regex deseni
email_regex = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'
şimdi de google üzerinde hedef kelimeye göre dork tarayacak bir program yazacağım dorktan taratılan siteleri bu programa yapıştıracağım tanımladığım regex deseni sitelerdeki telefon numaraları ve mail adreslerini yakalayacak ve print edecek
Kısmı olarak ücretsiz zamanında başka bir proje için kullanmıştım.
Desen kullanmak mantıklıymış. Ama çok fazla iş yükü var gibi görünüyor