Bu konuda daha yeniyim. Öğrenmeye çalışıyorum.
import requests,time
from bs4 import BeautifulSoup
url= “https ://www.transfermarkt.com.tr/galatasaray-istanbul/startseite/verein/141/saison_id/2020”
html = requests.get(url).content
soup = BeautifulSoup(html, “html.parser”)
print(soup)
Bu şekilde yazdığımda sitenin html kodları gelmiyor.
404 Not Found
404 Not Found
nginx
Bu şekilde geliyor. Fakat farklı bir sitede hata olmuyor. Neyden kaynaklanıyor bu durum?
hasser
Şubat 1, 2021, 11:31ös
2
Fazladan boşluk var linkte:https ://
Olması gereken:https://
onu link gözüksün diye buraya yazdım kodu yazarken boşluk koymuyorum ama html kodlarını getirmiyor
Sanırım bu web sitesi, requests
ile kullanılmaya karşı korunmuş, isterseniz bir de şu link ile deneyin: https://tff.org/Default.aspx?pageId=28&kulupID=3604
anladım tamamdır teşekkürler
import requests,time
from bs4 import BeautifulSoup
headers = {'User-Agent': 'Mozilla/5.0'}
url = "https://www.transfermarkt.com.tr/galatasaray-istanbul/startseite/verein/141/saison_id/2020"
html = requests.get(url, headers=headers).content
soup = BeautifulSoup(html, "html.parser")
print(soup)
1 Beğeni