BeautifulSoup hakkında kaynak

Konu başlığından da belirttiğim gibi BeautifulSoup hakkında kaynak arıyorum boş zamanım var bende okuyayım dedim.Bu arada Türkçe veya İngilizce farketmez yeterince açıklayıcı olsun yeter.Şimdiden teşekkürler.

Aşağıdaki sitenin faydası olur umarım.
https://www.crummy.com/software/BeautifulSoup/bs4/doc/#

Bu arada bir şey sorcam şu ana kadar forumda okuduklarımız BeautifulSoup internetten veri çekme olarak gördüm acaba başka bir işlevi varmı?

Yalnız işlevi yanlış soyluyorsunuz,
internetten veriyi requests modulu çeker,
Olan metni parse eden ise bs4 tur.Adı ustunde BeautifulSoup.Olan veriyi guzelleştırir.

Kolay gelsin :blush:

Doğrusu tamamen anlamadım daha detaylı anlatır mısınız rica edersem.

bu modül CSS gibi birşeymi ? :slight_smile:

CSS benzemiyor. :smile: ama gayet kolay ve işe yarar bir modül. :slight_smile:

Bak şöyle anlatayım.

url = "url_gir_buraya"
site_html_sayfası = requests.get(url)
with open("bs4_anlama_deneme.txt","w") as f:
    f.write(site_html_sayfası.content)

oluşan dosyayı aç bakalım.(ne oldugunu gormen için.)

Sonra başka bir scripte şunları yaz.

from bs4 import BeautifulSoup
with open("bs4_anlama_deneme.txt","r") as f:
    parse_edilecek_veri = f.read()

soup = BeautifulSoup(parse_edilecek_veri,"html.parser")
for i in soup.find_all("div"):
    print(i)

Bu script sana yazdırdıgımız dosyadaki butun div etiketini verir.Daha çok araştırırsan beni daha çok anlayacaksın.

Kolay gelsin :slight_smile:

Css ile ne alakası var ki,bs4 re modulu gibi string vb. parse eder.

sonradan fark ettim zaten. :blush: internetten xml ve html verilerini çekiyormuş. gayet basit ve anlaşılır, ama benim işime yaramaz. :slight_smile:

adresinde birşeyler yazmıştım.

adresinde ise hazırladığım eğitim videoları var.

2 Beğeni

import requests
url = http://www.example.com.tr # Buraya herhangi istediğiniz bir siteyi girebilirsiniz.
site_html_sayfası = requests.get(url)

with open( “bs4_anlama_deneme.txt” , “w” ) as f:
f.write((site_html_sayfası.content).decode(‘utf-8’))

Verdiğin kodlarda content metodunda, bende, döndürülen değerin türünün bytes olduğunu fakat str olması gerektiğini söyledi ve ben de düzeltme uygulamak istedim.

Edit: Ayrıca şurda ve burda çevirme seçenekleri konusunda bilgiler mevcut.