BeautifulSoup hakkında kaynak


#1

Konu başlığından da belirttiğim gibi BeautifulSoup hakkında kaynak arıyorum boş zamanım var bende okuyayım dedim.Bu arada Türkçe veya İngilizce farketmez yeterince açıklayıcı olsun yeter.Şimdiden teşekkürler.


#2

Aşağıdaki sitenin faydası olur umarım.
https://www.crummy.com/software/BeautifulSoup/bs4/doc/#


#3

Bu arada bir şey sorcam şu ana kadar forumda okuduklarımız BeautifulSoup internetten veri çekme olarak gördüm acaba başka bir işlevi varmı?


#4

Yalnız işlevi yanlış soyluyorsunuz,
internetten veriyi requests modulu çeker,
Olan metni parse eden ise bs4 tur.Adı ustunde BeautifulSoup.Olan veriyi guzelleştırir.

Kolay gelsin :blush:


#5

Doğrusu tamamen anlamadım daha detaylı anlatır mısınız rica edersem.


#6

bu modül CSS gibi birşeymi ? :slight_smile:

CSS benzemiyor. :smile: ama gayet kolay ve işe yarar bir modül. :slight_smile:


#7

Bak şöyle anlatayım.

url = "url_gir_buraya"
site_html_sayfası = requests.get(url)
with open("bs4_anlama_deneme.txt","w") as f:
    f.write(site_html_sayfası.content)

oluşan dosyayı aç bakalım.(ne oldugunu gormen için.)

Sonra başka bir scripte şunları yaz.

from bs4 import BeautifulSoup
with open("bs4_anlama_deneme.txt","r") as f:
    parse_edilecek_veri = f.read()

soup = BeautifulSoup(parse_edilecek_veri,"html.parser")
for i in soup.find_all("div"):
    print(i)

Bu script sana yazdırdıgımız dosyadaki butun div etiketini verir.Daha çok araştırırsan beni daha çok anlayacaksın.

Kolay gelsin :slight_smile:


#8

Css ile ne alakası var ki,bs4 re modulu gibi string vb. parse eder.


#9

sonradan fark ettim zaten. :blush: internetten xml ve html verilerini çekiyormuş. gayet basit ve anlaşılır, ama benim işime yaramaz. :slight_smile:


#10

adresinde birşeyler yazmıştım.

adresinde ise hazırladığım eğitim videoları var.


#11

import requests
url = http://www.example.com.tr # Buraya herhangi istediğiniz bir siteyi girebilirsiniz.
site_html_sayfası = requests.get(url)

with open( “bs4_anlama_deneme.txt” , “w” ) as f:
f.write((site_html_sayfası.content).decode(‘utf-8’))

Verdiğin kodlarda content metodunda, bende, döndürülen değerin türünün bytes olduğunu fakat str olması gerektiğini söyledi ve ben de düzeltme uygulamak istedim.

Edit: Ayrıca şurda ve burda çevirme seçenekleri konusunda bilgiler mevcut.