Python ile sitenin metinlerini çekmek

Merhaba arkadaşlar,

beautifulsoup ile bir sitenin sadece yazılarını çekmw imkanımız varmı?

yani örneğin
soup.find_all(‘p’,limit=1)

bunu yaptığımızda kodlarla beraber geliyor.Ayrıca p etiketi yerine başka etiket kullanan sitelerin metinlerini çekemiyorum.Kısaca öyle bir kod yazacağım ki rastgele önüne gelen tüm sitelerin metinlerini çekebilecek.Kodları çekmeyecek ama.

Not:beautifulsoup ile olmak zorunda değil

  1. Liste öğesi

Siteyi çekin. Önce css ve javascript kısmını silin ardından düzenli ifadeleri kullanarak bütün tagları silin. Eğer yazamazsanız beatiful soup dışında yardımcı olabilirim.

Aslında yazamam bir yol gösterirseniz iyi olur. :frowning:

Şu bağlantıda paylaştım.