Beautiful Soup kategorisine hoşgeldiniz!


#1

Beautiful Soup kategorisine hoşgeldiniz! Bir sorunuz mu var? Hemen kaydolun ve sorun, birileri mutlaka cevap verecektir. Daha çok cevap veren tarafta mısınız? Kaydolun ve soruları cevaplayın, her zaman birilerinin yardıma ihtiyacı vardır. Beautiful Soup belgelerine göz atmayı da unutmayın. :slight_smile:

Beautiful Soup Hakkında

Beautiful Soup, XML ve HTML belgelerini işlemek için kullanılabilecek bir Python kütüphanesidir. Beautiful Soup’u güçlü kılan üç özellik vardır:

  1. Beautiful Soup bir ayrıştırma ağacında gezinim, arama ve değiştirme yapmak için gerekli olan basit yordamları ve Pythonca deyimleri içerir. Bu araçlar sayesinde bir belgeyi parçalarına ayırıp içinden istediklerinizi çıkartabilirsiniz.
  2. Beautiful Soup otomatik olarak, açılan dosyaları Unicode’a, kapanan dosyaları ise UTF-8’e çevirir. Bu sebeple kodlama konusunda endişelenmenize gerek yoktur. Sadece, eğer belge bir kodlama belirtmemişse özgün kodlamayı belirtmeniz gerekir.
  3. Beautiful Soup lxml ve html5lib gibi gözde Python işleyicilerini kullanır, bu sebeple hız vb. sebeplerle farklı işleme taktiklerini kullanabilirsiniz.

Beautiful Soup’a bir belge gönderdikten sonra ona “Tüm bağlantıları bul.”, "ustBilgiBaglantisi sınıfına sahip tüm bağlantıları bul.", "Bağlantısı "foo.com“la eşleşen tüm bağlantıları bul.” ya da “Kalın yazıya sahip çizelge başlığının yazısını ver.” diyebilirsiniz. Beautiful Soup, ayrıca, bozuk HTML ya da XML belgelerini de işleyebilmektedir.

Daha fazlası için Beautiful Soup belgelerine bakabilirsiniz.


#2

Okurken kafama takıldı. Unicode-8 ile UTF-8 aynı şey değil mi?