İnternet sitesinden veri çekmek

Merhabalar internet sitesine istek gönderip veri çekmeye çalışıyorum. Takıldığım bir yer var.

import requests
from bs4 import BeautifulSoup
import pandas as pd

rakam=[]

user_agent = 'Mozilla.........'
headers = {'User-Agent': user_agent}
url = "https://www.kap.org.tr/tr/Sektorler"

r = requests.get(url, headers=headers)

source = BeautifulSoup(r.text, "html.parser")

a=source.find_all(align="right")

print(a)

Yukarıda ki kod ile html kodlarına ulaşarak align=“right” içerenleri bulduğumda cevap aşağıdaki gibi oluyor. Satırların başında bulunan rakamları rakam=[] içine nasıl gönderebilirim?

[<p align="right"><span style="font-weight : bold">
        4</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                3</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                1</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
        6</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                2</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                1</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                3</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
        227</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                42</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                27</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                6</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                13</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                45</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                26</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                25</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                42</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                1</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
        30</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                30</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
        12</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                12</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
        26</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                11</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                15</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
        10</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                10</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
        152</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                1</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                2</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                12</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                6</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                8</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                50</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                9</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                48</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                9</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                7</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
        9</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                1</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                4</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                4</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
        34</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                32</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                2</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
        4</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                1</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                2</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                1</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
        8</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                4</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                1</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                1</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                2</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
        3</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                3</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
        14</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                9</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                5</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
        6</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                1</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                3</span> şirket bulundu.</p>, <p align="right"><span style="font-weight : bold">
                2</span> şirket bulundu.</p>]
import requests
from bs4 import BeautifulSoup
import re

rakam = []

user_agent = 'Mozilla.........'
headers = {'User-Agent': user_agent}
url = "https://www.kap.org.tr/tr/Sektorler"

r = requests.get(url, headers=headers)

source = BeautifulSoup(r.text, "html.parser")

a = source.find_all(align="right")

for item in a:
    result = re.search(r'(\d+)</span> şirket bulundu', str(item))
    if result:
        rakam.append(int(result.group(1)))

print(rakam)

Regexle uyusan eslesmeleri bu sekilde bulup listeye ekleyerek dediginiz isleme ulasa bilirsiniz.

2 Beğeni

Yardımınız için teşekkürler.