Iyi Akşamlar. Scrapy ve ya Selenium ile bir siteden veri çekme izni varmı yokmu yüzde yüz nasıl emin olabiliriz? Nereye bakmalıyız?
Azız hemvatanım, gardaşım.
Möhüm mü?
Hack aleminde bir söz vardır:
İzin yoksa izne gerek de yok.
Kanunlara ve verilen kararlara—diyecektim,
Sitenin kendisine sorarak.
Yani başımıza bir iş gelirmi?
Yani bunun hukuki yaptırımı olmazmı? Bundan nasıl emin olabiliriz?
Kasma bu kadar, bir şey olmaz.
Tor da uyuşturucu işine girmiyosan bişey çıkmaz xd
Kastın web sitelerinden veri kazmak ise herhangi bir sıkıntı olmuyor. Yani kapına polis gelip şu siteden neden veri çektin demeyecek tabiki. Korkmanı gerektirecek bir durum söz konusu değil.
Aslında Siteden veri çekmek Freelance çalışmaktır amacım yani Müşterinin istediği sitelerden veri çekerek ona vereceğim bunun için soruyorum
bir şey olmaz hocam. herhangi bir websitesinde public olarak yayınlanan bir veriyi indirdin diye kimse bir şey yapamaz keyfine bak.
Anladım Hocam. Peki verilerin public olduğunu nerden anlıyoruz?
çok basit bi soru aslında cevabı da çok basit ama kafamda cevabı kurgulayamadım.
kısaca şöyle söyleyeyim, kazınacak veriye isteyen herkes ulaşabiliyorsa publictir. örneğin Wikipediada atom bombası araması yapıp atom bombası hakkında bilgileri rahatça okuyabiliyorum yani bu public bir veri.
benzer şekilde yazbel forum’a girip açılan konu başlıklarını görebiliyorum yani public bir bilgi.
Anladım çok teşekkür ederim
Tam olarak kast ettiğiniz şey mi emin değilim ama bazı siteler “site adı+/robots.txt” altında izin vermedikleri kısımları belirtiyorlar, bunlar banlanma ihtimalin olan uzantılar anladığım kadarıyla.
Kimin çektiğine bağlı.
Beni mesela çok enterese etmiyor bu soru.
Eğer kişisel veri olarak tanımlanabilecek veriler (insanlara ait isim, adres, telefon numarası gibi) internette public olarak yayınlansa dahi o verileri çekip kullanmak Kişisel Verileri Koruma Kanunu uyarınca para cezası ile yaptırıma tabi bir eylemdir. Kişinin şikayeti halinde para cezası uygulanır. Çekeceğiniz verilerin kişisel veri olup olmadığını iyi araştırın. Şirketler Kişisel Verileri Koruma Kanunu kapsamına girmemekle birlikte şirket çalışanlarının bilgileri de KVKK kapsamındadır.
Yani soyle ki;
Eger Trendyol’dan veya Github’tan veri cekip onunla bir urun uretip para kazanirsan sorun olur. Cunku o sitedeki insanlarin urunlerini izinsiz kullanmis olursun.
Egitim ve ogrenme amaciyla yaparsan hicbir sey olmaz. Icin rahat rahat proje ve odev yapabilirsin. Twitter’dan bile veri cekmene yardimci olan kutuphaneler var izinsiz. Dusununce developer’larin yarisinin hapsi girmesi lazimdi.
dostum izne gerek yok jasjdsjasjjdjdas sadece User-Agent bölümünü kopyala(gemel olarak oluyor ama bazen biraz daha araştırma yapman lazım).