Python Proxy'e Nasıl Bağlanabilirim?

Esat_Yilmaz · Mayıs 23, 2018, 7:05ös

Merhabalar…Ben Bir Proje İle İlgileniyorum Python İle Projemin Amacı Şuanlık Google’dan Siteleri Çekmek Lakin Google Baba Engel Atıyor Engeli Aşmak İçin Proxy Kullanıyorum Lakin Benlik Bir Sorun mu Anlayamadım Ama Yok Çalışmıyor…Yine Benim İp’im İle İstek Gönderiyor Siteye…Bazen Proxy den İstek Gönderiyor Ama Yine Ban Yedi Diyor…Ama Chrome’da Öyle Bir Sorun Yok?

    import requests
    from bs4 import BeautifulSoup
    def googledorkarama():
    proxy={"https:":"http://88.198.24.108:3128"}
# Baglanacagimiz site
aramalar=[
          "http://www.google.com.pk/search?q=","http://www.google.cn/search?q="]
numlar=["&num=100&start=30&filter=0","&num=100&start=10&filter=0","&num=100&start=20&filter=0","&num=100&start=50&filter=0","&num=100&start=60&filter=0","&num=100&start=800&filter=0",
       "& num =100 & start =100 & filter =0"]
siteleriyaz = open("DorkTaramaSonuçları.txt", "w",encoding="utf-8")
kelime=input("Taratılacak Dorku Giriniz: ")
print("Siteler DorkTaramaSonuçları.txt'ye Kaydedilir.")
soru = input("\nSiteler Dosyaya Kaydedilsinmi ? E\H ")
if soru == "h" or soru == "H":
    print("\nSonuçlar Dosyaya Kaydedilmeyecek!")
if soru == "E" or soru == "e":
    for x in numlar:
        for i in aramalar:
            s=requests.session()
            s.proxies=proxy
            url = i+kelime+x
            sayfa=s.get(url,proxies=proxy)
            deneme=sayfa.text
            if "CAPTCHA" in deneme:
                print("Google Ban Atmış")
                print(sayfa.url)
                print(deneme)
                exit()
            else:
                soup = BeautifulSoup(sayfa.content, "html.parser")

                for link in soup.findAll('cite'):
                    print(link.text)
                    siteleriyaz.write(link.text+"\n")

hasser · Mayıs 23, 2018, 7:35ös

Proxy’e bağlanmayı bilmiyorum ama google ın bulduğu siteleri çekmek için google diye bir modülü kullanabilirsiniz.

Not: Ben hiç kullanmadım hatta adından bile emin değilim.

Esat_Yilmaz · Mayıs 23, 2018, 7:41ös

Siteleri Çekebiliyorum Zaten.Sorun Proxy’e Bağlanmakta.

trdjango · Mayıs 24, 2018, 1:05öö

Esat tam olarak ne yapacağını anlamadım ama aşağıdaki kodlar işini görebilir, siyah şapkalı değilsin di mi? Bir tür hack kodu hazırlamıyosundur umarım

import requests
proxies = {'http':'http://x.x.x.x', 'https':'https://x.x.x.x'}
auth = requests.auth.HTTPProxyAuth('username', 'password')
r = requests.get('http://www.example.com', proxies = proxies, auth = auth)
print (r.status_code, r.reason)

Esat_Yilmaz · Mayıs 24, 2018, 4:27ös

Proxy’lerim Şifresiz Otomatik Giriyor Ve Şöyle Bir Şey Var IDLE’da Çalışan Kodum Pycharm İle Yazıp Kaydedince Çalışmıyor Sebebini Anlayamadım Bir Türlü…

trdjango · Mayıs 24, 2018, 5:13ös

Pycharm hiç kullanmadım ama muhakkak konfigürasyon ayarlarında problem olabilir ben hep geany kullanırım, ayarlardan python3.6 yı seçip F5 'e bastığımda otomatik olarak python yolunu tanıyıp kodları çalıştırıyor, python yolunu tanıttığından emin misin?Özel sebebin yoksa Ubuntu ve editör olarak geany kullan, böylece ek sorunlarla uğraşıp zaman kaybetmezsin.
Proxy bağlantısına gelince:
ubuntu için;
install
sudo pip3 install PySocks
kullanımı
github da bu modülün pek çok kullanım örneği var ben kısaca şu örneği paylaşayım:

import socket
import socks
import requests
ip='localhost' # proxy'yi değiştir
port = 0000 # proxy portunu da isteğine göre değiştir
socks.setdefaultproxy(socks.PROXY_TYPE_SOCKS5, ip, port)
socket.socket = socks.socksocket
url = u'http://ajax.googleapis.com/ajax/services/search/images?v=1.0&q=inurl%E8%A2%8B'
print(requests.get(url).text)

Esat_Yilmaz · Mayıs 24, 2018, 5:14ös

Sağolun Hocam İyi Güzelde Pycharmda Her Türlü Programım Çalışıyor Sorun Yok.Tek Şu Proxy Olayı Çalışmıyor…Birde Proxylerim HTTP Socks5 Proxy Bulmak Çok Zor

trdjango · Mayıs 24, 2018, 5:25ös

şu kodları deneyebilir misin ?
1)
import urllib2

proxy_support = urllib2.ProxyHandler({"http":"http://61.233.25.166:80"})
opener = urllib2.build_opener(proxy_support)
urllib2.install_opener(opener)

html = urllib2.urlopen("http://www.google.com").read()
print html

2)aşağıda proxy yazan yere(sözlüğün(dict)içine) kendi proxy’ni girersin
import urllib2

#proxy = "61.233.25.166:80"
proxy = "YOUR_PROXY_GOES_HERE"

proxies = {"http":"http://%s" % proxy}
url = "http://www.google.com/search?q=test"
headers={'User-agent' : 'Mozilla/5.0'}

proxy_support = urllib2.ProxyHandler(proxies)
opener = urllib2.build_opener(proxy_support, urllib2.HTTPHandler(debuglevel=1))
urllib2.install_opener(opener)

req = urllib2.Request(url, None, headers)
html = urllib2.urlopen(req).read()
print html

Esat_Yilmaz · Mayıs 24, 2018, 5:27ös

Hocam Python 3 Kullanıyorum

trdjango · Mayıs 24, 2018, 5:34ös

Hocam kodların en başına şu satırı ekleyebilcen mi ?
import urllib.request as urllib2

Esat_Yilmaz · Mayıs 24, 2018, 5:36ös

Hocam Sanırım Olayı Çözdüm Ama…

import requests
sunucu={"https":"178.18.214.241:8080"}
r=requests.get("https://whatismyipaddress.com/",proxies=sunucu)
print(r.text)

Şöyle Bir Kod Girince İp Değişiyor Lakin Googleda Olmuyor Sanırım…

Esat_Yilmaz · Mayıs 24, 2018, 5:40ös

http://pasted.co/24cf5dda Şuradaki Çıktıya Bakarsanız İp Sitesinde Değişmiş Görünüyor Fakat Google’da Hala Aynı İp…Acaba User Agent mi Değiştirmek Gerekir?

Esat_Yilmaz · Mayıs 24, 2018, 5:44ös

Proxy Olayını Çözdüm Fakat Şöyle Bir Sorun var ki Google Girilen Proxy’ede Ban Attı Gözüküyor Siteleri Vermiyor…

trdjango · Mayıs 24, 2018, 5:47ös

Google ın güvenlikle ilgili aldığı önlemler muhakkak aşılır da şu an için bu konuda bir görüş bildiremeyeceğim ama bilgi edinirsem muhakkak paylaşırım burda.En son kendi gmailime de giremiyordum, telefon numaramı istiyodu, google gerçekten berbat bi kurum, arama motorundan veri çekmek istiyorsan duckduckgo’yu deneyebilir misin orda bir sorun çıkacak mı bakalım?

Esat_Yilmaz · Mayıs 24, 2018, 5:48ös

Deneyeyim Fakat Duckduckgo Google Kadar Güzel Sonuç Vermiyor Ve Dorkta Yok Sanırım

Esat_Yilmaz · Mayıs 24, 2018, 5:51ös

Ve Duckduckgo’dan Veri Çekemedim

trdjango · Mayıs 24, 2018, 6:05ös

Veri çekmek için tüm kısıtlardan kaçmak için bir tarayıcı gibi internette dolaşmak en iyisi özel bir nedenin yoksa yukarıdaki modül kullanım konusunda; seleniumla firefox’u headless olarak kullanarak netti dolaşabilir isteğin verileri çekebilirsin.Bunu haricinde veri çekiminde yukarıdaki modülle google engeli nasıl aşılır bilemecem şimdik:D

from selenium import webdriver
from selenium.webdriver.firefox.options import Options

options = Options()
options.set_headless(headless=True)
driver = webdriver.Firefox(firefox_options=options, executable_path='geckodriver')#geckodriver firefox için netten indirebilirsin
driver.get("http://google.com/")
print ("Headless Firefox Başlatılıyor")
driver.quit()

Esat_Yilmaz · Mayıs 24, 2018, 6:10ös

Mozilla’ya Gerek var Mı Peki?

Esat_Yilmaz · Mayıs 24, 2018, 6:14ös

Ve Bu Arada options.set_headless(headless=True) Hata Veriyor.

options.set_headless(headless=True)
AttributeError: 'Options' object has no attribute 'set_headless'

trdjango · Mayıs 24, 2018, 6:15ös

firefox olur, phanthonjs olur headless tarayıcılardan biri olur, benim aklıma firefox geldi ondan yazdım, chrome headless kullanımı yoktu sanırım.