PDF Dosyaları Okumak ve Değiştirmek

from PyPDF2 import PdfFileReader
path="C:\Users\assai\OneDrive\Masaüstü\20221217152144.pdf"
pdfObj=open(path,"rb")
pdfRead=PdfFileReader(pdfObj)
pdfRead.getPage(13).extractText()

Başarıyla okuduğum zaman çıktı böyle oluyor;

' Bilgisayar Mühendisliğine Giriş Final – Ders Notları  \nHazırlayan: Nurettin Dönmez ders notlarının temize geçilmiş hali hata ihtimaline \nkarşı kontrol etmeniz tavsiye edilir.  İlkes u ve Adem Dinler  Katkılarıyla  14 Derleyici – Yorumlayıcı  \nProgramlama Dili  \n• İlk programlama d ili 1957 yılında çıkan FORTRAN’dır.  \n• Makine dilini insanlar direkt anlayamaz.  \n• Assembly dilini programlar direkt anlayamaz.  \n• Aradaki iletişimi Assembler sağlar, Assembler bir programdır.  \n• “Tiobe index ” Yıllık programlama dili popülerliğidir.  \n• 1958 – Lisp dili matematiksel hesaplamalarda kullanılır.  \n• 1959 – COBOL  \n• 1964 – BASIC  \n• 1970 – PASCAL  \n• 1972 – C (Genel Amaçlı)  \n• 1983 – C++ (Nesneye Yönelik Programlama)  \n• 1991 – PYTHON  \n• 1995 – PHP \n• 1995 – JAVA  \nProgram:  Belli bir problemi çözen, belli bir programl ama dili ile yazılmış sıralı \nkomutlar kümesidir.  \nKaynak Kodun İşlem Aşamaları  \nwhile (y<z)  \n{ \nint x = a  + b; \ny += x;  \n} \n1-Program Parçalara Ayrılır  \n• While  \n• Sol parantez  \n• Değişken (y)  \n• Küçüktür işareti (<)  \n• Değişken (z)  \n• Sol Süslü Parantez  \n  '


Yukarıdaki kodlarla normal pdf dosyaları okuyabiliyorum yazıları görebiliyorum ama bir dosyada sıkıntı yaşadım ve bana bütün sayfalarda boş string döndürüyor sadece;

path2="C:\Users\assai\OneDrive\Masaüstü\20221457152144.pdf"
pdfObj2=open(path2,"rb")
pdfRead2=PdfFileReader(pdfObj2)
pdfRead2.getPage(13).extractText()

Sıkıntı yaşadığım dosyada okuma yaptığım zaman döndürdüğü boş string;

' '

Bunun sebebi ve çözümü nedir, neyi yanlış ve eksik yapıyorum bilen arkadaşlar yardımcı olursa sevinirim, amacım bu dosyadaki filigranları kaldırmaya yönelik bir uygulama geliştirmek.

path="C:\Users\assai\OneDrive\Masaüstü\20221217152144.pdf"

dosya yollarını böyle yazma pythonda kaçış dizilerine takılırsın \a bir kaçış dizisi . Kaçış Dizileri — Yazbel Python Belgeleri

kullanım olarak;

path2=r"C:\Users\assai\OneDrive\Masaüstü\20221457152144.pdf" r ile kaçış dizilerine yakalanmamak
path2="C:\\Users\\assai\\OneDrive\\Masaüstü\\20221457152144.pdf" ters slashları çiftlemek
path2="C:/Users/assai/OneDrive/Masaüstü/20221457152144.pdf" düz slash kullanmak

dene bakalım sorun çözülecek mi. birde açtığın pdf de 13. sayfa varmı ??

path2="C:\\Users\\assai\\OneDrive\\Masaüstü\\20221457152144.pdf"

tüm slashları çift kullanmak. yukarıda tam düzeltememişim

Hocam problem yolda değil ama zaten dosyanın içeriğini okumuyor boş veri döndürüyor.

bkz: Soru Sorarken Sıkça Düşülen Hatalar #7