from PyPDF2 import PdfFileReader
path="C:\Users\assai\OneDrive\Masaüstü\20221217152144.pdf"
pdfObj=open(path,"rb")
pdfRead=PdfFileReader(pdfObj)
pdfRead.getPage(13).extractText()
Başarıyla okuduğum zaman çıktı böyle oluyor;
' Bilgisayar Mühendisliğine Giriş Final – Ders Notları \nHazırlayan: Nurettin Dönmez ders notlarının temize geçilmiş hali hata ihtimaline \nkarşı kontrol etmeniz tavsiye edilir. İlkes u ve Adem Dinler Katkılarıyla 14 Derleyici – Yorumlayıcı \nProgramlama Dili \n• İlk programlama d ili 1957 yılında çıkan FORTRAN’dır. \n• Makine dilini insanlar direkt anlayamaz. \n• Assembly dilini programlar direkt anlayamaz. \n• Aradaki iletişimi Assembler sağlar, Assembler bir programdır. \n• “Tiobe index ” Yıllık programlama dili popülerliğidir. \n• 1958 – Lisp dili matematiksel hesaplamalarda kullanılır. \n• 1959 – COBOL \n• 1964 – BASIC \n• 1970 – PASCAL \n• 1972 – C (Genel Amaçlı) \n• 1983 – C++ (Nesneye Yönelik Programlama) \n• 1991 – PYTHON \n• 1995 – PHP \n• 1995 – JAVA \nProgram: Belli bir problemi çözen, belli bir programl ama dili ile yazılmış sıralı \nkomutlar kümesidir. \nKaynak Kodun İşlem Aşamaları \nwhile (y<z) \n{ \nint x = a + b; \ny += x; \n} \n1-Program Parçalara Ayrılır \n• While \n• Sol parantez \n• Değişken (y) \n• Küçüktür işareti (<) \n• Değişken (z) \n• Sol Süslü Parantez \n '
Yukarıdaki kodlarla normal pdf dosyaları okuyabiliyorum yazıları görebiliyorum ama bir dosyada sıkıntı yaşadım ve bana bütün sayfalarda boş string döndürüyor sadece;
path2="C:\Users\assai\OneDrive\Masaüstü\20221457152144.pdf"
pdfObj2=open(path2,"rb")
pdfRead2=PdfFileReader(pdfObj2)
pdfRead2.getPage(13).extractText()
Sıkıntı yaşadığım dosyada okuma yaptığım zaman döndürdüğü boş string;
' '
Bunun sebebi ve çözümü nedir, neyi yanlış ve eksik yapıyorum bilen arkadaşlar yardımcı olursa sevinirim, amacım bu dosyadaki filigranları kaldırmaya yönelik bir uygulama geliştirmek.