İkili dosyalar Türkçe karakterler

Pdfleri pypdf2 modülünü kullanarak açtığımda Türkçe karakterler yerine boşluk gösteriyor. Bu pdfyi normal bir program kullanarak açtığımda böyle bir sıkıntı vermiyor. Bu sorunu nasıl aşabilirim?

PyPDF2 yerine pdftotext’i kullanmayı denediniz mi hiç? İçinde Türkçe karakter geçen bir pdf dosyasını az önce pdftotext’i kullanarak açtım.

pip3 install pdftotext

Modülün bağımlı olduğu programlara aşağıdaki linkten göz atabilirsiniz.

import pdftotext

with open("test.pdf", "rb") as f:
    pdf = pdftotext.PDF(f)
    print(*pdf)

Bu modül c++ 14.0 versiyonunun yüklü olmasını istiyor. Eğer yüklersem kullanırım şu an aciliyeti yok.

Peki, siz bilirsiniz. İyi çalışmalar.

1 Beğeni