Pdf dosyasından istenen bölümü jpg olarak kaydetmek

Herkese merhaba, bazı öğrencilere sınavlara hazırlık kapsamında yardımcı oluyorum. Bu amaçla elimde olan pdfleri kullanarak öğrencilere sorular hazırlıyorum. Ama her bir soruyu kırpmak, düzenlemek ve kaydetmek gibi işler bir süre sonra yoruyor. Bu amaçla pdf içindeki soruları tespit edip jpg formatında kaydeden bir kod için birkaç gün araştırma yaptım. PyMuPDF gibi kütüphanelere baktım ama aradığımı bulamadım. Amacım pdf içindeki soruları tespit edebilmek. Bunu yapabilsem geri kalan kısmı halledebilirim ama burda takıldım. Böyle bir kod için nasıl bir yol izleyebilirim? Hangi kütüphaneler bana yardımcı olur? Yardımcı olabilirseniz sevinirim.

Herkese iyi çalışmalar diliyorum.

1 Beğeni

Soruların formatını görebilir miyiz? Örnek bir kaç sayfa mesela.

Bu seneki lgs sınavını örnek verebilirim:
https://www.meb.gov.tr/meb_iys_dosyalar/2020_06/21195513_2020_sayisal_bolum_a.pdf

Elimdeki tüm pdfler aynı tarzda olsa sorun olmaz da her biri farklı düzende olduğu için böyle durumla karşı karşıya kaldım.

Sorular belli bir geometrik şekil içine alınırsa ve bu şekilleri algılayacak opencv gibi kütüphaneler kullanılırsa yapılabilir.Ama bence gereksiz bir işlem.Son çare olarak öneriyorum.