Bozuk Dizili Yazı, Düzgün Yazı Haline Nasıl Getirilir?

Merhaba arkadaşlar.
İngilizcem çok iyi değil maalesef. Ama biliyorsunuz ki Türkçe kaynak da neredeyse yok.
Bu nedenle, Türkçe’ye çevirmek için, İngilizce PDF’den kopyalayıp Google Translate’e yapıştırıyorum.
Fakat çok bozuk bi şekilde yapıştırıyor :slight_smile: Örnek olarak şu kısa paragraf:
" Each of your three document vectors will need to have 18 values, even if the document for that vector
doesn’t
contain
all 18 words in your lexicon.
Each
token
is
assigned
a
“slot” in
your
vectors
corresponding to its
position
in
your
lexicon.
Some
of
those
token
counts in the
vector
will be zeros,
which is
what you
want:"

Bu PDF’de ‘düzgün’ bi paragraf. Translate’e yapıştırınca böyle oluyor.

Ben bunları tek tek birleştireceğim diye uğraşıyorum. Ama başolacak gibi değil!

Aklıma Python’ın str işlemleri geldi. Bunları ‘düzgün bir yazı’ haline nasıl getirebilirim?

“Boşluk ekle ve birleştir” diye bi kod yazsam, zaten aralarında boşluk olanlar var.
“Boşluk varsa ekleme, yoksa ekle, sonra birleştir” desem belki olur ama, böyle uzun bir metni
bir değişkene nasıl atayabilirim? Belki bir text dosyasına yazmam gerekiyor ? Bilmiyorum.

Acaba, rica etsem yardımcı olabilir misiniz?

Herkese kolaylıklar dilerim.

Merhaba,

Bu kopyaladığınız yazıyı """ yani 3 tırnak arasına alabilirsiniz, böylelike çok satırlı string’e sahip oluruz:

text = """Each of your three document vectors will need to have 18 values, even if the document for that vector
doesn’t
contain
all 18 words in your lexicon.
Each
token
is
assigned
a
“slot” in
your
vectors
corresponding to its
position
in
your
lexicon.
Some
of
those
token
counts in the
vector
will be zeros,
which is
what you
want:"""

Bu text'i, yeni satıra geçtiği noktalardan ayırırsak (yani "\n" üzerinden), her bir satırı elde etmiş oluruz. Sonrasında da bu satırları bir boşlukla birleştirirsek, “düzgün bir yazı” elde edebiliriz

" ".join(text.splitlines())

.splitlines metodu "\n"'den ayırma işini yapıyor, .join de bir boşlukla bu ayrılan elemanları birleştiriyor. Sonunda elimizde bir string var:

'Each of your three document vectors will need to have 18 values, even if the document for that vector doesn’t contain all 18 words in your lexicon. Each token is assigned a "slot" in your vectors corresponding to its position in your lexicon. Some of those token counts in the vector will be zeros, which is what you want:'

2 Beğeni

Merhaba,

Sayın Then_Shiffman.

Yazdığınızı uyguladım. Çalıştı. Yani işe yaradı :slight_smile:
Ne kadar mutlu olduğumu anlatamam !..
Çok çok çoooooooooooook teşekkür ederim. Allah razı olsun. Beni gerçekten büyüüüüüüüüüüük
bi dertten kurtardınız. İnşallah siz de bütün dertlerden kurtulursunuz :slight_smile:
‘Şimdilik’ dua etmekten başka bi şey gelmiyor elimden. NLP konusunda bilgi sahibi olmaya çalışıyorum ama, İngilizce PDF’lerden. İnşallah kendimi geliştiririm, ben size veya başkalarına yardımcı olabilirim.

Bir kez daha ve çok kez daha çok çok teşekkür ederim.

Kolaylıklar ve başarılar dilerim.

1 Beğeni

Başka kolay bir yöntem de str.replace kullanmak:

text = """Each of your three document vectors will need to have 18 values, even if the document for that vector
doesn’t
contain
all 18 words in your lexicon.
Each
token
is
assigned
a
“slot” in
your
vectors
corresponding to its
position
in
your
lexicon.
Some
of
those
token
counts in the
vector
will be zeros,
which is
what you
want:""".replace("\n", " ")

print(text)

Bu kod "\n" (yeni satır) karakterlerini " " (boşluk) ile değiştiriyor.

3 Beğeni

Merhaba,

Sayın EkremDincel.

Sizin yazdığınızı da denedim. Evet, o da çalıştı. İyi ki sizin gibi yardımsever insanlar var.
Karanlıkta fener gibisiniz :slight_smile: Sayenizde çıkışı buluyoruz. Bulmalıyım ki, ilerleyebileyim.

Sağolun, varolun, Allah sizden de razı olsun. Çok çok çooooooooook teşekkür ederim.
Kolaylıklar ve başarılar dilerim.

Mutlu olduğunuza sevindim :slight_smile:

Kişileri etiketlerken lütfen @ koyun

Örn @throwaway1

1 Beğeni

Ah o heyecan, o heyecan… O mutluluk… :heart_eyes: :relaxed: Yazdığınız program doğru çalışıncaki o eski mutluluk…

1 Beğeni