locale.setlocale(locale.LC_ALL, "tr_TR") yapısında sorun yaşıyorum. Türkçe karakter sorunu

Merhaba,
Fırat Özgül Python 3 kitabında sf.239’da sorted() fonksiyonunun Türkçe karakterleri sıralaması için anlatılan yöntem hata veriyor. Ubuntu 16.04’le gelen python 3.5 ve anaconda 3.6 paketlerinin ikisini de denedim. Kabukta da hata veriyor. Pycarm IDE ile de hata alıyorum.
önce şu modülü yüklüyorum:

import locale
locale.setlocale(locale.LC_ALL,"tr_TR") #GNU/Linux için
print(sorted("çiçek", key=locale.strxfrm))

çalıştırınca:

Traceback (most recent call last):
File “/home/orion/Dropbox/PROGRAMLAMA/Python_Projects/Python-3_F_Ozdil_Notlar/bolum16_karakter_dizi.py”, line 42, in
locale.setlocale(locale.LC_ALL,“tr_TR”)
File “/usr/lib/python3.5/locale.py”, line 594, in setlocale
return _setlocale(category, locale)
locale.Error: unsupported locale setting

söylediği locale.py dosyasında belirttiği satırda böyle bir şeyler var. Bir tanımlama sanırım.

def setlocale(category, locale=None):

""" Set the locale for the given category.  The locale can be
    a string, an iterable of two strings (language code and encoding),
    or None.

    Iterables are converted to strings using the locale aliasing
    engine.  Locale strings are passed directly to the C lib.

    category may be given as one of the LC_* values.

"""
if locale and not isinstance(locale, _builtin_str):
    # convert to string
    locale = normalize(_build_localename(locale))
return _setlocale(category, locale)

şunu da denedim (tabi kitapta yok):
locale.setlocale(locale.LC_ALL, locale="tr_TR")

aynı hatayı alıyorum. İşin içinden çıkamadım.

Merhaba, uçbirime aşağıdaki komutu yazınca çıkan sonuçlar içinde tr_TR’yi görüyor musunuz?

locale -a

Uçbirim’e aşağıdaki komutları yazmayı deneyin sonra python scriptinizi çalıştırın bakalım aynı hatayı verecek mi?

export LC_ALL=C

Bir de aşağıdaki yöntemi deneyin.

import locale
locale.setlocale(locale.LC_ALL, "tr_TR.utf8")
print(sorted("çiçek", key=locale.strxfrm))

Yukarıda önerilen yöntemler işe yaramazsa aşağıdakini bir deneyin:

sudo apt-get install language-pack-tr

sudo dpkg-reconfigure locales  # *

# *: Karşınıza çıkan menüde All Locales seçeneği seçilmemişse
# onu seçin ve "ok" tuşuna basın.
# Daha sonra karşınıza başka bir menü çıkar,
# menüde "tr_TR.utf.8" seçilmemişse
# seçin ve "ok" tuşuna basın.
2 Beğeni

~$ locale -a
C
C.UTF-8
en_AG
en_AG.utf8
en_AU.utf8
en_BW.utf8
en_CA.utf8
en_DK.utf8
en_GB.utf8
en_HK.utf8
en_IE.utf8
en_IN
en_IN.utf8
en_NG
en_NG.utf8
en_NZ.utf8
en_PH.utf8
en_SG.utf8
en_US.utf8
en_ZA.utf8
en_ZM
en_ZM.utf8
en_ZW.utf8
POSIX
tr_TR.utf8
bunlar var.
dediğiniz gibi
locale.setlocale(locale.LC_ALL,locale="tr_TR.utf8")
veya
locale.setlocale(locale.LC_ALL,"tr_TR.utf8")
yapınca oldu. Ama bu fonksiyondan soğudum. Yani yazdığım programın karşı tarafta çalışıp çalışmadığına emin olamam :S.
Neden farklı acaba?
Yani
locale.py içinde tanımladığı aliases’lara baktığımda “tr_TR” görüyorum. Kütüphane ile ilgili bir sorun sanmıştım.

Kitapta bu yöntem tek bir yerde işe yaramaz diyor. Ama ben dediğiniz paketleri yükleyince “ı” harfini “i” harfinden önceye aldı. Yani doğru çalıştı. Burada da garip bir durum var. Acaba paketler üzerinde güncelleme mi oldu? Bu arada çok teşekkürler…

sorted(“çiçek”, key=locale.strxfrm)
Burada sorted() metodunun key adlı özel bir parametresine locale.strxfrm değerini vererek
Türkçeye duyarlı bir sıralama yapılmasını sağladık. Yukarıdaki yöntem pek çok durumda
işinize yarar. Ancak bu yöntem tek bir yerde işe yaramaz. Dikkatlice bakın:
sorted(“afgdhkıi”, key=locale.strxfrm)
[‘a’, ‘d’, ‘f’, ‘g’, ‘h’, ‘i’, ‘ı’, ‘k’]

locale -a yazınca sadece bu çıktıyı mı aldınız, yoksa bir kısmını mı buraya taşıdınız?

Benim aldığım çıktı aşağıdaki mesela:

~$ locale -a
aa_DJ
aa_DJ.utf8
aa_ER
aa_ER@saaho
aa_ET
af_ZA
af_ZA.utf8
ak_GH
am_ET
an_ES
an_ES.utf8
anp_IN
ar_AE
ar_AE.utf8
ar_BH
ar_BH.utf8
ar_DZ
ar_DZ.utf8
ar_EG
ar_EG.utf8
ar_IN
ar_IQ
ar_IQ.utf8
ar_JO
ar_JO.utf8
ar_KW
ar_KW.utf8
ar_LB
ar_LB.utf8
ar_LY
ar_LY.utf8
ar_MA
ar_MA.utf8
ar_OM
ar_OM.utf8
ar_QA
ar_QA.utf8
ar_SA
ar_SA.utf8
ar_SD
ar_SD.utf8
ar_SS
ar_SY
ar_SY.utf8
ar_TN
ar_TN.utf8
ar_YE
ar_YE.utf8
as_IN
ast_ES
ast_ES.utf8
ayc_PE
az_AZ
be_BY
be_BY@latin
be_BY.utf8
bem_ZM
ber_DZ
ber_MA
bg_BG
bg_BG.utf8
bhb_IN.utf8
bho_IN
bn_BD
bn_IN
bo_CN
bo_IN
br_FR
br_FR@euro
br_FR.utf8
brx_IN
bs_BA
bs_BA.utf8
byn_ER
C
ca_AD
ca_AD.utf8
ca_ES
ca_ES@euro
ca_ES.utf8
ca_ES.utf8@valencia
ca_ES@valencia
ca_FR
ca_FR.utf8
ca_IT
ca_IT.utf8
ce_RU
chr_US
ckb_IQ
cmn_TW
crh_UA
csb_PL
cs_CZ
cs_CZ.utf8
C.UTF-8
cv_RU
cy_GB
cy_GB.utf8
da_DK
da_DK.utf8
de_AT
de_AT@euro
de_AT.utf8
de_BE
de_BE@euro
de_BE.utf8
de_CH
de_CH.utf8
de_DE
de_DE@euro
de_DE.utf8
de_IT
de_IT.utf8
de_LI.utf8
de_LU
de_LU@euro
de_LU.utf8
doi_IN
dv_MV
dz_BT
el_CY
el_CY.utf8
el_GR
el_GR.utf8
en_AG
en_AU
en_AU.utf8
en_BW
en_BW.utf8
en_CA
en_CA.utf8
en_DK
en_DK.iso885915
en_DK.utf8
en_GB
en_GB.iso885915
en_GB.utf8
en_HK
en_HK.utf8
en_IE
en_IE@euro
en_IE.utf8
en_IL
en_IN
en_NG
en_NZ
en_NZ.utf8
en_PH
en_PH.utf8
en_SG
en_SG.utf8
en_US
en_US.iso885915
en_US.utf8
en_ZA
en_ZA.utf8
en_ZM
en_ZW
en_ZW.utf8
eo
eo_US.utf8
es_AR
es_AR.utf8
es_BO
es_BO.utf8
es_CL
es_CL.utf8
es_CO
es_CO.utf8
es_CR
es_CR.utf8
es_CU
es_DO
es_DO.utf8
es_EC
es_EC.utf8
es_ES
es_ES@euro
es_ES.utf8
es_GT
es_GT.utf8
es_HN
es_HN.utf8
es_MX
es_MX.utf8
es_NI
es_NI.utf8
es_PA
es_PA.utf8
es_PE
es_PE.utf8
es_PR
es_PR.utf8
es_PY
es_PY.utf8
es_SV
es_SV.utf8
es_US
es_US.utf8
es_UY
es_UY.utf8
es_VE
es_VE.utf8
et_EE
et_EE.iso885915
et_EE.utf8
eu_ES
eu_ES@euro
eu_ES.utf8
eu_FR
eu_FR@euro
eu_FR.utf8
fa_IR
ff_SN
fi_FI
fi_FI@euro
fi_FI.utf8
fil_PH
fo_FO
fo_FO.utf8
fr_BE
fr_BE@euro
fr_BE.utf8
fr_CA
fr_CA.utf8
fr_CH
fr_CH.utf8
fr_FR
fr_FR@euro
fr_FR.utf8
fr_LU
fr_LU@euro
fr_LU.utf8
fur_IT
fy_DE
fy_NL
ga_IE
ga_IE@euro
ga_IE.utf8
gd_GB
gd_GB.utf8
gez_ER
gez_ER@abegede
gez_ET
gez_ET@abegede
gl_ES
gl_ES@euro
gl_ES.utf8
gu_IN
gv_GB
gv_GB.utf8
hak_TW
ha_NG
he_IL
he_IL.utf8
hi_IN
hne_IN
hr_HR
hr_HR.utf8
hsb_DE
hsb_DE.utf8
ht_HT
hu_HU
hu_HU.utf8
hy_AM
hy_AM.armscii8
ia_FR
id_ID
id_ID.utf8
ig_NG
ik_CA
is_IS
is_IS.utf8
it_CH
it_CH.utf8
it_IT
it_IT@euro
it_IT.utf8
iu_CA
ja_JP.eucjp
ja_JP.utf8
ka_GE
ka_GE.utf8
kk_KZ
kk_KZ.rk1048
kk_KZ.utf8
kl_GL
kl_GL.utf8
km_KH
kn_IN
kok_IN
ko_KR.euckr
ko_KR.utf8
ks_IN
ks_IN@devanagari
ku_TR
ku_TR.utf8
kw_GB
kw_GB.utf8
ky_KG
lb_LU
lg_UG
lg_UG.utf8
li_BE
lij_IT
li_NL
ln_CD
lo_LA
lt_LT
lt_LT.utf8
lv_LV
lv_LV.utf8
lzh_TW
mag_IN
mai_IN
mg_MG
mg_MG.utf8
mhr_RU
mi_NZ
mi_NZ.utf8
mk_MK
mk_MK.utf8
ml_IN
mni_IN
mn_MN
mr_IN
ms_MY
ms_MY.utf8
mt_MT
mt_MT.utf8
my_MM
nan_TW
nan_TW@latin
nb_NO
nb_NO.utf8
nds_DE
nds_NL
ne_NP
nhn_MX
niu_NU
niu_NZ
nl_AW
nl_BE
nl_BE@euro
nl_BE.utf8
nl_NL
nl_NL@euro
nl_NL.utf8
nn_NO
nn_NO.utf8
nr_ZA
nso_ZA
oc_FR
oc_FR.utf8
om_ET
om_KE
om_KE.utf8
or_IN
os_RU
pa_IN
pap_AW
pap_CW
pa_PK
pl_PL
pl_PL.utf8
POSIX
ps_AF
pt_BR
pt_BR.utf8
pt_PT
pt_PT@euro
pt_PT.utf8
quz_PE
raj_IN
ro_RO
ro_RO.utf8
ru_RU
ru_RU.cp1251
ru_RU.koi8r
ru_RU.utf8
ru_UA
ru_UA.utf8
rw_RW
sa_IN
sat_IN
sc_IT
sd_IN
sd_IN@devanagari
sd_PK
se_NO
sgs_LT
shs_CA
sid_ET
si_LK
sk_SK
sk_SK.utf8
sl_SI
sl_SI.utf8
so_DJ
so_DJ.utf8
so_ET
so_KE
so_KE.utf8
so_SO
so_SO.utf8
sq_AL
sq_AL.utf8
sq_MK
sr_ME
sr_RS
sr_RS@latin
ss_ZA
st_ZA
st_ZA.utf8
sv_FI
sv_FI@euro
sv_FI.utf8
sv_SE
sv_SE.iso885915
sv_SE.utf8
sw_KE
sw_TZ
szl_PL
ta_IN
ta_LK
tcy_IN.utf8
te_IN
tg_TJ
tg_TJ.utf8
the_NP
th_TH
th_TH.utf8
ti_ER
ti_ET
tig_ER
tk_TM
tl_PH
tl_PH.utf8
tn_ZA
tr_CY
tr_CY.utf8
tr_TR
tr_TR.utf8
ts_ZA
tt_RU
tt_RU@iqtelif
ug_CN
ug_CN@latin
uk_UA
uk_UA.utf8
unm_US
ur_IN
ur_PK
uz_UZ
uz_UZ@cyrillic
uz_UZ.utf8
ve_ZA
vi_VN
wa_BE
wa_BE@euro
wa_BE.utf8
wae_CH
wal_ET
wo_SN
xh_ZA
xh_ZA.utf8
yi_US
yi_US.utf8
yo_NG
yue_HK
zh_CN
zh_CN.gb18030
zh_CN.gbk
zh_CN.utf8
zh_HK
zh_HK.utf8
zh_SG
zh_SG.gbk
zh_SG.utf8
zh_TW
zh_TW.euctw
zh_TW.utf8
zu_ZA
zu_ZA.utf8

Benim aldığım çıktıda hem tr_TR, hem tr_TR.utf8 var. Acaba sizinkinde niye tr_TR yok?

Paylaştığınız kodlar bilgisayarımda hem tr_TR, hem de tr_TR.utf8 yazınca çalışıyor.

Bir önceki mesajımda önerilen son yöntemi de uyguladınız mı?

Listenin tamamı bu kadar. Kesmedim yani. Ayrıca tr_TR.utf8 işe yaradı. Ayrıca son yönetimi de uyguladım evet.

Listeniz niye bu kadar kısa iki; tr_TR niye yok bu listede, bunları düşünüyorum. Bu yüzden son yöntemi denediniz mi diye sordum, son yöntemden sonra tr_TR listede görünmeye başladı mı merak etmiştim.

Söylediklenizi uyguladım. Ama bende liste bu kadar çıkıyor.

orion@orionPC:~$ locale -a
C
C.UTF-8
en_AG
en_AG.utf8
en_AU.utf8
en_BW.utf8
en_CA.utf8
en_DK.utf8
en_GB.utf8
en_HK.utf8
en_IE.utf8
en_IN
en_IN.utf8
en_NG
en_NG.utf8
en_NZ.utf8
en_PH.utf8
en_SG.utf8
en_US.utf8
en_ZA.utf8
en_ZM
en_ZM.utf8
en_ZW.utf8
POSIX
tr_CY.utf8
tr_TR.utf8
orion@orionPC:~$
Ben de anlayamadım neden tr_TR yok.
sudo apt-get install language-pack-tr

ile kurunca artı olarak bu listeye tr_CY.utf8 eklendi okadar

İlginç. Neyse. Bu arada kodları, karşı tarafın olası durumlarına göre yazabilirsiniz.

Mesela:

import locale
try:
    locale.setlocale(locale.LC_ALL, locale="tr_TR")
    ...
except locale.Error:
    locale.setlocale(locale.LC_ALL, locale="tr_TR.utf8")
    ...

Güzel fikir. Teşekkürler…

Rica ederim, iyi akşamlar.

Merhaba. Bu çözüm linux için anlatılmış. Acaba windows 10 / PyCharm ortamında nasıl yapabiliriz? Bende de aynı problem var. ı ve i harflerini ters sıralıyor. i yi önce yazıyor. Teşekkürler.

Merhaba. Karşılaştığınız sorunla ilgili olarak YazBel belgelerinde şöyle bir çözüm yolu önerilmiştir:

Burada sorted() metodunun key adlı özel bir parametresine locale.strxfrm değerini vererek Türkçe’ye duyarlı bir sıralama yapılmasını sağladık. Yukarıdaki yöntem pek çok durumda işinize yarar. Ancak bu yöntem tek bir yerde işe yaramaz. Dikkatlice bakın:

sorted("afgdhkıi", key=locale.strxfrm)

['a', 'd', 'f', 'g', 'h', 'i', 'ı', 'k']

Gördüğünüz gibi, bu yöntem ‘i’ harfini ‘ı’ harfinden önce getiriyor. Halbuki Türk alfabesine göre bunun tersi olmalıydı. Buna benzer problemlerle İngiliz alfabesi dışındaki pek çok alfabede karşılaşırsınız. Dolayısıyla bu sadece Türkçe’ye özgü bir sorun değil.

Bu soruna karşı şöyle bir kod da yazabilirsiniz:

harfler = "abcçdefgğhıijklmnoöprsştuüvyz"
çevrim = {i: harfler.index(i) for i in harfler}
sorted("afgdhkıi", key=çevrim.get)

['a', 'd', 'f', 'g', 'h', 'ı', 'i', 'k']

Kaynak: https://belgeler.yazbel.com/python-istihza/karakter_dizileri.html

dildeolupbiten Arkadaşım,
Çabuk ve güzel cevabın için çok teşekkür ederim. İşimi gördü.
Harun