Daftar Isi
Multilingualisasi (M17N) atau Dukungan Bahasa Asli untuk perangkat lunak aplikasi dilakukan dalam 2 langkah.
Internasionalisasi (I18N): Untuk membuat perangkat lunak berpotensi menangani beberapa lokal.
Pelokalan (L10N): Untuk membuat perangkat lunak menangani lokal tertentu.
![]() |
Tip |
---|---|
There are 17, 18, or 10 letters between "m" and "n", "i" and "n", or "l" and "n" in multilingualization, internationalization, and localization which correspond to M17N, I18N, and L10N. See Internationalization and localization for details. |
Perilaku program yang mendukung internasionalisasi dikonfigurasi oleh
variabel lingkungan "$LANG
" untuk mendukung pelokalan.
Dukungan aktual dari fitur dependen lokal oleh pustaka
libc
memerlukan pemasangan paket
locales
atau locales-all
. Paket
locales
harus diinisialisasi dengan benar.
Jika paket locales
dan locales-all
tidak terpasang, dukungan fitur lokal hilang dan sistem menggunakan pesan
bahasa Inggris AS dan menangani data sebagai ASCII. Perilaku ini adalah cara yang sama seperti
"$LANG
" diatur oleh "LANG=
",
"LANG=C
", atau "LANG=POSIX
".
Perangkat lunak modern seperti GNOME dan KDE telah menjadi multibahasa.
Mereka diinternasionalisasi dengan membuat mereka menangani data UTF-8 dan dilokalkan dengan menyediakan pesan
terjemahan mereka melalui infrastruktur gettext
(1).
Pesan yang diterjemahkan dapat disediakan sebagai paket pelokalan terpisah.
Sistem GUI desktop Debian saat ini biasanya menetapkan lokal di bawah
lingkungan GUI sebagai "LANG=xx_YY.UTF-8
". Di sini,
"xx
" adalah kode
bahasa ISO 639 dan "YY
" adalah kode negara ISO 3166. Nilai-nilai ini
diatur oleh dialog GUI konfigurasi desktop dan mengubah perilaku program.
Lihat Bagian 1.5.2, “Variabel "$LANG
"”
Representasi paling sederhana dari data teks adalah ASCII yang cukup untuk bahasa Inggris dan menggunakan kurang dari 127 karakter (diwakili dengan 7 bit).
Bahkan teks bahasa Inggris polos mungkin berisi karakter non-ASCII, misalnya tanda kutip kiri dan kanan yang sedikit keriting tidak tersedia dalam ASCII.
“double quoted text” is not "double quoted ASCII" ‘single quoted text’ is not 'single quoted ASCII'
Untuk mendukung lebih banyak karakter, banyak set karakter dan sistem pengodean telah digunakan untuk mendukung banyak bahasa (lihat Tabel 11.2, “Daftar nilai pengodean dan penggunaannya”).
Kumpulan karakter Unicode dapat mewakili hampir semua karakter yang dikenal manusia dengan rentang titik kode 21 bit (yaitu, 0 hingga 10FFFF dalam notasi heksadesimal).
Sistem pengodean teks UTF-8 mempaskan titik kode Unicode ke dalam aliran data 8 bit yang masuk akal yang sebagian besar kompatibel dengan sistem pemrosesan data ASCII. Hal ini membuat UTF-8 pilihan modern yang disukai. UTF adalah singkatan dari Unicode Transformation Format. Ketika data teks polos ASCII dikonversi ke UTF-8, ia memiliki konten dan ukuran yang persis sama dengan yang asli ASCII. Jadi Anda tidak kehilangan apa pun dengan menggelar lokal UTF-8.
Di bawah lokal UTF-8 dengan program aplikasi
yang kompatibel, Anda dapat menampilkan dan menyunting data teks bahasa
asing selama fonta yang diperlukan dan metode masukan dipasang dan
diaktifkan. Misalnya di bawah lokal "LANG=fr_FR.UTF-8
",
gedit
(1) (penyunting teks untuk Desktop GNOME) dapat
menampilkan dan menyunting data teks karakter Cina sambil menyajikan menu
dalam bahasa Prancis.
![]() |
Tip |
---|---|
Lokal standar baru " |
![]() |
Catatan |
---|---|
Beberapa program mengkonsumsi lebih banyak memori setelah mendukung I18N. Ini karena mereka dikodekan untuk menggunakan UTF-32(UCS4) secara internal untuk mendukung Unicode bagi optimasi kecepatan dan mengkonsumsi 4 byte per setiap data karakter ASCII independen dari lokal yang dipilih. Sekali lagi, Anda tidak kehilangan apa pun dengan menggelar lokal UTF-8. |
Agar sistem dapat mengakses lokal tertentu, data lokal harus dikompilasi dari basis data lokal.
Paket locales
tidak
dilengkapi dengan data lokal yang telah dikompilasi sebelumnya. Anda harus
mengkonfigurasinya sebagai:
# dpkg-reconfigure locales
Proses ini melibatkan 2 langkah.
Pilih semua data lokal yang diperlukan untuk dikompilasi ke dalam bentuk biner. (Pastikan untuk menyertakan setidaknya satu lokal UTF-8)
Atur nilai lokal baku seluruh sistem dengan membuat
"/etc/default/locale
" untuk digunakan oleh PAM (lihat
Bagian 4.5, “PAM dan NSS”).
Nilai lokal baku seluruh sistem yang diatur dalam
"/etc/default/locale
" dapat ditimpa oleh konfigurasi GUI
bagi aplikasi GUI.
![]() |
Catatan |
---|---|
Sistem pengodean tradisional sebenarnya dapat diidentifikasi dengan
" |
The locales-all
package comes with pre-compiled locale
data for all locale data. Since it doesn't create
"/etc/default/locale
", you may still need to install the
locales
package, too.
![]() |
Tip |
---|---|
Paket |
Untuk pertukaran data lintas platform (lihat Bagian 10.1.7, “Perangkat penyimpanan lepasan”), Anda mungkin perlu mengait beberapa
sistem berkas dengan pengodean tertentu. Misalnya,
mount
(8) untuk sistem
berkas vfat mengasumsikan CP437 jika
digunakan tanpa opsi. Anda perlu memberikan opsi mount eksplisit untuk
menggunakan UTF-8 atau CP932 untuk nama berkas.
![]() |
Catatan |
---|---|
Saat mengait otomatis memory stick USB hot-pluggable di bawah lingkungan desktop modern seperti GNOME, Anda dapat memberikan opsi mount tersebut dengan mengklik kanan ikon pada desktop, klik tab "Drive", klik untuk memperluas "Pengaturan", dan memasukkan "utf8" ke "Opsi mount:". Saat berikutnya memory stick ini dipasang, mount dengan UTF-8 diaktifkan. |
![]() |
Catatan |
---|---|
Jika Anda memutakhirkan sistem atau memindahkan disk drive dari sistem non-UTF-8 yang lebih lama, nama berkas dengan karakter non-ASCII dapat dikodekan dalam pengodean bersejarah dan usang seperti ISO-8859-1 atau eucJP. Silakan cari bantuan alat konversi teks untuk mengubahnya menjadi UTF-8. Lihat Bagian 11.1, “Alat konversi data teks”. |
Samba menggunakan Unicode untuk klien yang
lebih baru (Windows NT, 200x, XP) tetapi menggunakan CP850 untuk klien yang lebih lama (DOS dan Windows
9x/Me) sebagai baku. Baku untuk klien yang lebih tua ini dapat diubah
menggunakan "dos charset
" dalam berkas
"/etc/samba/smb.conf
", misalnya, menjadi CP932 untuk bahasa Jepang.
Terjemahan ada untuk banyak pesan teks dan dokumen yang ditampilkan dalam sistem Debian, seperti pesan kesalahan, keluaran program standar, menu, dan halaman manual. rantai alat perintah GNU gettext (1) digunakan sebagai alat backend untuk sebagian besar kegiatan terjemahan.
Di bawah "Tugas" → "Pelokalan" aptitude
(8) menyediakan
daftar panjang paket biner yang berguna yang menambahkan pesan terlokalkan
ke aplikasi dan menyediakan dokumentasi yang diterjemahkan.
Misalnya, Anda dapat memperoleh pesan lokal untuk manpage dengan memasang
paket manpages-LANG
. Untuk membaca
manpage berbahasa Italia bagi nama program dari
"/usr/share/man/it/
", jalankan sebagai berikut.
LANG=it_IT.UTF-8 man programname
GNU gettext dapat mengakomodasi daftar prioritas bahasa terjemahan dengan
variabel lingkungan $LANGUAGE
. Misalnya:
$ export LANGUAGE="pt:pt_BR:es:it:fr"
Untuk informasi selengkapnya, lihat info gettext
dan baca
bagian "Variabel LANGUAGE".
The sort order of characters with sort
(1) and
ls
(1) are affected by the locale. Exporting
LANG=en_US.UTF-8
sorts in the dictionary
A->a->B->b...->Z->z
order, while exporting
LANG=C.UTF-8
sorts in ASCII binary
A->B->...->Z->a->b...
order.
Format tanggal ls
(1) dipengaruhi oleh lokal (lihat Bagian 9.3.4, “Tampilan waktu dan tanggal yang disesuaikan”).
Format tanggal dari date
(1) dipengaruhi oleh lokal.
Misalnya:
$ unset LC_ALL $ LANG=en_US.UTF-8 date Thu Dec 24 08:30:00 PM JST 2023 $ LANG=en_GB.UTF-8 date Thu 24 Dec 20:30:10 JST 2023 $ LANG=es_ES.UTF-8 date jue 24 dic 2023 20:30:20 JST $ LC_TIME=en_DK.UTF-8 date 2023-12-24T20:30:30 JST
Tanda baca angka berbeda untuk lokal. Misalnya, di lokal Inggris, seribu
satu titik satu ditampilkan sebagai "1.000,1
" sementara
di lokal Jerman, ditampilkan sebagai "1.000,1
". Anda
mungkin melihat perbedaan ini dalam program lembar kerja.
Setiap fitur detail variabel lingkungan "$LANG
" dapat
ditimpa dengan menetapkan variabel "$LC_*
". Variabel
lingkungan ini dapat ditimpa lagi dengan menetapkan variabel
"$LC_ALL
". Lihat manpage locale
(7)
untuk rinciannya. Kecuali Anda memiliki alasan kuat untuk membuat
konfigurasi yang rumit, silakan menjauh dari mereka dan hanya menggunakan
variabel "$LANG
" yang diatur ke salah satu lokal UTF-8.
Sistem Debian dapat dikonfigurasi untuk bekerja dengan banyak pengaturan
papan ketik internasional menggunakan paket
keyboard-configuration
dan
console-setup
.
# dpkg-reconfigure keyboard-configuration # dpkg-reconfigure console-setup
Untuk konsol Linux dan sistem X Window, ini memperbarui parameter
konfigurasi di "/etc/default/keyboard
" dan
"/etc/default/console-setup
". Ini juga mengkonfigurasi
fonta konsol Linux. Banyak karakter non-ASCII termasuk karakter beraksen
yang digunakan oleh banyak bahasa Eropa dapat dibuat tersedia dengan tombol mati, tombol
AltGr, dan tombol compose.
Untuk GNOME pada sistem desktop Wayland, Bagian 8.2.1, “Masukan papan ketik untuk konsol Linux dan X Window” tidak dapat
mendukung bahasa Eropa non-Inggris. IBus dibuat
untuk mendukung tidak hanya bahasa Asia tetapi juga bahasa Eropa.
Ketergantungan paket dari Lingkungan Desktop GNOME merekomendasikan
"ibus
" melalui "gnome-shell
". Kode
"ibus
" telah diperbarui untuk mengintegrasikan fungsi
opsi setxkbmap
dan XKB. Anda perlu mengonfigurasi
ibus
dari "Pengaturan GNOME" atau "Tweak GNOME" untuk
masukan papan ketik multibahasa.
![]() |
Catatan |
---|---|
Jika ibus aktif, konfigurasi papan ketik X klasik Anda dengan
|
Karena Lingkungan Desktop GNOME merekomendasikan "ibus
"
melalui "gnome-shell
", "ibus
" adalah
pilihan yang baik untuk metode masukan.
Masukan multibahasa ke aplikasi diproses sebagai:
Keyboard Application | ^ | | +-> Linux kernel -> Input method (ibus) -> Gtk, Qt, X, Wayland +-- Engine--+
Anda dapat memasang beberapa paket berikut ini.
Tabel 8.1. Daftar IBus dan paket-paket mesinnya
paket | popcon | ukuran | lokal yang didukung |
---|---|---|---|
ibus | V:198, I:245 | 1723 | kerangka kerja metode masukan menggunakan dbus |
ibus-mozc | V:1, I:3 | 944 | Jepang |
ibus-anthy | V:0, I:1 | 8856 | , , |
ibus-skk | V:0, I:0 | 242 | , , |
ibus-kkc | V:0, I:0 | 210 | , , |
ibus-libpinyin | V:1, I:3 | 2761 | Cina (untuk zh_CN) |
ibus-chewing | V:0, I:0 | 247 | , , (untuk zh_TW) |
ibus-libzhuyin | V:0, I:0 | 40995 | , , (untuk zh_TW) |
ibus-rime | V:0, I:0 | 73 | , , (untuk zh_CN/zh_TW) |
ibus-cangjie | V:0, I:0 | 119 | , , (untuk zh_HK) |
ibus-hangul | V:0, I:2 | 264 | Korea |
ibus-libthai | I:0 | 90 | Bahasa Thai |
ibus-table-thai | I:0 | 58 | Bahasa Thai |
ibus-unikey | V:0, I:0 | 318 | Vietnam |
ibus-keyman | V:0, I:0 | 161 | Multibahasa: Mesin Keyman untuk lebih dari 2000 bahasa |
ibus-table | V:0, I:1 | 2176 | tabel mesin untuk IBus |
ibus-m17n | V:0, I:1 | 395 | Multibahasa: Indic, Arab, dan lain-lain |
plasma-widgets-addons | V:50, I:100 | 1992 | widget tambahan untuk Plasma 5 yang berisi Indikator Papan Ketik |
![]() |
Catatan |
---|---|
Untuk Cina, " |
Saya menemukan bahwa metode masukan Jepang dimulai di bawah lingkungan
bahasa Inggris ("en_US.UTF-8
" sangat berguna. Berikut
adalah bagaimana saya melakukan ini dengan IBus untuk GNOME di Wayland:
Pasang paket alat masukan Jepang ibus-mozc
(atau
ibus-anthy
) dengan paket yang direkomendasikan seperti
im-config
.
Pilih "Pengaturan" → "Papan Ketik" → "Sumber Masukan" → klik
"+
" di "Sumber Masukan" → "Jepang" → "mozc Jepang (atau
anthy)" dan klik "Tambahkan" jika belum diaktifkan.
Anda dapat memilih sebanyak mungkin sumber masukan.
Login ulang ke akun pengguna.
Siapkan setiap sumber masukan dengan mengklik kanan ikon bilah alat GUI.
Beralih di antara sumber masukan yang dipasang dengan SUPER-SPACE. (SUPER biasanya adalah kunci Windows.)
![]() |
Tip |
---|---|
Jika Anda ingin memiliki akses ke lingkungan papan ketik alfabet saja dengan
papan ketik Jepang fisik di mana |
Entri menu GUI untuk im-config
(8) adalah "Metode
masukan".
Atau, jalankan "im-config
" dari shell pengguna.
im-config
(8) berperilaku berbeda jika perintah dijalankan
dari root atau bukan.
im-config
(8) memungkinkan metode masukan terbaik pada
sistem sebagai baku tanpa tindakan pengguna.
Konsol Linux hanya dapat menampilkan karakter terbatas. (Anda perlu
menggunakan program terminal khusus seperti jfbterm
(1)
untuk menampilkan bahasa non-Eropa pada konsol non-GUI.)
Lingkungan GUI (Bab 7, Sistem GUI) dapat menampilkan karakter apa pun di UTF-8 selama fonta yang diperlukan terpasang dan diaktifkan. (Pengodean data fonta asli diurus dan transparan kepada pengguna.)
Di bawah lokal Asia Timur, gambar kotak, karakter Yunani, dan Sirilik dapat ditampilkan lebih lebar dari lebar yang Anda inginkan untuk menyebabkan keluaran terminal yang tidak selaras (lihat Unicode Standard Annex # 11).
Anda dapat mengatasi masalah ini:
gnome-terminal
: Preferensi → Profil → Nama
profil → Kompatibilitas → Karakter lebar-ambigu → Sempit
ncurses
: Atur lingkungan export
NCURSES_NO_UTF8_ACS=0
.