Help:Content translation/Translating/Translation quality/id

From Linux Web Expert

File:PD-icon.svg Note: When you edit this page, you agree to release your contribution under the CC0. See Public Domain Help Pages for more info. File:PD-icon.svg

Ketika membuat sebuah terjemahan, sangat penting untuk meninjau kembali konten sebelum menerbitkannya. Anda perlu memastikan bahwa konten yang dibuat tidak mengubah arti asli, dan memeriksa apa konten tersebut dapat dibaca secara alami dalam bahasa tujuan. Terjemahan mesin awal memberikan bantuan untuk mempercepat proses penerjemahan dari titik awal yang berguna, tetapi alat ini mendorong para pengguna untuk menilai dan menyunting kebanyakan konten awal.

Mekanisme yang berbeda menjamin bahwa penerjemah menyunting terjemahan awal dengan tepat. Penyunting terjemahan melacak berapa terjemahan awal yang diubah oleh pengguna, dan menetapkan batas yang berbeda untuk mencegah penerbitan, atau memperingatkan pengguna untuk mendorong mereka untuk meninjau konten lebih lanjut.

Dengan begini, alat ini memungkinkan para pengguna menggunakan terjemahan mesin ketika mereka menggunakannya dengan baik, serta menahan pembuatan terjemahan berkualitas rendah yang minim ditinjau. Detail lebih lanjut mengenai cara kerja batasan ini, cara menyesuaikannya dengan kebutuhan masing-masing bahasa, dan cara mengukur kualitas konten yang dihasilkan oleh alat ini disediakan di bawah.

Batasan untuk mendorong peninjauan terjemahan

Terjemahan konten mengukur persentase pengubahan yang pengguna buat di terjemahan otomatis awal yang disediakan. Dengan begini, sistem tahu berapa banyak kata yang telah ditambahkan, dihapus, atau diubah dari terjemahan awal. Pengukuran ini dilakukan pada dua tingkat: untuk masing-masing paragraf dan untuk seluruh terjemahan. Batasan berbeda diterapkan kepada masing-masing tingkat, sebagaimana dijelaskan di bawah.

Batasan untuk seluruh terjemahan

File:Cx-limits-publish.png
Galat ditampilkan ketika mencoba menerbitkan terjemahan dengan terlalu banyak terjemahan mesin yang tidak diubah. Batasan ini disesuaikan untuk bahasa Indonesia berdasarkan umpan balik dari para penyunting mereka.

Publikasi diblokir jika 95% atau lebih dari keseluruhan dokumen terdiri dari konten terjemahan mesin yang tidak dimodifikasi. Batasan ini mencegah terjemahan mesin yang hampir mentah dan menghindari vandalisme yang jelas. Ini juga mencegah pengguna hanya menambahkan konten, tanpa mengedit bagian terjemahan mesin. Sebagaimana dijelaskan di bawah, batas ini bisa disesuaikan berdasarkan bahasa.

Batasan untuk masing-masing paragraf

File:Cx-limits-paragraph.png
Peringatan ditampilkan untuk paragraf tertentu ketika terjemahan mesin yang tidak diubah melampaui batas.

Untuk setiap paragraf, persentase pengubahan dari pengguna juga diukur. Suatu paragraf dianggap bermasalah ketika paragraf tersebut mengandung lebih dari 85% terjemahan mesin awal (atau, ketika menyalin konten dari dokumen sumber, mengandung lebih dari 60% konten yang tidak diubah).

Penyunting terjemahan akan menampilkan peringatan untuk setiap paragraf yang dianggap bermasalah, mendorong pengguna untuk terus menyuntingnya. Dalam beberapa kasus pengguna masih bisa menerbitkannya, tetapi halaman yang dihasilkan bisa ditambahkan ke kategori pelacak terjemahan yang berpotensi belum ditinjau agar bisa ditinjau oleh komunitas. Dalam kasus lainnya, pengguna tidak dibolehkan menerbitkannya.

Berikut adalah beberapa faktor yang dipertimbangkan ketika menentukan apakah pengguna diperbolehkan menerbitkan atau tidak (beberapa masih dalam pengembangan):

  • Banyak paragraf bermasalah. Pengguna dilarang menerbitkan terjemahan dengan 50 atau lebih paragraf bermasalah. Pengguna masih bisa menerbitkan terjemahan dengan kurang dari 50 paragraf bermasalah, tetapi terjemahan dengan 10 sampai 49 terjemahan bermasalah akan ditambahkan ke kategori pelacak terjemahan yang berpotensi belum ditinjau agar ditinjau oleh komunitas.
  • Terjemahan yang sebelumnya dihapus. Untuk mencegah masalah berulang, alat tersebut mengidentifikasi pengguna yang terjemahannya diterbitkan telah dihapus dalam 30 hari terakhir, dan memberikan batasan yang jauh lebih ketat pada upaya terjemahan mereka selanjutnya. Dalam kasus tersebut ,terjemahan dengan 10 paragraf bermasalah atau lebih akan dihentikan dari diterbitkan, sedangkan yang memiliki 9 atau lebih kecil paragraf bermasalah akan ditambahkan ke kategori pelacak terjemahan yang berpotensi belum ditinjau agar ditinjau oleh komunitas.
  • Konfirmasi pengguna. Batasan yang lebih ringan dipertimbangkan untuk paragraf yang ditandai pengguna sudah diselesaikan, sebagai penanda bahwa pengguna itu telah meninjau dan mengonfirmasi status terjemahan. Untuk paragraf di mana peringatan konten tidak diubah ditampilkan tetapi pengguna menandainya sudah diselesaikan, kami menerapkan batasan yang lebih ringan (menerima 95% terjemahan mesin atau 75% konten sumber). Ini akan memberikan cara untuk menghadapi kasus di mana terjemahan otomatisnya sangatlah bagus, tetapi tetap menghindari potensi penyalahgunaan fitur ini (tidak sembarangan mengikuti konfirmasi pengguna).

Konten yang tidak dipengaruhi oleh batasan

Beberapa konten diperkirakan tidak perlu disunting besar-besaran, dan mereka tidak dianggap ketika menerapkan batasan yang dijelaskan di atas. Judul bagian yang sangat pendek, catatan kaki, atau daftar referensi tidak dimasukkan dalam pemeriksaan. Jika tidak, pengguna dapat menerima peringatan yang menyesatkan tentang menerjemahkan konten yang tidak seharusnya, seperti judul buku yang muncul dalam referensi atau kata benda lain yang sesuai.

Limits on the mobile experience

For the mobile experience the initial set of limits follow a simpler approach. At the moment, only the overall percentage of unmodified machine translation for the whole translation is considered. On mobile, the whole translation consist of just one section of the article.

In particular, a warning is shown when the percentage of unmodified machine translation is over 85% for the whole section, and publishing is prevented when the percentage of unmodified machine translation is over 95%.

Feedback on how the limits system work on the mobile context would be very useful to determine how to evolve this initial approach.

Mengatur batasan-batasan

Batasan yang dijelaskan di atas memberikan mekanisme umumnya, tetapi batasan tersebut mungkin membutuhkan penyesuaian tergantung kebutuhan tertentu di masing-masing wiki. Berdasarkan evaluasi awal, banyak pengubahan yang diperlukan dari terjemahan mesin awal bisa dari 10% hingga 70% bergantung pada pasangan bahasanya. Di beberapa wiki batasan standar mungkin terlalu ketat, menyebabkan peringatan yang tidak diperlukan atau menahan terjemahan yang valid dari diterbitkan. Di wiki yang lain, batasnya mungkin kurang ketat, memungkinkan penerbitan terjemahan yang kurang disunting.

Menyesuaikan ambang yang berbeda memungkinkan setiap wiki menyesuaikan batas alat sesuai dengan kebutuhan khususnya. Umpan balik dari penutur asli sangatlah penting untuk menyesuaikan batasan ini dengan tepat. Jika batasan yang sekarang rasanya tidak bekerja dengan baik menurut pengalaman Anda membuat atau meninjau terjemahan, tolong bagikan umpan balik Anda dan kami bisa melihat-lihat bagaimana cara menyesuaikan mereka dengan baik.

Ketika menyediakan umpan balik mengenai penyesuaian batasan, kami menyarankan Anda membuat beberapa terjemahan contoh (pastikan Anda sudah memeriksa pilihan penerbitan apabila uji coba Anda tidak dimaksudkan untuk diterbitkan sebagai konten biasa). Ketika menguji bagaimana batasannya bekerja di bahasa Anda, ingatlah hal-hal berikut:

  • Periksa kedua kasus. Pastikan sudah memeriksa bagaiamana batasannya bekerja untuk terjemahan di mana kontennya belum cukup disunting dan juga untuk terjemahan di mana terjemahan awalnya sudah cukup disunting. Dengan begini Anda bisa menemukan titik yang tepat untuk batasnya. Memeriksa hanya satu tipe masalah bisa membuat Anda mendorong batasannya terlalu jauh ke arah yang berlawanan.
  • Periksa konten yang berbeda. Konten dalam sebuah wiki sangatlah beragam, dan terjemahan mesin mungkin bekerja dengan lebih baik untuk beberapa kasus dibandingkan dengan kasus yang lain. Sebagai contoh, konten yang dipenuhi data numerik atau nama teknis mungkin memerlukan lebih sedikit suntingan daripada konten dengan teks yang lebih deskriptif. Pastikan untuk menguji dengan menerjemahkan berbagai jenis artikel yang berbeda, dengan panjang yang berbeda-beda, dengan konten yang berbeda.
  • Bersiap mengulang. Menyesuaikan batasan merupakan sebuah proses yang berulang. Mungkin diperlukan sebuah penyesuaian batasan tersendiri atau memperbaiki pendekatan umum. Dalam kasus apapun, setelah setiap perubahan uji coba lebih lanjut akan diperlukan untuk memastikan perbaikannya.

Menyesuaikan batasan dengan berkolaborasi dengan para penyunting telah terbukti efektif. Sebagai contoh, hasil awal menunjukkan bahwa komunitas bahasa Indonesia telah secara signifikan mengurangi banyak terjemahan bermasalah dengan membatasi penerbitan terjemahan yang mengandung lebih dari 70% terjemahan mesin yang tidak diubah. Penyesuaian serupa telah dilakukan untuk bahasa Telugu dan Assam. Tidak ada peralatan otomatis yang sempurna, dan batasan ini bukanlah pengecualian.

Proses peninjauan konten oleh komunitas tetaplah penting, tetapi batasan ini memberikan peralatan kepada komunitas untuk mengurangi banyak terjemahan yang harus difokuskan, membuat proses peninjauan lebih efektif. Tolong bagikan umpan balik Anda dan kami bisa menelusuri bagaimana cara menyesuaikan mereka dengan lebih baik.

Melacak terjemahan yang berpotensi belum ditinjau

Sebuah kategori pelacak yang bernama "cx-unreviewed-translation-category" disediakan kepada komunitas untuk menemukan dengan mudah artikel yang diterbitkan dengan beberapa kontennya melebihi batas yang disarankan.

Anda bisa menemukan kategori ini di daftar kategori pelacak di masing-masing wiki. Di sana Anda bisa menemukan artikel-artikel yang telah melebihi batas yang menahan penerbitan tetapi masih punya beberapa paragraf yang disunting lebih sedikit daripada yang diharapkan. Sebagai contoh kategori bahasa Indonesia berisi artikel-artikel dengan kurang dari 40% terjemahan mesin secara keseluruhan tetapi punya beberapa paragraf dengan lebih dari 80% terjemahan mesin yang tidak diubah.

Mengukur kualitas terjemahan

Menilai kualitas konten secara otomatis tidaklah mudah. Perbandingan penghapusan memberikan perkiraan yang berguna mengenai apakah konten yang dibuat cukup bagus untuk komunitas penyunting sehingga tidak dihapus. Berdasarkan analisis perbandingan penghapusan, artikel yang dibuat sebagai terjemahan lebih kecil kemungkinannya dihapus dibandingkan dengan artikel yang dibuat dari nol. Ini bisa berarti tidak tepat untuk memberikan batasan partisipasi melalui penerjemahan lebih tinggi dari batasan untuk cara lain membuat artikel.

Mencari terjemahan yang diterbitkan

Terjemahan konten menambahkan sebuah tag suntingan contenttranslation ke terjemahan yang diterbitkan. Hal ini memungkinkan komunitas untuk dapat menggunakan Perubahan terkini, dan alat serupa, untuk fokus pada halaman yang dibuat menggunakan alat terjemahan. Selain itu, data mengenai terjemahan yang diterbitkan dan statistik penggunaan terjemahan mesin disediakan bagi siapa saja untuk dianalisis.

Memeriksa terjemahan tertentu

File:Translation debugger example.webm
Contoh pengawakutu Terjemahan

Pengawakutu Terjemahan adalah sebuah alat yang memungkinkan pemeriksaan beberapa metadata dari suatu terjemahan, termasuk persentase terjemahan mesin yang digunakan di seluruh dokumen atau layanan terjemahan yang diguanakn untuk masing-masing paragraf. For specific types of content such as templates, the Content Translation Server API can be queried to check how templates will be transferred across languages.

Batasan lain berdasarkan keahlian pengguna

File:Cx-limits-user-expertise.png
Galat menampilkan batasan penerbitan berdasarkan keahlian pengguna. Contoh ini berdasar pada keputusan komunitas Wikipedia bahasa Inggris untuk membatasi penerbitan secara lansung ke ruang nama utama hanya bisa oleh pengguna terkonfirmasi otomatis diperluas saja.

Beberapa wiki telah mengimplementasikan batasan lain untuk menerjemahkan berdasarkan hak pengguna sebagai cara mengurangi pembuatan terjemahan berkualitas rendah. Sebagai contoh, Wikipedia bahasa Inggris mengharuskan penggunanya telah terkonfirmasi diperluas, yang artinya pengguna harus membuat 500 suntingan di Wikipedia bahasa Inggris sebelum dibolehkan menerbitkan sebuah terjemahan artikel. Penyunting baru masih bisa menerbitkan artikel yang diterjemahkan ke dalam ruang nama User: atau Draft:, dan kemudian memindahkan artikelnya ke ruang nama utama.

Pembatasan ini dibuat sebelum sistem batasan yang dijelaskan di halaman ini tersedia, dan ini bukanlah pendekatan yang disarankan untuk mendorong pembuatan terjemahan berkualitas bagus.

Sebelum menambahkan batasan yang tidak mempertimbangkan konten yang dibuat, pertimbangkan untuk melakukan proses penyesuaian batasan konten yang tidak diubah sebagaimana yang dijelaskan di atas. Batasannya bisa dibuat seketat yang diperlukan untuk menghentikan terjemahan berkualitas rendah, dan masih membolehkan penyunting yang membuat terjemahan bagus menerbitkannya.