Help:Content translation/Translating/Translation quality/sq

From Linux Web Expert

Revision as of 12:50, 3 October 2023 by imported>FuzzyBot (Updating to match new version of source page)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

File:PD-icon.svg Note: When you edit this page, you agree to release your contribution under the CC0. See Public Domain Help Pages for more info. File:PD-icon.svg

Kur të bëni përkthime, është e rëndësishme të rishikohet përmbajtja para se të publikohet. Sigurohuni që përmbajtja të mos devijojë nga kuptimi origjinal, dhe kontrolli që të jetë i lexueshëm në gjuhën e duhur. Makineria fillestare e përkthimit përmban ndihmën për të përshpejtuar procesin e përkthimit me një pike fillestare të vlefshme, por mjeti nxit përdoruesin ta rishikojë dhe të përpunojë vëmendshëm përmbajtjen fillestare.

Mekanizma të ndryshëm sigurojnë që përkthyesit kanë përpunuar përmbajtjen fillestare në mënyrë të duhur. Përpunuesi i përkthimeve përcjellë sa është modifikuar përmbajtja fillestare nga përdoruesi dhe përcakton caqet që ose e ndalon botimin, ose e paralajmëron përdoruesin të rishikojë më mirë përmbajtjen.

Në këtë mënyrë, mjeti e bën të mundur që përdoruesi ta përdor makinën e përkthimit kur të jetë e nevojshme, përderisa e ndalon krijimin e rishikimeve me cilësi të dobët përkthimi. Më shumë detaje rreth asaj se si punojnë caqet, se si mund të ndryshohen në secilën gjuhë dhe si të matet cilësia e përmbajtjes me mjetet e dhëna më poshtë.

Caqet që nxitin rishikimin e përkthimit

Përkthimi i përmbajtjes e mat përqindjen e modfikimeve që bëjnë përdoruesit duke përfshirë përkthimin automatik fillestar. Në këtë mënyrë, sistemi e din sa fjalë janë shtuar, hequr, apo modifikuar nga përkthimi fillestar. Këto matje janë bërë në dy nivele të ndryshme: për çdo paragrafë dhe për të gjithë përkthimin. Caqe të ndryshme janë vendosur për çdo nivel, siç jepen me hollësi më poshtë.

Caqet për tërë përkthimin

File:Cx-limits-publish.png
Gabimi shfaqet kur mundoheni të botoni një përkthim që ka shumë përkthime të pamodifikuara. Kjo portë është rregulluar për Indonezinë e bazuar në prapaveprimet e përpunuesëve të tyre.

Botimi bllokohet nëse 95% ose më shumë e të gjithë dokumentit përbëhet nga përmbajtje e pa modifikuar, e përkthyer nga makina. Ky kufi parandalon përkthimet gati të papërpunuara të makinës dhe shmang vandalizmin e qartë. Gjithashtu parandalon përdoruesit të shtojnë thjesht përmbajtje, pa përpunuar pjesën e përkthimit makinerik. Siç jepet me hollësi më poshtë, ky cak mund të rregullohet për secilën gjuhë.

Caqet për çdo paragrafë

File:Cx-limits-paragraph.png
Paralajmërimet shfaqen për një paragraf të veçantë ku makina përkthyese e pamodifikuar tejkalon caqet.

Për çdo paragrafë, gjithashtu matet edhe përqindja e modifikimeve të përdoruesit. Një paragrafë merret parasysh problematik nëse përmban më shumë se 85% të përkthimit fillestar (ose, nëse kopjohet përmbajtja nga burimi i dokumentit, përmbanë më shumë se 60% përmbajtje të pamodifikuar).

Përpunuesi i përkthimit do të shfaq një paraljamërim për çdo paragrafë i cili merret parasysh problematik, duke nxitur përdoruesin të përpunojë më mirë. Në disa raste përdoruesit mund ende të botojnë, por faqja përfunduese mund të shtohet mundshmërisht tek kategoria e përkthimeve të pa rishikuara për komunitetin. Në raste tjera, përdoruesit nuk i lejohet të botojë.

Këto janë disa rrethana të cilat merren parasysh për të vendosur nëse i lejohet përdoruesit ta botojë apo jo (disa prej tyre janë ende duke u përpunuar):

  • Numri i paragrafeve problematike. Përdoruesve iu ndalohet botimi i përkthimeve me më shumë se 50 problematika në paragrafe. Përdoruesit mund ende të botojnë përkthimet me më pak se 50 problematika në paragrafe, por përkthimet me 10 deri në 49 problematike do të shtohen tek kategoria e përkthimeve të pa rishikuara për komunitetin.
  • Përkthimet e mëparshme të hequra. Për të parandaluar probleme të përsëritura, mjeti njëjtëson përdoruesit, përkthimet e botuara të cilëve u fshinë në 30 ditët e fundit dhe vendos kufizime shumë më të rrepta në përpjekjet e tyre të mëpasme për përkthim. Në ato raste, përkthimet me 10 apo më shumë problematika nuk do të botohen, ndërsa ato me 9 apo më pak problematike në paragrafe do të shtohen te kategoria e përkthimeve të parishikuar për komunitetin.
  • Pohimi i përdoruesit. Një prag më pak i rreptë vlen për paragrafe që përdoruesi i ka shënuar si të zgjidhura, si shenjë që përdoruesi e ka rishikuar dhe ka konfirmuar gjendjen e përkthimit. Për paragrafe në të cilat është shfaqur paralajmërimi por përdoruesi e ka shënuar si të zgjidhur, ne zbatojmë më pak caqe (duke pranuar 95% nga përkthimi automatik prej burimit të të dhënave). Kjo mundëson një mënyrë për të përshtatur rastet ku përkthimi është jashtëzakonisht i mirë, por prapë shmang mundësinë e abuzimit të vetive (p.sh. duke mos ndjekur pohimin e përdoruesit).

Përmbajtjet e pandikuara nga caqet

Disa përmbajtje nuk pritet që të përpunohen shumë, dhe nuk merren parasysh për zbatimin e caqeve të përshkruara më lartë. Kryeardha të shkurtra, përmendje, ose lista e burimeve janë të përjashtuara nga kontrollimi. Përndryshe, përdoruesit mund të marrin paralajmërime mashtruese në lidhje me përkthimin e përmbajtjes që nuk duhet të jetë, të tilla si tituj librash që shfaqen në referenca ose emra të tjerë të përveçëm.

Limits on the mobile experience

For the mobile experience the initial set of limits follow a simpler approach. At the moment, only the overall percentage of unmodified machine translation for the whole translation is considered. On mobile, the whole translation consist of just one section of the article.

In particular, a warning is shown when the percentage of unmodified machine translation is over 85% for the whole section, and publishing is prevented when the percentage of unmodified machine translation is over 95%.

Feedback on how the limits system work on the mobile context would be very useful to determine how to evolve this initial approach.

Përshtatja e caqeve

Caqet e përshkruara më lart përmbajnë një set mekanizmash të përgjithshme, por mund ketë të nevojë për përshtatje të secilës wiki. Bazuar në vlerësime, numri i modifikimeve që nevojitet për përkthimin e makinës fillestare mund të shkoj nga 10% deri në 70% varësisht nga gjuha. On some wikis, the default limits may be too strict, generating unnecessary noise or preventing perfectly valid translations from being published. On other wikis, the limits may not be strict enough, allowing the publication of translations that have not been edited enough.

Adjusting the different thresholds allows each wiki to tailor the tool's limits according to its particular needs. Feedback from native speakers is essential in properly adjusting the limits imposed. If the current limits don't seem to work well based on your experience in creating or reviewing translations, please share your feedback, and we can explore how to better adjust them.

When providing feedback about adjusting the thresholds, we recommend that you first create several example translations (make sure to check the publishing options if your test is not intended to be published as regular content). When testing how the limits work for your language, it is useful to keep in mind the following:

  • Check for both cases. Make sure to check how the limits work for both: translations where the content has not been edited enough, versus where it has been edited enough.

In this way, you can more easily find the right balance for the tool's limits feature. Checking only one type of problem can lead to moving the thresholds too far in the opposite direction.

  • Check different content. Content in our wikis is highly diverse, and machine translation may work much better for some cases compared to others.

For example, content that is full of numeric data or technical names may require less editing by users than content with more descriptive text. Make sure to test by translating of a variety of different article types, of varying lengths, with disparate content.

  • Prepare to iterate. Adjusting the thresholds is an iterative process.

It may require custom adjustments to the thresholds or that you improve your general approach. In any case, after each change, further testing may be needed to verify the improvements made.

Adjusting the limits in collaboration with editors has proven to be effective. For example, initial results show that the Indonesian community was able to significantly reduce the number of problematic translations they were receiving by restricting the publication of translations with more than 70% of unmodified machine translation content. Similar adjustments have been made for Telugu and Assamese language wikis. There is no automatic tool that is infallible, and these limits are not an exception.

The process of content review by the community is still essential, but these limits provide communities with a tool to reduce the number of translations they have to focus on, making the review process much more effective. Please share your feedback and we can explore how to better adjust them.

Tracking potentially unreviewed translations

A tracking category with the name "cx-unreviewed-translation-category" is provided for communities to easily find articles that have been published with some content exceeding the recommended limits.

You can find this category in the list of tracking categories on each wiki. Using it, you can track articles that passed the limits preventing publication, but that still had some paragraphs that were edited less than expected. For example the Indonesian Wikipedia's category includes articles that have less than 40% of machine translation overall, but which have some paragraphs with more than 80% of unmodified machine translation.

Measuring translation quality

Evaluating content quality automatically is not trivial. Deletion ratios provide a useful measure for estimating whether the content created was good enough for the community involved not to delete it. Based on the analysis of deletion ratios, articles that are created as translations are less likely to be deleted when compared with articles created from scratch. This suggests that it may not be practical to set the limits for participation through translating much higher than those set for other ways of article creation.

Find published translations

Content translation adds a contenttranslation edit tag to the published translations. This allows communities the ability to use Recent changes, and similar tools, to focus on pages created using the translation tool. In addition, data on published translations and the statistics for machine translation use are available for anyone to analyze.

Inspect a specific translation

File:Translation debugger example.webm
Translation debugger example

The Translation debugger is a tool that allows the inspection of some metadata for a given translation, including the percentage of machine translation used for the whole document, and the translation service used for each paragraph. For specific types of content such as templates, the Content Translation Server API can be queried to check how templates will be transferred across languages.

Other limits based on user expertise

File:Cx-limits-user-expertise.png
Error showing a publishing restriction based on the user expertise. This example is based on the decision of the English Wikipedia community to limit publishing directly to the mainspace to extended autoconfirmed users only.

Some wikis have implemented other restrictions for translating based on the user rights as a way to reduce the creation of low-quality translations. For example, English Wikipedia requires users to be extended confirmed, which means they need to make 500 edits on English Wikipedia before they are allowed to publish a translation as an article. Newer editors can still publish translated articles in the User: or Draft: namespaces, and then move the article to the mainspace.

This restriction was created before the system of limits described in this page was available, and it is not the recommended approach to encourage the creation of good quality translations.

Before adding restrictions that do not take into account the content created, consider going through the process of adjusting the limits of unmodified content as described above. The limits can be made as strict as needed to prevent low-quality translations, while still allowing publication by editors making good translations.