Help:Content translation/Translating/Initial machine translation/pt-br

From Linux Web Expert

Revision as of 18:08, 20 September 2023 by imported>FuzzyBot (Updating to match new version of source page)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

File:PD-icon.svg Note: When you edit this page, you agree to release your contribution under the CC0. See Public Domain Help Pages for more info. File:PD-icon.svg

When adding a new paragraph to the translation you can start from scratch or use an automatic translation as a starting point. When available, machine translation is used by default as an initial translation. The different options, the details about their availability, and the considerations when using machine translation are described below.

The "initial translation" options in the tools column allow you to decide the initial content to use as a starting point for each paragraph. The options available are the following:

  • Use a machine translation service. This allows you to start with an automatically translated version of the original paragraph.

The number and name of these options will vary. Options such as "Use Apertium" or "Use Yandex" will be available depending on the supported languages for these services (more on this on the next section).

  • Copy original content. The original paragraph will be copied over into the translation.

Although content will remain in the original language, some elements are adapted to the target wiki. for example, links will point to the corresponding article in the target language, and templates will be converted into the equivalent ones. Translators still have to rewrite the content completely, but the adapted elements may be easier to reuse.

  • Start with an empty paragraph. Starting with an empty paragraph can be useful in cases where the alternative content requires more work than just typing it.

You can quickly switch between the different approaches independently on each paragraph, since each one may work best on different kinds of content. Switching between the different approaches preserves the changes you made on the paragraph. In this way, you can try a different approach even if you started editing the original one without the fear to lose your changes if you finally decide to go back to the original approach. Two additional options are relevant in this context:

  • The reset translation option is available when you made modifications to the initial content provided.

It allows you to restore the initial content by discarding the changes you made.

  • The mark as default option is available when you select an approach for a paragraph that is not the default.

It allows you to set the default approach for the next paragraphs that are added to the translation. This can be very convenient if you found that a particular translation service works generally better than the default one.

Machine translation availability

Content translation integrates several translation services, and each service supports a different set of languages. The services supported are listed below with a link to the list of languages they support:

The lists of languages above point to the configuration code to make sure that the information is in sync with the way the tool currently works. A lista mostra o código do idioma de origem no nível de indentação inicial e os códigos de todos os idiomas de destino suportados abaixo dele.

You can also check the available services for a specific language pair using our APIs. In this example for the Spanish-Catalan pair, you can see that Apertium is the default service (first in the list) among the other services available.

A ativação do idioma é feita de maneira gradual, com base nos resultados observados e nos comentários da comunidade. É possível que a tradução automática ainda não tenha sido ativada, mesmo se eles forem suportados pelos serviços subjacentes.

Improving existing translation services

When you publish a translation with Content Translation you are helping translation services improve. All the corrections you make to the initial machine translations are exposed through an API and data dumps and can be potentially used to improve existing services. In addition to that, some of the translation services listed above provide specific ways you can contribute to their projects.

MinT

The translations provided by MinT are based on translation models such as NLLB-200 and OpusMT. The training data compiled by the Opus project is resused by many translation models, and you can contribute to it in order to help improve the translation quality for your language.

OpusMT is an open source neural machine translation system that is trained with multilingual documents freely licensed and available online. This open corpus is used to train the translation system, and expanding the corpus will lead to better translations. The contents generated by using Content Translation are integrated automatically in the corpus, but you can contribute to expand the corpus further:

  • Propose new sources to be integrated in the open corpus. You can contact Jörg Tiedemann to propose a new data source to expand the corpus.

You can upload translated documents in various formats including translated webpages to be incorporated to the corpus.

  • Try language models locally with OPUS-CAT (available for Windows)
  • Contribute to other projects that contribute their translations to this open corpus such as Tatoeba, an on-line open community collecting translation for sentences in many languages.

OpusMT se baseia em MarianNMT , o qual também é um projeto de código aberto. People with technical knowledge and interested in machine learning can also contribute to improve it.

Apertium

Apertium is an open source rule-based translation system. You can contribute to the project by encoding the language rules of your language. This process requires both linguistic and advanced technical knowledge, but you can get support from the Apertium team to expand the translation support for a new language pair.

Google Translate

Google Translate is not an open source project, but there are still ways for users to contribute back:

Expandindo o suporte ao idioma com novos serviços de tradução

A tradução de conteúdo foi projetada como uma plataforma extensível. Portanto, é possível desenvolver novos clientes para integrar serviços de tradução adicionais. Algumas considerações sobre a maneira como os serviços de tradução são integrados:

  • As traduções automáticas e as correções feitas pelo usuário são públicas como parte de dados sobre traduções publicadas, que podem fornecer um recurso útil para criar ou melhorar seu serviço de tradução.
  • Os serviços externos integrados recebem apenas conteúdo wiki disponível publicamente e retornam uma versão traduzida desse conteúdo que é compatível com as licenças usadas no wiki. Nenhuma informação pessoal é compartilhada com os serviços de tradução.

A opinião sobre o suporte fornecido para cada idioma é muito útil. Informe-nos se estiver faltando suporte para algum idioma ou se houver opções de maior qualidade disponíveis. Você pode dar a sua opinião na página de discussão do projeto ou neste ticket.


Considerações sobre tradução automática

A tradução automática está longe de ser perfeita quando se pretende um resultado final. No entanto, muitos usuários acham muito útil como ponto de partida. Certifique-se de revisar o conteúdo dessas diferentes perspectivas:

  • Verifique se o significado original é preservado.
  • Verifique se não há informações ausentes, especialmente para elementos como links, referências e modelos que incluem informações que nem sempre são visíveis na superfície.
  • Leia o conteúdo traduzido para garantir que ele seja natural como uma página independente.

Limitações com elementos complexos

Em alguns casos, o conteúdo pode não aparecer na tradução conforme o esperado:

  • Alguns dos serviços suportados funcionam apenas com texto sem formatação. Isso significa que a formatação e os elementos de conteúdo sofisticado, como links e citações do artigo original, são perdidos na tradução, e a tradução de conteúdo precisa adivinhar onde eles pertencem ao texto traduzido. Adicionar novamente esses elementos nem sempre é perfeito e alguns elementos podem estar na posição incorreta ou aplicados à parte errada do texto.
  • Elementos complexos, como referências ou modelos, podem usar uma estrutura diferente em cada idioma, o que dificulta a transferência do conteúdo de um idioma para outro. Verifique o conteúdo desses elementos para garantir que não haja informações importantes ausentes.

Aplicação da revisão da tradução automática

Several automatic mechanisms exist to enforce the review of the initial contents. In this way, the tool makes sure that the initial automatic translation is reviewed enough before the contents get published.