Conceptes clau en traducció i localització

Enviado por Programa Chuletas y clasificado en Informática y Telecomunicaciones

Escrito el en catalán con un tamaño de 3,52 KB

Localització, internacionalització i codi

Localització: És la traducció de programes informàtics o volums d'informació processats en programes informàtics.

Internacionalització: Consisteix a dissenyar una aplicació de manera que pugui adaptar-se a diferents llengües i regions sense necessitat de canviar el codi.

Codi: Conjunt de totes les instruccions, ordres, sentències escrites en llenguatge de programació que, en executar-lo, fa que el programa funcioni o faci el que ha de fer.

Característiques de .xml:

  • És un conjunt no finit (a diferència de l'HTML).
  • El format s'ha separat del text en un full d'estil (stylesheet), això fa que el text es pugui reutilitzar en diferents ocasions.
  • La sintaxi és estricta.

TAO i Traducció Automàtica (TA)

Traducció Assistida per Ordinador (TAO): Consisteix a facilitar la tasca al traductor amb una memòria de traducció i una base de dades terminològica. És a dir, qui tradueix és el traductor, però això és una eina de suport: només t'ajuda a reciclar i a poder-ho reutilitzar en altres traduccions o situacions.

Traducció Automàtica (TA): Tradueix el programa, i l'usuari pot fer poca cosa, com ara ampliar els diccionaris o les bases de dades per a una segona vegada i, en alguns casos, afegir regles com ara:

  • Editar el text.
  • Preparar el text; preedició del text.
  • També podem intentar tallar frases.

Corpus i llenguatge de marcatge

Corpus: És qualsevol cos textual o compilació de textos, processats o no processats.

  • Lema: Busca totes les formes d'aquesta paraula.
  • Paraula: Només busca la paraula en qüestió.
  • Corpus etiquetat: Et permet buscar per lemes i paraules.
  • Corpus no etiquetat: Només et permet buscar per paraules.
  • Corpus no anotat: Només pots buscar formes, paraules i frases concretes: NO serveix per buscar com es comporta un verb.
  • Corpus anotat: Està lematitzat i et serveix per buscar com es comporta un verb, ha de contenir com a mínim la informació morfològica.

Llenguatge de marcatge: Són els llenguatges que s'utilitzen per codificar el format d'un text en pàgines web, bases de dades: .xml, .html. Permeten aïllar allò que és format del que és text.

Codi: <tu tuid = 1 <\TUV; datatype

Traducció automàtica estadística i interlingua

Traducció automàtica estadística: Consisteix a calcular les probabilitats que una frase que tu li poses sigui la traducció de la frase que tu li has posat.

Model de traducció: Necessita un corpus paral·lel i per cada paraula es comprova quants cops es tradueix d'aquesta manera. Un cop calculat el nombre de vegades, surt un percentatge de probabilitat (X%/100%).

Model de llengua: Corpus monolingüe de la llengua d'arribada. El que surt més vegades és més probable que sigui la traducció.

Interlingua: És la representació prou abstracta d'una cadena lingüística que permet passar d'una llengua a l'altra directament. És a dir, que és un punt ideal, encara que una mica utòpic, com ara l'esperanto (llengua abstracta i comuna en totes).

Entradas relacionadas: