Conceptes clau en traducció i localització
Enviado por Programa Chuletas y clasificado en Informática y Telecomunicaciones
Escrito el en catalán con un tamaño de 3,52 KB
Localització, internacionalització i codi
Localització: És la traducció de programes informàtics o volums d'informació processats en programes informàtics.
Internacionalització: Consisteix a dissenyar una aplicació de manera que pugui adaptar-se a diferents llengües i regions sense necessitat de canviar el codi.
Codi: Conjunt de totes les instruccions, ordres, sentències escrites en llenguatge de programació que, en executar-lo, fa que el programa funcioni o faci el que ha de fer.
Característiques de .xml:
- És un conjunt no finit (a diferència de l'HTML).
- El format s'ha separat del text en un full d'estil (stylesheet), això fa que el text es pugui reutilitzar en diferents ocasions.
- La sintaxi és estricta.
TAO i Traducció Automàtica (TA)
Traducció Assistida per Ordinador (TAO): Consisteix a facilitar la tasca al traductor amb una memòria de traducció i una base de dades terminològica. És a dir, qui tradueix és el traductor, però això és una eina de suport: només t'ajuda a reciclar i a poder-ho reutilitzar en altres traduccions o situacions.
Traducció Automàtica (TA): Tradueix el programa, i l'usuari pot fer poca cosa, com ara ampliar els diccionaris o les bases de dades per a una segona vegada i, en alguns casos, afegir regles com ara:
- Editar el text.
- Preparar el text; preedició del text.
- També podem intentar tallar frases.
Corpus i llenguatge de marcatge
Corpus: És qualsevol cos textual o compilació de textos, processats o no processats.
- Lema: Busca totes les formes d'aquesta paraula.
- Paraula: Només busca la paraula en qüestió.
- Corpus etiquetat: Et permet buscar per lemes i paraules.
- Corpus no etiquetat: Només et permet buscar per paraules.
- Corpus no anotat: Només pots buscar formes, paraules i frases concretes: NO serveix per buscar com es comporta un verb.
- Corpus anotat: Està lematitzat i et serveix per buscar com es comporta un verb, ha de contenir com a mínim la informació morfològica.
Llenguatge de marcatge: Són els llenguatges que s'utilitzen per codificar el format d'un text en pàgines web, bases de dades: .xml, .html. Permeten aïllar allò que és format del que és text.
Codi: <tu tuid = 1 <\TUV; datatype
Traducció automàtica estadística i interlingua
Traducció automàtica estadística: Consisteix a calcular les probabilitats que una frase que tu li poses sigui la traducció de la frase que tu li has posat.
Model de traducció: Necessita un corpus paral·lel i per cada paraula es comprova quants cops es tradueix d'aquesta manera. Un cop calculat el nombre de vegades, surt un percentatge de probabilitat (X%/100%).
Model de llengua: Corpus monolingüe de la llengua d'arribada. El que surt més vegades és més probable que sigui la traducció.
Interlingua: És la representació prou abstracta d'una cadena lingüística que permet passar d'una llengua a l'altra directament. És a dir, que és un punt ideal, encara que una mica utòpic, com ara l'esperanto (llengua abstracta i comuna en totes).