Clasificación de Corpus Lingüísticos: Tipos y Características

Enviado por Chuletator online y clasificado en Español

Escrito el en español con un tamaño de 2,58 KB

Tipos de Corpus Lingüísticos

Los corpus lingüísticos se clasifican principalmente según los siguientes parámetros:

1. Según la Modalidad de la Lengua

  • Escritos: Conformados por muestras de lengua escrita (por ejemplo, Corpus Textual Informatitzat de la Llengua Catalana (CTILC)).
  • Orales: Recogen muestras de lengua hablada, que pueden ser:
    • Transcripciones ortográficas de grabaciones (corpus de lengua oral).
    • Grabaciones (corpus orales).
  • Mixtos: Combinan ambas modalidades, favoreciendo la lengua escrita (por ejemplo, CREA, BNC).

2. Según el Número de Lenguas

  • Monolingües: Compuestos por textos en una sola lengua (por ejemplo, CREA, CORGA).
  • Bilingües o Multilingües: Formados por textos de dos o más lenguas:
    • Corpus comparables (paired texts): Textos en diferentes lenguas con características similares.
    • Corpus paralelos (bi-texts): Textos en diferentes lenguas que son traducciones mutuas.
    • Corpus alineados: Corpus paralelos con textos dispuestos uno al lado del otro para facilitar la extracción de equivalencias de traducción.

3. Según el Tamaño

  • Corpus grandes: Sin límite de palabras o con un límite muy elevado.
  • Corpus equilibrados: Recogen la misma proporción de diferentes tipos de textos.
  • Corpus piramidales: Textos distribuidos en estratos con diferentes cantidades y variedades temáticas.
  • Corpus léxicos (sample corpus): Fragmentos de textos muy pequeños y de longitud constante.

4. Según los Límites

  • Corpus cerrados: Número finito de palabras establecido previamente.
  • Corpus abiertos: Crecimiento constante mediante la introducción periódica de nuevos textos.

5. Según la Especificidad

  • Corpus generales o de referencia: Reflejan la lengua o variedad lingüística de forma equilibrada.
  • Corpus especializados: Recogen textos para describir un tipo particular de lengua (sublenguaje).
  • Corpus genéricos: Textos pertenecientes a un único género (por ejemplo, York-Helsinki Parsed Corpus of Old English Poetry).
  • Corpus canónicos: Todos los textos que configuran la obra completa de un autor.

Entradas relacionadas: