Clasificación de Corpus Lingüísticos: Tipos y Características
Enviado por Chuletator online y clasificado en Español
Escrito el en español con un tamaño de 2,58 KB
Tipos de Corpus Lingüísticos
Los corpus lingüísticos se clasifican principalmente según los siguientes parámetros:
1. Según la Modalidad de la Lengua
- Escritos: Conformados por muestras de lengua escrita (por ejemplo, Corpus Textual Informatitzat de la Llengua Catalana (CTILC)).
- Orales: Recogen muestras de lengua hablada, que pueden ser:
- Transcripciones ortográficas de grabaciones (corpus de lengua oral).
- Grabaciones (corpus orales).
- Mixtos: Combinan ambas modalidades, favoreciendo la lengua escrita (por ejemplo, CREA, BNC).
2. Según el Número de Lenguas
- Monolingües: Compuestos por textos en una sola lengua (por ejemplo, CREA, CORGA).
- Bilingües o Multilingües: Formados por textos de dos o más lenguas:
- Corpus comparables (paired texts): Textos en diferentes lenguas con características similares.
- Corpus paralelos (bi-texts): Textos en diferentes lenguas que son traducciones mutuas.
- Corpus alineados: Corpus paralelos con textos dispuestos uno al lado del otro para facilitar la extracción de equivalencias de traducción.
3. Según el Tamaño
- Corpus grandes: Sin límite de palabras o con un límite muy elevado.
- Corpus equilibrados: Recogen la misma proporción de diferentes tipos de textos.
- Corpus piramidales: Textos distribuidos en estratos con diferentes cantidades y variedades temáticas.
- Corpus léxicos (sample corpus): Fragmentos de textos muy pequeños y de longitud constante.
4. Según los Límites
- Corpus cerrados: Número finito de palabras establecido previamente.
- Corpus abiertos: Crecimiento constante mediante la introducción periódica de nuevos textos.
5. Según la Especificidad
- Corpus generales o de referencia: Reflejan la lengua o variedad lingüística de forma equilibrada.
- Corpus especializados: Recogen textos para describir un tipo particular de lengua (sublenguaje).
- Corpus genéricos: Textos pertenecientes a un único género (por ejemplo, York-Helsinki Parsed Corpus of Old English Poetry).
- Corpus canónicos: Todos los textos que configuran la obra completa de un autor.