Corpus

El corpus Val.Es.Co. 2.0 (Cabedo y Pons, en línea) «pretende recoger una muestra de español coloquial. Para ello, se han transcrito 46 conversaciones y se han secuenciado en diferentes unidades de análisis: intervenciones, grupos entonativos y palabras» 

El corpus tiene un etiquetado correcto en un 75% del material registrado. El 25% restante está actualmente en proceso de revisión. Un 90% del corpus está compuesto por conversaciones recogidas en entornos reales de habla y mediante técnica de grabación secreta. El otro 10% pertenece a conversaciones semidirigidas en las que las personas sabían que estaban siendo grabadas.

El corpus Ameresco recoge conversaciones coloquiales espontáneas de las principales ciudades de Latinoamérica, de acuerdo con la metodología del corpus Val.Es.Co. Actualmente, participan más de 10 ciudades pertenecientes a 6 países y existen 4 más en vías de incorporación.

  • Corpus…