2: Por qué decidí construir la base de datos del sustantivo quechua y cómo empecé»

Generé más de 118 millones de palabras en quechua.

Casi todas estaban mal.

En este post se describe el proceso utilizado para analizar cómo funcionan los sufijos en los sustantivos en quechua. El objetivo es que este análisis pueda ser entendido y replicado.


1. Corpus de datos

El análisis se basa en un entorno de generación de combinaciones a partir de una raíz:

  • Raíz base: Se utilizó el sustantivo wasi (casa).
  • Sufijos analizados: Se identificaron 41 sufijos organizados en 10 categorías gramaticales:
    • Modificadores
    • Posesivos
    • Número
    • Casos
    • Relacionales
    • Temporales
    • Modales
    • Validadores
    • Topicalizadores
    • Enfáticos
  • Combinaciones iniciales: Se generaron más de 118 millones de combinaciones posibles.

2. Representación del sistema

El sistema se modeló como una estructura por niveles, donde cada sufijo ocupa una posición específica.

  • Se definieron reglas de orden basadas en la gramática quechua (variante Cusco-Collao).
  • No todos los sufijos pueden combinarse libremente.
  • Se establecieron restricciones de compatibilidad entre categorías.

Este modelo permite entender los sufijos como un sistema estructurado y no como una lista aislada.


3. Procedimiento

El análisis se realizó en varias etapas:

  1. Generación: creación de combinaciones de sufijos sobre la raíz.
  2. Validación estructural: verificación del orden correcto de los sufijos.
  3. Filtrado: eliminación de combinaciones inválidas.
  4. Codificación: transformación de las formas válidas en estructuras analizables (vectores y nodos).

4. Validación lingüística

Además del modelo computacional, se realizó una validación con hablantes nativos:

  • Se revisaron ejemplos generados para verificar su uso real.
  • Se descartaron combinaciones que no son naturales en el habla.
  • Se ajustaron reglas en función de esta validación.

Este paso asegura que el modelo refleje el uso real del idioma.

Criterio de evaluación de formas ambiguas

En los casos donde una forma generada resultaba ambigua o dudosa, se aplicó un proceso de evaluación en varias fases:

Lectura interna: la palabra se evaluaba de forma silenciosa, sin pronunciación, para identificar posibles inconsistencias estructurales.
Pronunciación en voz alta: en caso de duda, se pronunciaba la forma para evaluar su naturalidad fonológica.
Uso en contexto: la palabra se incorporaba en oraciones simples para observar su funcionamiento dentro de un entorno gramatical.
Validación con hablantes nativos: cuando persistían dudas, se consultaba a hablantes de quechua para verificar la aceptabilidad de la forma.

Este procedimiento se aplicó únicamente a casos ambiguos, como mecanismo de validación cualitativa complementaria al modelo computacional.


5. Métricas utilizadas

Para analizar el sistema se utilizaron las siguientes métricas:

  • Número de combinaciones válidas
  • Longitud estructural de las palabras
  • Frecuencia de aparición de patrones
  • Conectividad entre sufijos (análisis de red)

6. Herramientas

El análisis se realizó combinando herramientas computacionales y revisión manual:

  • Python (Pandas, NetworkX, Scikit-learn): procesamiento de datos y análisis estructural
  • Excel: organización, filtrado manual y validación puntual
  • Matplotlib: generación de gráficos
  • Gephi: visualización y exploración de redes de sufijos

Gephi permitió representar los sufijos como nodos y sus relaciones como enlaces, facilitando la identificación de patrones y estructuras dentro del sistema. (Gephi)


7. Limitaciones

Este estudio se enfoca únicamente en el sistema nominal:

  • No incluye el sistema verbal
  • Se limita a combinaciones de hasta 5 sufijos
  • Algunas combinaciones posibles en teoría no se utilizan en la práctica

Nota sobre visualizaciones

En este post no se incluyen gráficos, ya que su función es explicar el proceso.
Las visualizaciones y resultados se presentan en el siguiente post.

📚 Serie: Análisis de los sustantivos en quechua

Este artículo continúa la introducción del problema:
Cómo funcionan los sufijos en los sustantivos en quechua

👉 Los resultados del análisis se presentan aquí:
Resultados del análisis de sufijos en quechua

Leave a Comment