Generé más de 118 millones de palabras en quechua.
Casi todas estaban mal.
En este post se describe el proceso utilizado para analizar cómo funcionan los sufijos en los sustantivos en quechua. El objetivo es que este análisis pueda ser entendido y replicado.
1. Corpus de datos
El análisis se basa en un entorno de generación de combinaciones a partir de una raíz:
- Raíz base: Se utilizó el sustantivo
wasi(casa). - Sufijos analizados: Se identificaron 41 sufijos organizados en 10 categorías gramaticales:
- Modificadores
- Posesivos
- Número
- Casos
- Relacionales
- Temporales
- Modales
- Validadores
- Topicalizadores
- Enfáticos
- Combinaciones iniciales: Se generaron más de 118 millones de combinaciones posibles.
2. Representación del sistema
El sistema se modeló como una estructura por niveles, donde cada sufijo ocupa una posición específica.
- Se definieron reglas de orden basadas en la gramática quechua (variante Cusco-Collao).
- No todos los sufijos pueden combinarse libremente.
- Se establecieron restricciones de compatibilidad entre categorías.
Este modelo permite entender los sufijos como un sistema estructurado y no como una lista aislada.
3. Procedimiento
El análisis se realizó en varias etapas:
- Generación: creación de combinaciones de sufijos sobre la raíz.
- Validación estructural: verificación del orden correcto de los sufijos.
- Filtrado: eliminación de combinaciones inválidas.
- Codificación: transformación de las formas válidas en estructuras analizables (vectores y nodos).
4. Validación lingüística
Además del modelo computacional, se realizó una validación con hablantes nativos:
- Se revisaron ejemplos generados para verificar su uso real.
- Se descartaron combinaciones que no son naturales en el habla.
- Se ajustaron reglas en función de esta validación.
Este paso asegura que el modelo refleje el uso real del idioma.
Criterio de evaluación de formas ambiguas
En los casos donde una forma generada resultaba ambigua o dudosa, se aplicó un proceso de evaluación en varias fases:
Lectura interna: la palabra se evaluaba de forma silenciosa, sin pronunciación, para identificar posibles inconsistencias estructurales.
Pronunciación en voz alta: en caso de duda, se pronunciaba la forma para evaluar su naturalidad fonológica.
Uso en contexto: la palabra se incorporaba en oraciones simples para observar su funcionamiento dentro de un entorno gramatical.
Validación con hablantes nativos: cuando persistían dudas, se consultaba a hablantes de quechua para verificar la aceptabilidad de la forma.
Este procedimiento se aplicó únicamente a casos ambiguos, como mecanismo de validación cualitativa complementaria al modelo computacional.
5. Métricas utilizadas
Para analizar el sistema se utilizaron las siguientes métricas:
- Número de combinaciones válidas
- Longitud estructural de las palabras
- Frecuencia de aparición de patrones
- Conectividad entre sufijos (análisis de red)
6. Herramientas
El análisis se realizó combinando herramientas computacionales y revisión manual:
- Python (Pandas, NetworkX, Scikit-learn): procesamiento de datos y análisis estructural
- Excel: organización, filtrado manual y validación puntual
- Matplotlib: generación de gráficos
- Gephi: visualización y exploración de redes de sufijos
Gephi permitió representar los sufijos como nodos y sus relaciones como enlaces, facilitando la identificación de patrones y estructuras dentro del sistema. (Gephi)
7. Limitaciones
Este estudio se enfoca únicamente en el sistema nominal:
- No incluye el sistema verbal
- Se limita a combinaciones de hasta 5 sufijos
- Algunas combinaciones posibles en teoría no se utilizan en la práctica
Nota sobre visualizaciones
En este post no se incluyen gráficos, ya que su función es explicar el proceso.
Las visualizaciones y resultados se presentan en el siguiente post.
- Parte 1 (Introducción): Ver introducción
- Parte 2 (Método): Estás aquí
- Parte 3 (Resultados): Ver resultados
Este artículo continúa la introducción del problema:
Cómo funcionan los sufijos en los sustantivos en quechua
👉 Los resultados del análisis se presentan aquí:
Resultados del análisis de sufijos en quechua