2: Metodología: Fuerza Bruta y el Patrón de los Cuatro Focos

Introdución

Existe una creencia extendida en el procesamiento computacional de lenguas aglutinantes: que un sistema de reglas lineales y sufijos fijos es suficiente para generar vocabulario válido. Esta creencia es falsa. El problema se manifiesta cuando se intenta aplicar dicho enfoque al verbo quechua: el algoritmo produce miles de combinaciones lógicamente posibles, pero muchas de ellas no existen en la lengua real, y otras, que sí existen, nunca llegan a ensamblarse. Este artículo describe el método algorítmico empleado para resolver esta discrepancia y presenta el Patrón de los Cuatro Focos, una clasificación que permite generar y validar sistemáticamente todas las formas verbales del quechua sin depender de listas predefinidas.

Métodos

Se utilizó una «plantilla universal» (dataset verboa_v12.csv) como molde lingüístico estandarizado. La hipótesis operativa planteaba que, al capturar matemáticamente las reglas gramaticales para una raíz verbal (ej. puklla ‘jugar’, taki ‘cantar’), el mismo núcleo algorítmico (raíz + sufijos) sería aplicable a cualquier raíz del quechua cusqueño y, por extensión, en gran medida al ayacuchano.

El motor de análisis implementó un sistema de fuerza bruta combinatoria, estructurado en niveles de profundidad morfológica denominados «Capas» :

  • Capa 1: Se cruzó la raíz con un arreglo de 76 sufijos individuales, generando 76 combinaciones directas.
  • Capa 2: Se combinaron pares de sufijos, generando ramificaciones de segundo orden.
  • Capa 3: Se combinaron tripletes de sufijos.

Cada iteración produjo miles de resultados lógicamente posibles. Para distinguir las construcciones gramaticalmente válidas de las imposibles, se incorporó una etapa de validación humana focalizada. Un equipo de hablantes nativos auditó fila por fila la matriz resultante, asignando un valor 1 a las combinaciones con uso y semántica realista en la lengua, y un valor 0 a aquellas computacionalmente posibles pero idiomáticamente inexistentes.

Resultados

Durante la ejecución de las tareas de la Capa 2 (primeras cinco iteraciones), la revisión identificó una limitación sistemática: el modelo evaluaba el vocabulario bajo una óptica lineal, diseñando una sola fila de validación por combinación de morfemas. Existían palabras de uso común que los hablantes nativos reconocían como válidas, pero que el algoritmo no ensamblaba.

El análisis de estas ausencias aisló el error en la parametrización del sufijo -y. El algoritmo asumía que dicho sufijo (con funciones de infinitivo y transformador) se acoplaba exclusivamente al inicio o al final del verbo. Al iterar con las celdas funcionales y las no funcionales, se reveló un patrón comportamental que condujo a dividir la base de datos en cuatro pistas concurrentes, denominadas Patrón de los 4 Focos:

FocoDenominaciónPatrón estructuralEjemplo (raíz puklla)
Foco 1Nominalizadoraíz -y -sufijospuklla-y-chi-na
Foco 2Infinitivizado absolutoraíz -sufijos -ypuklla-chi-na-y
Foco 3Doble estado o complejoraíz-y -sufijos -ypuklla-y-chi-na-y
Foco 0Sin infinitivoraíz -sufijospuklla-chi-na

Esta nueva clasificación resolvió las discrepancias. Además, permitió automatizar reglas de depuración por «anulación»: el sistema puede desactivar infinitivos redundantes cuando colisionan con otros sufijos terminados nativamente en vocal y.

La adopción del Patrón de los 4 Focos transformó la estructura del proyecto. Metodológicamente, se descartó un enfoque lineal de «activar/desactivar sufijos» en favor de un sistema de estados funcionales que permite encadenamientos sin colisiones.

Este arreglo procedimental permite mapear de manera trazable y auditable la morfología verbal del quechua. El método de fuerza bruta combinada con control por capas y ejes de estado sugiere que el tratamiento computacional de lenguas aglutinantes requiere abandonar moldes lineales y adoptar arquitecturas que reconozcan su naturaleza multidimensional.

Discusión

La adopción del Patrón de los 4 Focos transformó la estructura del proyecto. Metodológicamente, se descartó un enfoque lineal de «activar/desactivar sufijos» en favor de un sistema de estados funcionales que permite encadenamientos sin colisiones.

Este arreglo procedimental permite mapear de manera trazable y auditable la morfología verbal del quechua. El método de fuerza bruta combinada con control por capas y ejes de estado sugiere que el tratamiento computacional de lenguas aglutinantes requiere abandonar moldes lineales y adoptar arquitecturas que reconozcan su naturaleza multidimensional.

Diversos lingüistas como Rodolfo Cerrón-Palomino, Gerald Taylor y Willem Adelaar han descrito el sufijo -y como un operador de nominalización dentro del sistema quechua. Sin embargo, mientras estos enfoques lo explican de forma teórica, el presente modelo lo reproduce computacionalmente, evidenciando que la posición del sufijo -y no solo cambia la categoría, sino el estado estructural del sistema verbal.

Leave a Comment