El procesamiento del Lenguaje Natural se basa habitualmente en las seis fases siguientes:
1. ANÁLISIS MORFOLÓGICO
Se utiliza para extraer raíces, rasgos flexivos, unidades léxicas compuestas, etc.
2. ANÁLISIS SINTÁCTICO
Aplicando una gramática correspondiente al lenguaje en cuestión, se analiza la estructura sintáctica de la frase.
3. ANÁLISIS SEMÁNTICO
Consiste en extraer la información semántica, es decir, el significado,
de la frase. En esta fase se deben resolver ambigüedades léxicas y
estructurales. En este caso también se analiza si la frase es una
pregunta que se quiera usar en un sistema de question-answering.
4. ANÁLISIS PRAGMÁTICO
Este componente analiza la información referenciada en la frase pero
que está en otro sitio. Un ejemplo de ello sería analizar a qué
sustantivos se refieren los pronombres usados en la frase.
5. PLANIFICACIÓN DE LA FRASE
En esta fase se estructura cada frase del texto, para expresar el significado adecuado sin ambigüedades.
6. GENERACIÓN DE LA FRASE
Se trata de generar una cadena lineal de palabras a partir de la estructura general de la frase, con sus correspondientes flexiones, concordancias y restantes fenómenos sintácticos y morfológicos.