El procesamiento del Lenguaje Natural se basa habitualmente en las seis fases siguientes:

1. ANÁLISIS MORFOLÓGICO

    Se utiliza para extraer raíces, rasgos flexivos, unidades léxicas compuestas, etc.

2. ANÁLISIS SINTÁCTICO

    Aplicando una gramática correspondiente al lenguaje en cuestión, se analiza la estructura sintáctica de la frase.

3. ANÁLISIS SEMÁNTICO

    Consiste en extraer la información semántica, es decir, el significado, de la frase. En esta fase se deben resolver ambigüedades léxicas y estructurales. En este caso también se analiza si la frase es una pregunta que se quiera usar en un sistema de question-answering.

4. ANÁLISIS PRAGMÁTICO

    Este componente analiza la información referenciada en la frase pero que está en otro sitio. Un ejemplo de ello sería analizar a qué sustantivos se refieren los pronombres usados en la frase.

5. PLANIFICACIÓN DE LA FRASE

    En esta fase se estructura cada frase del texto, para expresar el significado adecuado sin ambigüedades.

6. GENERACIÓN DE LA FRASE

    Se trata de generar una cadena lineal de palabras a partir de la estructura general de la frase, con sus correspondientes flexiones, concordancias y restantes fenómenos sintácticos y morfológicos.