MISIÓN 1 · Lección 1

Introducción al Procesamiento de Lenguaje Natural (NLP)

El Procesamiento de Lenguaje Natural (NLP) es una rama de la inteligencia artificial que permite a las máquinas comprender, interpretar y generar lenguaje humano. Su importancia radica en aplicaciones como asistentes virtuales, motores de búsqueda, chatbots, clasificación de documentos y análisis de sentimientos.

Componentes básicos del NLP

Flujo de trabajo en NLP

  1. Recolección de datos (corpus).
  2. Limpieza y preprocesamiento.
  3. Extracción de características.
  4. Entrenamiento de modelos.
  5. Evaluación y despliegue.

Herramientas clave en Python

Ejemplo práctico con NLTK

import nltk
nltk.download('punkt')
from nltk.tokenize import word_tokenize

texto = "El Procesamiento de Lenguaje Natural con Python es fascinante."
tokens = word_tokenize(texto)
print(tokens)
# ['El', 'Procesamiento', 'de', 'Lenguaje', 'Natural', 'con', 'Python', 'es', 'fascinante', '.']

Ejemplo práctico con spaCy

import spacy
nlp = spacy.load("es_core_news_sm")

doc = nlp("El NLP moderno impulsa muchas aplicaciones inteligentes.")
for token in doc:
    print(token.text, token.pos_, token.dep_)

Este ejemplo muestra cómo obtener la categoría gramatical y las dependencias de cada palabra.

Buenas prácticas de preprocesamiento

import re
texto = "Visita https://example.com para más información! #NLP @usuario"
limpio = re.sub(r"https?://\\S+|[@#]\\w+", " ", texto.lower())
print(limpio)
# "visita   para más información!  "

Aplicaciones reales del NLP

Reflexión final

El NLP es la base de muchas aplicaciones modernas. Conocer sus fundamentos y herramientas en Python es el primer paso para proyectos más avanzados en análisis de texto y modelado de lenguaje.