MISIÓN 1 · Lección 1

Introducción al Procesamiento de Lenguaje Natural (NLP)

El Procesamiento de Lenguaje Natural (NLP) es una rama de la inteligencia artificial que permite a las máquinas comprender, interpretar y generar lenguaje humano. Su importancia radica en aplicaciones como asistentes virtuales, motores de búsqueda, chatbots, clasificación de documentos y análisis de sentimientos.

Componentes básicos del NLP

Tokenización: dividir el texto en palabras o subpalabras.
Lematización/Stemming: reducir palabras a su raíz.
POS Tagging: identificar la función gramatical de cada palabra.
NER (Named Entity Recognition): detección de entidades como nombres, lugares y organizaciones.

Flujo de trabajo en NLP

Recolección de datos (corpus).
Limpieza y preprocesamiento.
Extracción de características.
Entrenamiento de modelos.
Evaluación y despliegue.

Herramientas clave en Python

NLTK: librería clásica para tokenización, stopwords y stemming.
spaCy: pipeline robusto para POS tagging, dependencias y NER.
TextBlob: análisis sencillo de sentimientos y traducción.

Ejemplo práctico con NLTK

import nltk
nltk.download('punkt')
from nltk.tokenize import word_tokenize

texto = "El Procesamiento de Lenguaje Natural con Python es fascinante."
tokens = word_tokenize(texto)
print(tokens)
# ['El', 'Procesamiento', 'de', 'Lenguaje', 'Natural', 'con', 'Python', 'es', 'fascinante', '.']

Ejemplo práctico con spaCy

import spacy
nlp = spacy.load("es_core_news_sm")

doc = nlp("El NLP moderno impulsa muchas aplicaciones inteligentes.")
for token in doc:
    print(token.text, token.pos_, token.dep_)

Este ejemplo muestra cómo obtener la categoría gramatical y las dependencias de cada palabra.

Buenas prácticas de preprocesamiento

Convertir a minúsculas y normalizar acentos.
Eliminar URLs, menciones y caracteres especiales.
Elegir tokenizadores adecuados según el idioma y dominio.

import re
texto = "Visita https://example.com para más información! #NLP @usuario"
limpio = re.sub(r"https?://\\S+|[@#]\\w+", " ", texto.lower())
print(limpio)
# "visita   para más información!  "

Aplicaciones reales del NLP

Asistentes virtuales (Siri, Alexa, ChatGPT).
Detección de spam en correos.
Análisis de opiniones en redes sociales.
Traducción automática y subtitulados.

Reflexión final

El NLP es la base de muchas aplicaciones modernas. Conocer sus fundamentos y herramientas en Python es el primer paso para proyectos más avanzados en análisis de texto y modelado de lenguaje.