El Procesamiento de Lenguaje Natural (NLP) es una rama de la inteligencia artificial que permite a las máquinas comprender, interpretar y generar lenguaje humano. Su importancia radica en aplicaciones como asistentes virtuales, motores de búsqueda, chatbots, clasificación de documentos y análisis de sentimientos.
import nltk
nltk.download('punkt')
from nltk.tokenize import word_tokenize
texto = "El Procesamiento de Lenguaje Natural con Python es fascinante."
tokens = word_tokenize(texto)
print(tokens)
# ['El', 'Procesamiento', 'de', 'Lenguaje', 'Natural', 'con', 'Python', 'es', 'fascinante', '.']
import spacy
nlp = spacy.load("es_core_news_sm")
doc = nlp("El NLP moderno impulsa muchas aplicaciones inteligentes.")
for token in doc:
print(token.text, token.pos_, token.dep_)
Este ejemplo muestra cómo obtener la categoría gramatical y las dependencias de cada palabra.
import re
texto = "Visita https://example.com para más información! #NLP @usuario"
limpio = re.sub(r"https?://\\S+|[@#]\\w+", " ", texto.lower())
print(limpio)
# "visita para más información! "
El NLP es la base de muchas aplicaciones modernas. Conocer sus fundamentos y herramientas en Python es el primer paso para proyectos más avanzados en análisis de texto y modelado de lenguaje.