C6. Taller Practico
A partir del dataset que elijas (puede ser el corpus que estás usando para tu trabajo final), aplicá las siguientes técnicas vistas en clase:
Cargá tu dataset en R y realizá una exploración inicial de los textos.
Aplicá POS Tagging
Usá
{udpipe}
para etiquetar gramaticalmente las palabras.Analizá qué categorías gramaticales predominan.
Aplicá Named Entity Recognition (NER)
Usá
{spacyr}
con un modelo en español.Extraé entidades de tipo PERSON, ORG y LOC.
¿Qué entidades aparecen con mayor frecuencia? ¿Qué revela esto del contenido del corpus?
Explorá casos de Word Sense Disambiguation (WSD)
- Identificá al menos dos palabras polisémicas en tu corpus.
- Mostrá en qué contextos aparecen y explicá cómo el contexto ayuda a desambiguarlas.