Enfoques basados en lexicón y LSA para la detección de polaridad en reseñas
Mireya Tovar Vidal, Karen Leticia Vazquez-Flores, y Gerardo Flores Petlacalco
En este trabajo, se lleva a cabo un estudio de minería de opiniones o análisis de sentimientos, que es un área del Procesamiento de Lenguaje Natural y una disciplina entre la recuperación de información y la lingüística computacional. Su objetivo es detectar la polaridad o los sentimientos expresados en un texto u opinión. En este trabajo, se realiza la detección de polaridad en un conjunto de opiniones de usuarios hacia el dominio de restaurantes en idioma español e idioma inglés, así como opiniones de laptops en idioma inglés. Dos algoritmos son presentados como propuestas de solución, en el primero se utiliza un algoritmo basado en un lexicón y en el segundo se utiliza el Análisis Semántico Latente (LSA - Latent Semantic Analysis). Ambos enfoques resultan competitivos al lograr más de un 70% de Accuracy de la polaridad en el conjunto de datos anotados (gold).
Figura 1. Arquitectura del algoritmo basado en un lexicón.