Home / Lenguajes / CoreNLP: biblioteca de Python para el procesamiento de lenguajes naturales
CoreNLP: biblioteca de Python para el procesamiento de lenguajes naturales

CoreNLP: biblioteca de Python para el procesamiento de lenguajes naturales

Tiempo de lectura: 2 minutos

El lenguaje Python ofrece una interfaz útil para todo tipo de máquinas que estudian la NLP. En este artículo, descubriremos la bibliotecas de NLP CoreNLP: sus circunstancias de uso, sus fortalezas, sus debilidades y su grado básico de reconocimiento.

La biblioteca CoreNLP, un producto de Stanford College, se construyó para ser una respuesta de procesamiento de lenguaje puro lista para producción, capaz de entregar predicciones y análisis de NLPa escala. CoreNLP está escrito en Java, sin embargo, se pueden encontrar varios paquetes de Python y API, junto con una biblioteca local de Python NLP conocida como Stanza.

CoreNLP presenta una amplia gama de herramientas de lenguaje: etiquetado gramatical, reconocimiento de entidades con nombre, análisis, evaluación de sentimientos y muchas más. Fue diseñado para ser independiente del lenguaje humano y, en la actualidad, admite árabe, chino, francés, alemán y español junto con inglés (con asistencia en ruso, sueco y danés disponible de terceros). CoreNLP también cuenta con un servidor de API web, una solución práctica para ofrecer predicciones sin una cantidad excesiva de trabajo adicional.

El mejor lugar para comenzar con los contenedores Python de CoreNLP es Stanza, la implementación de referencia creada por Stanford NLP Group. Además de estar bien documentado, Stanza se puede mantener de forma recurrente; muchas de las otras bibliotecas de Python para CoreNLP no estuvieron actualizadas por un tiempo.

CoreNLP también ayuda al uso de NLTK, una seria biblioteca Python NLP mencionada a continuación. A partir del modelo 3.2.three, NLTK contiene interfaces para esta biblioteca en su analizador. Simplemente asegúrese de utilizar la API correcta.

Desventaja

La desventaja aparente de esta biblioteca es que simplemente querrá familiarizarse con Java para ponerlo en funcionamiento, sin embargo, eso no es nada que no pueda obtener un estudio cuidadoso de la documentación. Otro obstáculo posiblemente sea la licencia de CoreNLP. El conjunto de herramientas completo tiene licencia bajo la GPLv3, lo que significa que cualquier uso en un programa de software propietario que simplemente distribuya a otros requeriría una licencia comercial.

About Gonzo Fernández

Avatar

Ver también

Cassie: robot que se enseñó a sí mismo a caminar

Cassie: robot que se enseñó a sí mismo a caminar

Tiempo de lectura: 2 minutos Recientemente, en un laboratorio de Berkeley, un robot llamado Cassie aprendió a caminar solo, un …