Matías Rojas presenta artículos científicos en Conferencia COLING 2022
Matías Rojas, Magíster en Ciencias mención Computación del DCC presentó dos investigaciones en la International Conference on Computational Linguistics, COLING 2022.

“Simple Yet Powerful: An Overlooked Architecture for Nested Named Entity Recognition”, se titula el trabajo de investigación Matías Rojas, el cual fue presentado en la International Conference on Computational Linguistics (COLING22), conferencia de lingüística computacional más grandes en el área de PLN, que se realizó entre el 12 y el 17 de octubre, en Gyeongju, República de Corea. “Este trabajo tiene como objetivo estudiar en profundidad modelos propuestos y desafíos existentes en la resolución de la tarea Nested Named Entity Recognition, perteneciente al área de Procesamiento de Lenguaje Natural (PLN), poniendo como caso de estudio la extracción de información clave en diagnósticos de la lista de espera chilena”, explicó Matías Rojas.

Cabe destacar, que este trabajo de investigación formó parte de la tesis de postgrado que realizó Matías Rojas, junto al profesor del Departamento de Ciencias de la Computación (DCC) Felipe Bravo y la investigadora del Centro de Modelamiento Matemático, Jocelyn Dunstan. “A través de esta presentación esperamos extender el estudio a nuevos modelos y datasets, de manera que las conclusiones del trabajo puedan ser extendidas a nuevos dominios e idiomas, permitiendo así una mayor difusión al trabajo realizado en mi tesis”, destacó Matías.

Por otro lado, Matías Rojas presentó “PLN CMM at SocialDisNER: Improving Detection of Disease Mentions in Tweets by Using Document-Level Features”, en el segundo workshop Social Media Mining for Health - SMM4H, de la Conferencia COLING 2022. “Esta investigación tiene como objetivo proponer y estudiar modelos simples, pero efectivos para el reconocimiento automático de menciones de enfermedades en tweets escritos en español”, señaló.

Matías destacó que este trabajo, “es una aplicación de los modelos estudiados durante mi tesis de Magíster a un problema aplicado, el cual fue realizado junto al grupo de investigación donde trabajo, que es liderado por la profesora Jocelyn Dunstan. A través de esta investigación, planeamos estudiar en mayor profundidad la dificultad de analizar textos no estructurados provenientes de tweets (con los emojis, urls, hashtags) al momento de reconocer entidades de un dominio específico como el clínico y por lo cual, la idea es proponer nuevos modelos y técnicas”, enfatizó.

Para Matías, presentar estos trabajos es de real importancia ya que buscan avanzar en el estudio de métodos simples, pero efectivos para reconocer entidades automáticamente en documentos. “Esto ya sea de propósito general (reconocer organizaciones, ubicaciones, nombres de personas), o dominio clínico, como el caso de reconocer entidades con relevancia clínica en diagnósticos de la lista de espera o enfermedades en tweets”.

Actualmente Matías se encuentra trabajando como investigador full-time en el grupo de procesamiento de lenguaje natural del Centro de Modelamiento Matemático. “Hoy estamos estudiando diversas tareas de PLN relacionadas al dominio clínico, y aplicando estos modelos en colaboraciones junto a la Asociación Chilena de Seguridad (ACHS) y el Ministerio de Salud”, concluyó.

--

Comunicaciones DCC