XPTA: um parser AMR para o Português baseado em uma abordagem entre línguas

Eloize Seno; Helena Caseli; Marcio Inácio; Rafael Anchiêta; Renata Ramisch

doi:10.21814/lm.14.1.359

XPTA: um parser AMR para o Português baseado em uma abordagem entre línguas

Eloize Seno Federal Institute of São Paulo
Helena Caseli
Marcio Inácio
Rafael Anchiêta
Renata Ramisch

DOI: https://doi.org/10.21814/lm.14.1.359

Palavras-chave: representação abstrata de significado, analisador semântico, abordagem entre línguas, Português

Resumo

O crescente interesse pelo processamento semântico automático, especialmente por parte dos pesquisadores de Compreensão e de Geração de Língua Natural, tem levado a muitas pesquisas relacionadas ao desenvolvimento de parsers semânticos. E, nesse contexto, a AMR (Abstract Meaning Representation) é um dos formalismos de representação semântica que tem recebido mais atenção recentemente, devido à sua maneira relativamente simples de capturar o significado de uma sentença. A construção de parsers AMR é em grande parte baseada em córpus de referência anotados por humanos. Contudo, esse recurso é ainda bastante escasso para muitas línguas como o português. Por esse motivo, várias pesquisas têm explorado o uso de abordagens entre línguas (cross-lingual), que partem de córpus e parser existentes em uma língua fonte, para o desenvolvimento de recursos semânticos para outras línguas alvo. Dado esse contexto, este artigo descreve o XPTA, um parser AMR para o português (PT) que se baseia na abordagem entre línguas (cross-lingual, X). O XPTA parte de parser AMR existente para o inglês e de vários recursos linguísticos-computacionais bilíngues inglês--português e mapeia o conhecimento semântico disponível no inglês para a representação do significado equivalente em português. Uma avaliação automática do XPTA mostrou que a abordagem adotada é promissora e os valores obtidos para Smatch (66%, no melhor caso) apontaram que o modelo tem potencial para competir com os resultados apresentados na literatura para outros idiomas. Além da análise automática, uma análise qualitativa dos grafos gerados possibilitou identificar e categorizar os principais erros do modelo e suas possíveis causas.

Publicado

2022-07-02

Como Citar

Seno, E., Caseli, H., Inácio, M., Anchiêta, R., & Ramisch, R. (2022). XPTA: um parser AMR para o Português baseado em uma abordagem entre línguas. Linguamática, 14(1), 49-68. https://doi.org/10.21814/lm.14.1.359

Descarregar Citação

Edição

v. 14 n. 1

Secção

Artigos de Investigação

This work is licensed under a Creative Commons Attribution 4.0 International License.

Ao publicar na presente revista, os autores concordam com os seguintes termos:

os direitos sobre a obra pertencem aos autores, que apenas concedem à Linguamática o direito de primeira publicação sob a licença Creative Commons, que permite que outros possam redistribuir a obra desde que acompanhada de referência ao autor e à Linguamática.
os autores podem estabelecer outros contratos para a distribuição não exclusiva da obra, desde que mencionem que a sua primeira publicação foi efectuada na Linguamática.
para aumentar as referências ao seu trabalho, os autores são encorajados a disponibilizar a obra, como "pré-publicação", antes de ou durante o processo de apreciação pela Linguamática, por exemplo em repositórios institucionais ou nas suas páginas pessoais na rede.