Multi-FAct: Assessing Factuality of Multilingual LLMs using FActScore

Shafayat, Sheikh; Kim, Eunsu; Oh, Juhyun; Oh, Alice

Computer Science > Computation and Language

arXiv:2402.18045 (cs)

[Submitted on 28 Feb 2024 (v1), last revised 3 Oct 2024 (this version, v3)]

Title:Multi-FAct: Assessing Factuality of Multilingual LLMs using FActScore

Authors:Sheikh Shafayat, Eunsu Kim, Juhyun Oh, Alice Oh

View PDF HTML (experimental)

Abstract:Evaluating the factuality of long-form large language model (LLM)-generated text is an important challenge. Recently there has been a surge of interest in factuality evaluation for English, but little is known about the factuality evaluation of multilingual LLMs, specially when it comes to long-form generation. %This paper systematically evaluates multilingual LLMs' factual accuracy across languages and geographic regions. We introduce a simple pipeline for multilingual factuality evaluation, by applying FActScore (Min et al., 2023) for diverse languages. In addition to evaluating multilingual factual generation, we evaluate the factual accuracy of long-form text generation in topics that reflect regional diversity. We also examine the feasibility of running the FActScore pipeline using non-English Wikipedia and provide comprehensive guidelines on multilingual factual evaluation for regionally diverse topics.

Subjects:	Computation and Language (cs.CL)
Cite as:	arXiv:2402.18045 [cs.CL]
	(or arXiv:2402.18045v3 [cs.CL] for this version)
	https://doi.org/10.48550/arXiv.2402.18045

Submission history

From: Eunsu Kim [view email]
[v1] Wed, 28 Feb 2024 04:43:46 UTC (11,158 KB)
[v2] Fri, 1 Mar 2024 12:35:55 UTC (11,158 KB)
[v3] Thu, 3 Oct 2024 14:44:44 UTC (2,946 KB)

Computer Science > Computation and Language

Title:Multi-FAct: Assessing Factuality of Multilingual LLMs using FActScore

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computation and Language

Title:Multi-FAct: Assessing Factuality of Multilingual LLMs using FActScore

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators