Um Estudo Comparativo de Mecanismos de Privacidade Diferencial sobre um Dataset de Ocorrências do ZIKV no Brasil
Resumo
Nos últimos anos, o Governo Brasileiro tem organizado uma série de iniciativas para informatizar o SUS, com o objetivo de melhorar sua eficiência. Uma dessas iniciativas é o GAL (Gerenciador de Ambiente Laboratorial). O GAL tem como objetivo proporcionar a gerência das rotinas laboratoriais e o acompanhamento das etapas para realização dos exames. Adicionalmente, o GAL permite a extração de dados, que podem ser usados por gestores nas diversas esferas. Entretanto, essa exportação de dados pode não ser confiável, e levar a sérios riscos de violação de privacidade, uma vez que exibe dados pessoais de indivíduos. Simplesmente mascarar os elementos de identificação (nome, CPF, etc.) ou disponibilizar apenas resultados agregados pode não proporcionar proteção suficiente. Nesse cenário, técnicas mais elaboradas de privacidade de dados, como a Privacidade Diferencial (PD), se fazem necessárias. Este artigo apresenta um estudo que compara a aplicação de diferentes mecanismos de PD sobre os dados extraídos do GAL. Em especial, utilizamos como estudo de caso os dados de exames de casos suspeitos do Vírus da Zika (ZIKV) no Brasil.
Referências
Dwork, C., McSherry, F., Nissim, K., and Smith, A. (2006). Calibrating noise to sensitivity in private data analysis. In Halevi, S. and Rabin, T., editors, Theory of Cryptography, pages 265–284, Berlin, Heidelberg. Springer Berlin Heidelberg. DOI: https://doi.org/10.1007/11681878_14
Erlingsson, Ú., Korolova, A., and Pihur, V. (2014). RAPPOR: randomized aggregatable privacy-preserving ordinal response. CoRR, abs/1407.6981. DOI: https://doi.org/10.1145/2660267.2660348
Kifer, D. and Machanavajjhala, A. (2011). No free lunch in data privacy. In Proc. of the 2011 SIGMOD, SIGMOD ’11, pages 193–204, New York, NY, USA. ACM. DOI: https://doi.org/10.1145/1989323.1989345
Li, S., Bamidis, P. D., Konstantinidis, S. T., Traver, V., Car, J., and Zary, N. (2019). Setting priorities for EU healthcare workforce IT skills competence improvement. Health Inf. Journal, 25(1). DOI: https://doi.org/10.1177/1460458217704257
Nascimento, F., Vale, K. O., and Gorgônio, F. L. (2018). Um estudo comparative entre algoritmos de proteção da privacidade aplicado à bases de dados na área de saúde. In XXXIII SBBD, Rio de Janeiro, RJ, Brazil, August 25-26, 2018., pages 301–306.
Shishvan, O. R., Zois, D., and Soyata, T. (2018). Machine intelligence in healthcare and medical cyber physical systems: A survey. IEEE Access, 6:46419–46494. DOI: https://doi.org/10.1109/ACCESS.2018.2866049
Silva, A. B., Guedes, A., Síndico, S., Vieira, E., and de Andrade Filha, I. (2019). Registro eletrônico de saúde em hospital de alta complexidade: um relato sobre o processo de implementação na perspectiva da telessaúde. Ciência & Saúde Coletiva, 24:1133–1142. DOI: https://doi.org/10.1590/1413-81232018243.05982017
Warner, S. L. (1965). Randomized response: A survey technique for eliminating evasive answer bias. Journal of the American Statistical Association, 60(309):63–69. DOI: https://doi.org/10.2307/2283137