Determinação de um ponto de corte para a identificação de pares verdadeiros pelo método probabilístico de linkage de base de dados

  • Peres S
  • Latorre M
  • Michels F
  • et al.
N/ACitations
Citations of this article
9Readers
Mendeley users who have this article in their library.

Abstract

O objetivo deste estudo foi propor pontos de corte nos escores calculados no processo de linkage probabilístico, para as diversas topografias de câncer. Neste estudo foi utilizada a base de dados do RCBP-SP, composta por 343.306 casos incidentes de câncer do município de São Paulo, registrados no período de 1997 a 2005, com idades que variaram de menos um a 106 anos, de ambos os sexos. Para o linkage probabilístico, realizado no programa Reclink III, foram utilizadas a base de dados do PRO-AIM e APAC-SIA/SUS. Foram calculados os valores da área sob a curva, sensibilidade e especificidade para determinar o ponto de corte do escore de maior precisão na identificação dos pares verdadeiros. Na análise das topografias, verificou-se que o ponto de corte no escore 18 apresentou boa acurácia, com valores de sensibilidade que variaram de 73,7 a 96,7% e de especificidade de 98,5 a 99,4%. Conclui-se que, acima do escore 18 encontravam-se quase a totalidade dos pares verdadeiros, enquanto que abaixo deste, menos de 1% dos registros vinculados eram verdadeiros.The aim of this study was to propose cut-off points for scores calculated in the probabilistic record linkage process for several cancer topographies. In this study we used the PBCR-SP database composed of 343,306 incident cancer cases from the municipality of São Paulo, registered from 1997 through 2005, aged from less than one to 106 years, of both sexes. PRO-AIM and APAC-SIA/SUS databases were used to probabilistic record linkage using Reclink III software. Area under the curve, sensitivity and specificity values were calculated to determine the cut-off point with the highest accuracy in identifying true matches. In the topography analyses, it was found that the cut-off at score 18 showed good accuracy, with sensitivity ranging from 73.7 to 96.7% and specificity ranging from 98.5 to 99.4%. We concluded that above score 18 nearly all true pairs were found. Whereas, below this cut-off, less than 1% of linked records were true matches.

Cite

CITATION STYLE

APA

Peres, S. V., Latorre, M. do R. D. de O., Michels, F. A. S., Tanaka, L. F., Coeli, C. M., & Almeida, M. F. de. (2014). Determinação de um ponto de corte para a identificação de pares verdadeiros pelo método probabilístico de linkage de base de dados. Cadernos Saúde Coletiva, 22(4), 428–436. https://doi.org/10.1590/1414-462x201400040017

Register to see more suggestions

Mendeley helps you to discover research relevant for your work.

Already have an account?

Save time finding and organizing research with Mendeley

Sign up for free