Anales Oftalmológicos

19 Evaluación del desempeño de Chat GPT-4o para el diagnóstico y clasificación de Retinopatía Diabética RESULTADOS Se suministraron datos de 108 pacientes (214 ojos). La edad promedio fue de 62 ± 11,7 años (rango 30 - 87 años); el 52,3% fueron mujeres. Para el diagnóstico de RD, Chat GPT-4o obtuvo una sensibilidad de 85,56%, especificidad: 85,19%, VPP: 97,56% y VPN: 46.00% La Tabla 1 muestra la capacidad diagnóstica de Chat GPT-4o para la clasificación de RD basada en su severidad. La sensibilidad fue alta para la detección de casos de RDNP leve, pero disminuyó considerablemente en los casos de RDNP moderada, RDNP severa y RDP, alcanzando sensibilidades de 44,7%, 11,3% y 16,2% respectivamente. El coeficiente Kappa de Cohen para la presencia o ausencia de retinopatía diabética fue de 0.52, lo que indica un grado de acuerdo moderado. El área bajo la curva (AUC) para el diagnóstico de ChatGPT en comparación con el retinólogo fue de 0.85, lo que sugiere que el modelo de IA tiene un buen rendimiento discriminativo para identificar la retinopatía diabética. (Figura 1) Sensibilidad (%) Especificidad (%) VPP (%) VPN (%) RD 85,56 85,19 97,56 46,0 RD-PFC 78,5 100 100 96,8 RDNP LEVE 100 91,9 10,5 100 RDNP MOD 44,7 56,5 36,1 65 RDNP SEVERA 11,3 89,4 21,7 79,5 RDP 16,22 99,4 85,7 85,0 RD: Retinopatía diabética; RD-PFC: Retinopatía diabética con panfotocoagulación; RDNP: Retinopatía diabética no proliferativa; RDP: Retinopatía diabética proliferativa Tabla 1: Capacidad de Chat GPT-4o en diagnóstico y clasificación de severidad de Retinopatía Diabética Figura 1: Curva ROC para el diagnóstico de RD

RkJQdWJsaXNoZXIy MTYwMjk1