NEUMOLOGÍA PEDIÁTRICA

Neumol Pediatr 2021; 16 (2): 57 - 61 Revista Neumología Pediátrica | Contenido disponible en www.neumologia-pediatrica.cl 58 ¿Cómo hacer una base de datos ocupando una planilla de cálculo Excel? Definir las categorías o límites de las variables En la misma hoja en la que se listen los códigos de la variable se sugiere definir las categorías o los límites de cada una. Por ejem- plo, en el caso de una variable cualitativa como “educación”, esta puede ser categorizada como “primaria”, “secundaria”, “terciaria”. Si es una variable cuantitativa, debe definirse la unidad en la que será expresada (ej: “Kg” en el caso de peso) y los limites considerados nor- males (ej.: 3000 a 4500 g en el caso del peso al nacer). Digitación cuidadosa Cada vez que se ingresa un dato, en pa- pel o en un formato electrónico, existe riesgo de que el dato sea mal ingresado. Aunque es poco probable que logremos evitar cometer un error al momento de ingresar el dato a nuestra base, se pueden diseñar algunas estrategias para reducir la probabilidad de equivocarse. Una opción es digitar el valor de la variable dos veces. Por ejemplo, si la edad del sujeto es de 50 años y se digita 500, es menos probable que este mismo error se cometa de la misma manera la segunda vez que se digita (la dife- rencia entre ambos valores se comporta como un llamado de atención para verificar el valor correcto). Otra opción que existe en algunos softwares (ejemplo: Excel) es colocar límites al valor de la variable. Por ejemplo, podemos definir que el límite de talla de los sujetos de nuestro estudio varía entre 100 y 160 cm, por lo que si intentamos ingresar el valor 170 el pro- grama no lo permitirá. Limpieza de la base de datos Antes de realizar el análisis de nuestros datos es importante asegurarse de su calidad. Aunque se tomen medidas para evitar al máxi- mo el ingreso de datos erróneos, las tasas de error en las bases de datos se encuentran ge- neralmente entre el 5% o más. Es necesario entonces realizar un conjunto de operaciones que permitan identificar omisiones, datos in- completos, incorrectos o incoherentes para co- rregirlos o eliminarlos (ejemplo: una niña que mide al inicio del estudio menos de lo que mide al final). Se pueden ordenar los datos de una variable de menor a mayor y revisar si existen datos que estén muy lejos de los considerados normales u obtener promedios y desviaciones estándar y revisar los datos que estén más allá de ± 3 desviaciones. En resumen, aunque esta revisión requiere mucho trabajo, es fundamen- tal, ya que, si nuestra base datos tiene gran cantidad de datos “basura”, solo podremos ob- tener basura como resultado (5). Almacenamiento y nombre de la base de da- tos Sugiero guardar siempre la base “origi- nal” y realizar la limpieza en una copia, ya que si se comete un error al limpiarla siempre ten- dremos la original. Es muy importante mante- ner el orden con el que se almacenan las bases de datos. Suele ocurrir que cuando tenemos más de un archivo estos se guardan en distin- tas carpetas o con nombres diferentes, espe- cialmente si los ocupan diferentes personas. Existen diferentes opciones para mantener actualizada y ordenada la base de datos. Por ejemplo, guardarla en una carpeta compartida y que las diferentes personas solo ocupen esa base. Lo ideal es que solo una persona sea res- ponsable de realizar los cambios en la BD. Anonimato Es importante considerar que cada vez que se comparte una base de datos estas de- ben estar anonimizadas, por lo que no pueden contener el nombre, documento de identidad ni dirección de las personas a las que pertene- cen los datos. Se sugiere que solo el investiga- dor principal del proyecto guarde la base con los datos completos de los sujetos para que se puedan contactar con ellos en caso de ser necesario. Para aprender a diseñar esta base de datos he diseñado un ejercicio que se detalla a continuación. Se planifica un estudio cuyo objetivo es conocer el estado nutricional de un grupo de niños que asisten a las escuelas de la ciudad donde vivimos. Seguir las siguientes instrucciones paso a paso. Llevamos la variable definida a la otra hoja de cálculo del mismo libro del archivo Excel. Re- cordar que la primera variable es “ID” (el identificador común) y luego colocamos el resto de las variables en las siguientes columnas. Lo primero que hacemos el hacer el listado de las variables que necesitamos registrar, sus códigos, clasificación y límites (con los datos registrados evaluaremos el estado nutricional en un software específico). Dependiendo de quien tenga acceso a esta base de datos se po- drían agregar los datos para identificar a los niños y niñas del estudio. 1 2

RkJQdWJsaXNoZXIy MTYwMjk1