Bases de datos biológicas: la memoria digital de la vida

Las bases de datos biológicas son grandes recopilaciones de información sobre los seres vivos, organizadas de forma sistemática para que puedan consultarse, actualizarse y compartirse con facilidad.

Estas bases de datos almacenan información muy diversa, como secuencias de ADN, proteínas, genomas completos o datos asociados a organismos específicos, y se han convertido en un pilar fundamental de la biología moderna (Toomula et al., 2012).

¿Cuál es la situación actual de las bases de datos?

En el campo de la biología molecular, el desarrollo de las bases de datos comenzó de forma más visible en la década de 1980, cuando se publicaron los primeros catálogos de datos biológicos y se abrieron al público bases que antes eran privadas, como GenBank. Desde entonces, la recopilación de información genética no ha dejado de crecer, incorporando datos de una enorme diversidad de organismos vivos (Villalba & Matte, 2021).

Este crecimiento se ha acelerado notablemente con la llegada de las tecnologías de secuenciación de alto rendimiento, que generan cantidades masivas de datos en poco tiempo. Como resultado, actualmente vivimos en la era de los macrodatos biológicos, donde las bases de datos cumplen un rol clave para organizar, almacenar y hacer accesible esta información a la comunidad científica a nivel global (Caswell et al., 2019). De acuerdo con registros recientes, hasta el año 2023 existían cerca de 7000 bases de datos biológicas en todo el mundo, que abarcan múltiples categorías y cientos de especies diferentes (Ma et al., 2023).

¿Qué tipos de bases de datos hay?

Las bases de datos biológicas pueden clasificarse según su función. Las bases de datos primarias almacenan datos experimentales en bruto, es decir, información que se deposita directamente tras los experimentos, como las secuencias de ADN. Ejemplos conocidos son GenBank, EMBL y DDBJ. Por otro lado, las bases de datos secundarias contienen información procesada o interpretada a partir de los datos primarios, como RefSeq o TrEMBL, que ofrecen datos revisados y organizados. Finalmente, las bases de datos especializadas están diseñadas para comunidades científicas o grupos biológicos específicos, como el sistema Barcode of Life (BOLD) o bases enfocadas en enfermedades particulares, como el cáncer (Fawzy et al., 2022; Portillo et al., 2022).

Bases de datos en constante mejora

El desarrollo y perfeccionamiento de estas bases de datos ha sido posible gracias a la bioinformática. Sin embargo, como ocurre en toda actividad científica, su generación y mantenimiento no están libres de errores. Entre los más comunes se encuentran los errores originales, relacionados con el proceso de secuenciación; los errores por contaminación, que pueden introducir organismos no deseados durante el trabajo experimental; los errores de metadatos, derivados del uso de programas informáticos o de la interpretación humana; y los errores de entrada, que ocurren durante la transferencia o actualización de la información en las bases de datos (Caswell et al., 2019). Estos errores son ampliamente reconocidos y se depuran a lo largo del procesamiento de los datos, mediante la estandarización de protocolos de secuenciación y pipelines bioinformáticos.

Las bases de datos biológicas son herramientas esenciales para la investigación científica. Su constante revisión, actualización y mejora permiten que el conocimiento biológico sea más accesible, confiable y útil, facilitando avances en áreas como la biodiversidad, la medicina, la conservación y la biotecnología.

Referencias Bibliográficas

Caswell, J., Gans, J., Generous, N., Hudson, C., Merkley, E., Johnson, C., Oehmen, C., Omberg, K., Purvine, E., Taylor, K., Ting, C., Wolinsky, M., & Xie, G. (2019). Defending Our Public Biological Databases as a Global Critical Infrastructure. Forntiers in bioengineering and biotechnology, 7, 58. https://doi.org/10.3389/fbioe.2019.00058

Fawzy, M., EL-Attar, N., El-mashad, S., & Awad, W. (2022). Perspectives review and Challenges in Biological Databases Integration. Alfarama Journal of Basic & Applied Sciences, 3(2), 346-362. https://dx.doi.org/10.21608/ajbas.2022.105632.1078

Ma, L., Zou, D., Liu, L., Shireen, H., Abbasi, A., Bateman, A., Xiao, J., Zhao, W., Bao, Y., & Zhang, Z. (2023). Database Commons: A Catalog of Worldwide Biological Databases. Genomics, Proteomics & Bioinformatics, 21(5), 1054-1058. https://doi.org/10.1016/j.gpb.2022.12.004

Portillo, T., Pérez, B., Pérez, V., & Hernández, M. (2022). Una introducción a la bioinformática: Avances en la biología y ciencias de la salud. Memoria del XLIX Taller de Actualización Bioquímica, Facultad de medicina, UNAM.

Toomula, N., Kumar, A., Kumar, D., & Bheemidi, V. (2012). Biological databases-integration of life science data. Journal of Computer Science & Systems Biology, 4(5).

Villalba, G., & Matte, U. (2021). Fantastic databases and where to find them: Web applications for researchers in a rush. Genetics and molecular biology, 44(2), e20200203. https://doi.org/10.1590%2F1678-4685-GMB-2020-0203

La OTAN de los mercaderes

La muerte de niños debe parar ya

Los que invierten en el caos climático

Entrevista a Annette Falcón Vargas

Entrevista a Edwin Ortíz, presidente de la Iniciativa Nacional Puerto Rico y España

Entrevista a José Alfredo Lara Fontánez

Que Decida el Pueblo: Una iniciativa legislativa de una coalición para el futuro político de Puerto Rico (II)

Que Decida el Pueblo: Una iniciativa legislativa de una coalición para el futuro político de Puerto Rico (I)

Puerto Rico y las citas históricas que nadie ha podido documentar

La experiencia de ser maestr@ (XI)

Islero no mató a Manolete

La experiencia de ser maestr@ (X)

FITUR 2026: Más de 160 países la convierten en una plataforma global del turismo

Turismo del Caribe en alza en 2026

Turismo en Puerto Rico. Previsiones 2026

El Siglo Solar

La Cuarta Ola: la Era del Sol y el nacimiento del Solarista

Manifiesto Solarista: una filosofía para la era de la luz

Que Decida el Pueblo: Una iniciativa legislativa de una coalición para el futuro político de Puerto Rico (II)

La experiencia de ser maestr@ (XI)

California: de Montalvo a mi bahía

La OTAN de los mercaderes

Que Decida el Pueblo: Una iniciativa legislativa de una coalición para el futuro político de Puerto Rico (I)

Islero no mató a Manolete

Puerto Rico y las citas históricas que nadie ha podido documentar

La experiencia de ser maestr@ (X)

Bases de datos biológicas: la memoria digital de la vida

Las bases de datos biológicas son grandes recopilaciones de información sobre los seres vivos, organizadas de forma sistemática para que puedan consultarse, actualizarse y compartirse con facilidad.

About the Author Jeysa Villarreal

No Comment

Leave a reply Cancelar la respuesta

Pin It on Pinterest

Bases de datos biológicas: la memoria digital de la vida

Las bases de datos biológicas son grandes recopilaciones de información sobre los seres vivos, organizadas de forma sistemática para que puedan consultarse, actualizarse y compartirse con facilidad.

Next post Colegios y Profesores extraordinarios

Previous post Orgullosamente hispana

About the Author Jeysa Villarreal

Related Posts

No Comment

Leave a reply Cancelar la respuesta

Pin It on Pinterest