CASO REAL - Así se comparten datos clínicos entre hospitales con AWS

Facilitando la Investigación Médica: Compartiendo Datos entre Hospitales Europeos con AWS

En el mundo de la investigación médica, la colaboración y el intercambio de datos son esenciales para avanzar en el conocimiento y encontrar soluciones a desafíos de salud cada vez más complejos. En Europa, varios hospitales y centros de investigación están uniendo fuerzas en proyectos conjuntos, aprovechando la tecnología de la nube de Amazon Web Services (AWS) para compartir datos de manera segura y eficiente. Un ejemplo real ilustra cómo esta colaboración se materializa en la práctica.

Ejemplo de projecto C-salud Quirón.

Arquitectura de la Nube AWS

Este diagrama de arquitectura presenta cómo los hospitales europeos comparten datos utilizando AWS para avanzar en la investigación médica. A continuación, desglosamos los 8 pasos de este proceso:

Arquitectura Cloud de colaboración hospitalaria.

  1. Recolección de Datos en el Hospital: Un técnico de laboratorio lleva a cabo un experimento y los resultados se guardan en una carpeta en un servidor de archivos local. Para asegurar la integridad y disponibilidad de estos datos, se utiliza AWS DataSync para sincronizar los datos desde el almacenamiento local hasta un bucket en Amazon Simple Storage Service (Amazon S3).
  2. Transferencia Segura a la Nube: Los datos se transfieren a la nube de AWS utilizando una conexión segura, ya sea a través de internet o mediante una conexión directa de baja latencia, como AWS Direct Connect. Esta medida garantiza la seguridad y la velocidad en el intercambio de datos sensibles.
  3. Acceso a los Datos para Investigadores: Los investigadores pueden acceder a los datos almacenados en Amazon S3 utilizando herramientas bioinformáticas existentes a través del Protocolo de Sistema de Archivos en Red (NFS) o el Protocolo de Mensajes de Servidor (SMB) mediante Amazon S3 File Gateway. Esto facilita el análisis y la interpretación de los datos sin necesidad de migrar a nuevas plataformas.
  4. Colaboración con Entidades Asociadas: Entidades asociadas, como organizaciones de investigación contratadas (CRO), pueden cargar resultados de estudios directamente en Amazon S3 utilizando AWS Transfer para FTP, SFTP o FTPS. Esto simplifica el proceso de colaboración y asegura que todos los datos relevantes estén centralizados en un solo lugar.
  5. Optimización de Almacenamiento: Para optimizar el almacenamiento, se implementan políticas de ciclo de vida en los buckets de Amazon S3, transfiriendo datos a Amazon S3 Glacier según los patrones de acceso. Esto garantiza un almacenamiento eficiente y rentable a largo plazo.
  6. Acceso a Computación de Alto Rendimiento (HPC): Mediante Amazon FSx for Lustre, los datos se hacen accesibles para la computación de alto rendimiento en la nube (HPC) para cargas de trabajo genómicas, de imágenes y otras tareas intensivas. Esto proporciona un sistema de archivos compartido de baja latencia, crucial para el análisis rápido y preciso de datos médicos complejos.
  7. Orquestación de Cargas de Trabajo: Las cargas de trabajo de HPC se orquestan en la nube utilizando AWS Step Functions y AWS Batch, lo que permite una computación flexible en instancias de Amazon Elastic Compute Cloud (Amazon EC2) o contenedores de Amazon Elastic Container Service (Amazon ECS). Esta flexibilidad garantiza que los recursos computacionales se asignen de manera eficiente según las necesidades del proyecto.
  8. Implementación de Aprendizaje Automático: Finalmente, el aprendizaje automático (ML) se lleva a cabo utilizando herramientas comunes de inteligencia artificial y aprendizaje automático, como Amazon SageMaker. Esta plataforma permite el entrenamiento, despliegue y operación de modelos de ML de manera eficiente. Además, Amazon Athena se utiliza para consultas SQL flexibles, integrando fácilmente los datos con herramientas de análisis existentes.

Glosario de Servicios de AWS:

  • AWS DataSync: Servicio para transferir datos de forma rápida y segura entre almacenamiento local y Amazon S3.
  • AWS Direct Connect: Conexión dedicada desde las instalaciones del cliente a AWS, evitando la internet pública para mayor seguridad y rendimiento.
  • Amazon S3 File Gateway: Permite el acceso a datos almacenados en Amazon S3 a través de protocolos de archivos estándar como NFS y SMB.
  • AWS Transfer for FTP: Servicio totalmente administrado que permite transferencias seguras de archivos a y desde Amazon S3 a través de FTP.
  • Amazon S3 Glacier: Servicio de almacenamiento de archivos a largo plazo y económico para datos archivados.
  • Amazon FSx for Lustre: Ofrece un sistema de archivos de alto rendimiento optimizado para cargas de trabajo de HPC.
  • AWS Step Functions: Coordina y administra las cargas de trabajo de múltiples servicios de AWS como una serie de pasos.
  • AWS Batch: Permite la ejecución eficiente de cargas de trabajo de computación a gran escala en la nube.
  • Amazon SageMaker: Servicio integral para construir, entrenar y desplegar modelos de aprendizaje automático.
  • Amazon Athena: Servicio de consulta interactiva que facilita el análisis de datos en Amazon S3 utilizando SQL estándar.