Una metodología de detección de fallos transitorios en aplicaciones paralelas sobre cluster de multicores (Record no. 57778)

MARC details
000 -CABECERA
campo de control de longitud fija 03754nam a2200241 a 4500
003 - IDENTIFICADOR DEL NÚMERO DE CONTROL
campo de control AR-LpUFIB
005 - FECHA Y HORA DE LA ÚLTIMA TRANSACCIÓN
campo de control 20250311170526.0
008 - DATOS DE LONGITUD FIJA--INFORMACIÓN GENERAL
campo de control de longitud fija 230201s2014 ag a om 000 0 spa d
024 8# - Otro identificador estandar
Número estándar o código DIF-M8737
-- 8964
-- DIF008006
040 ## - FUENTE DE LA CATALOGACIÓN
Centro catalogador/agencia de origen AR-LpUFIB
Lengua de catalogación spa
Centro/agencia transcriptor AR-LpUFIB
100 1# - ENTRADA PRINCIPAL--NOMBRE DE PERSONA
Nombre de persona Montezanti, Diego Miguel
245 10 - MENCIÓN DE TÍTULO
Título Una metodología de detección de fallos transitorios en aplicaciones paralelas sobre cluster de multicores
260 ## - PUBLICACIÓN, DISTRIBUCIÓN, ETC.
Fecha de publicación, distribución, etc. 2014
300 ## - DESCRIPCIÓN FÍSICA
Extensión 1 archivo (3,3 MB) :
Otras características físicas il. col.
502 ## - NOTA DE TESIS
Nota de tesis Trabajo Final Integrador (Especialización en Cómputo de Altas Prestaciones y Tecnología Grid) - Universidad Nacional de La Plata. Facultad de Informática, 2014.
505 0# - NOTA DE CONTENIDO CON FORMATO
Nota de contenido con formato 1. Fallos transitorios -- 1.1. Introducción -- 1.2. Concepto -- 1.3. Causas de ocurrencia Fallo, error -- 1.4. Efectos de los fallos transitorios. Terminología -- 1.5. Métricas utilizadas -- 1.6. Algunos casos reales -- 1.7. Consecuencias de los fallos transitorios -- 1.8. Posibles errores debidos a fallos transitorios -- 1.8.1. Excepción por instrucción inválida -- 1.8.2. Error de paridad durante un ciclo de lectura -- 1.8.3. Violación en acceso a memoria -- 1.8.4. Cambio de un valor -- 1.9. Fallos transitorios en sistemas paralelos -- 1.9.1. Concepto de sistema paralelo -- 1.9.2. Características de aplicaciones paralelas científicas de paso de mensajes -- 1.9.3. Consecuencias de fallos transitorios en sistemas paralelos -- 2. Detección de Fallos Transitorios -- 2.1. Modelo de fallo -- 2.2. Objetivos de la detección -- 2.3. Propuestas basadas en hardware -- 2.4. Propuestas basadas en software -- 2.5. Esfera de Replicación (SoR) -- 2.6. Ventanas de vulnerabilidad -- 2.7. Fallos múltiples -- 2.8. Memoria compartida -- 2.9. Propuestas híbridas -- 3. Arquitectura cluster de multicores -- 3.1. Clusters -- 3.2. Clusters de multicores -- 4. Programación con paso de mensajes. Estándar MPI -- 4.1. Modelo de programación basado en paso de mensajes -- 4.2. Estándar de programación MPI -- 4.2.1. Comunicaciones no bloqueantes -- 4.2.2. Comunicadores -- 4.2.3. Comunicaciones colectivas -- 4.2.4. Tipos de datos -- 4.2.5. Ventajas y desventajas de MPI -- 5. Detección de fallos transitorios en cómputo paralelo -- 5.1. MPI/FT -- 5.1.1. El modelo de ejecución de aplicaciones Maestro/Esclavo -- 5.1.2. El modelo de ejecución de aplicaciones SPMD -- 5.1.3. Detección de fallos y notificación -- 5.2. FT-MPI -- 5.3. Evaluación de la viabilidad de la replicación de procesos en HPC -- 5.3.1. Replicación de procesos en aplicaciones de HPC con paso de mensajes -- 6. Metodología SMCV para detección de fallos transitorios -- 6.1. Fundamentación -- 6.1.1. Validación de contenidos de mensajes antes de enviar -- 6.1.2. Comparación de resultados finales -- 6.1.3. Aprovechamiento de recursos redundantes de hardware -- 6.2. Descripción de la operación -- 6.2.1. Caracterización de la sobrecarga de trabajo -- 6.2.2. SoR de SMCV y vulnerabilidad -- 6.2.3. Comportamiento frente a fallos -- 6.3. Implementación de la herramienta de detección SMCV -- 6.3.1. Funciones básicas -- 6.3.2. Utilización -- 6.4. Validación experimental -- 6.4.1. Arquitectura de prueba -- 6.4.2. Verificación de la eficacia de detección -- 6.4.3. Mediciones de overhead -- 6.4.3.1. Benchmarks utilizados -- 6.4.3.2. Pruebas realizadas -- 6.4.3.3. Resultados -- 6.5. Resumen de las características de la metodología -- 7. Conclusiones y trabajos futuros -- Bibliografía
650 #4 - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA
Término de materia o nombre geográfico como elemento de entrada ARQUITECTURAS MULTICORE
653 ## - TÉRMINO DE INDIZACIÓN--NO CONTROLADO
Término no controlado fallos transitorios
700 1# - PUNTO DE ACCESO ADICIONAL--NOMBRE DE PERSONA
Nombre de persona De Giusti, Armando Eduardo ,
-- Director/a
700 1# - PUNTO DE ACCESO ADICIONAL--NOMBRE DE PERSONA
Nombre de persona Naiouf, Ricardo Marcelo ,
-- Codirector/a
856 40 - LOCALIZACIÓN Y ACCESO ELECTRÓNICOS
Identificador Uniforme del Recurso <a href=" http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2632"> http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2632</a>
942 ## - ELEMENTOS DE PUNTO DE ACCESO ADICIONAL (KOHA)
Tipo de ítem Koha Tesis de posgrado
Holdings
Estado de retiro Estado de pérdida Estado dañado Disponibilidad Biblioteca permanente Biblioteca actual Fecha de adquisición Número de inventario Total de préstamos Signatura topográfica completa Código de barras Fecha visto por última vez Precio válido a partir de Tipo de ítem Koha Colección Identificador Uniforme del Recurso
      Préstamo a domicilio Biblioteca de la Facultad de Informática Biblioteca de la Facultad de Informática 11/03/2025 DIF-05303   TES 14/49 DIF-05303 11/03/2025 11/03/2025 Tesis de posgrado    
      No corresponde Biblioteca de la Facultad de Informática Biblioteca de la Facultad de Informática 11/03/2025         11/03/2025 11/03/2025 Tesis de posgrado Biblioteca digital http://sedici.unlp.edu.ar/handle/10915/43305
      No corresponde Biblioteca de la Facultad de Informática Biblioteca de la Facultad de Informática 11/03/2025         11/03/2025 11/03/2025 Tesis de posgrado Biblioteca digital http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2632