fbpx
Wikipedia

Tolerancia frente a fallos

En informática, la tolerancia a fallos o conmutación por error (en inglés: failover) se refiere a la capacidad de un sistema de seguir funcionando, aún en caso de producirse algún fallo en el sistema. Observar que los fallos pueden ser no intencionados (por ejemplo, caídas de sistemas, fallos en el cableado, fallo hardware) o intencionados por alguna parte no confiable del sistema (problema de los generales bizantinos)

El nivel de tolerancia a fallos dependerá de las técnicas utilizadas para conseguirlo. No obstante, nunca será absoluta ya que siempre hay algún tipo de fallo masivo que produciría un error irrecuperable. Cada sistema hay que diseñarlo (diseño de tolerancia a fallos) de forma que los esfuerzos realizados para mitigar cierto tipo de fallos compensen los perjuicios que provocaría no tolerar ese tipo de fallo.

Estrategias

Hay distintas estrategias para conseguir un sistema lo más tolerante de fallos posible. Las más importantes son:

Redundancia

Una de las formas en la que las redes confiables proporcionan redundancia es mediante la implementación de una red conmutada por paquetes. La conmutación por paquetes divide el tráfico en paquetes que se enrutan a través de una red compartida. Un solo mensaje, como un correo electrónico o una transmisión de vídeo, se divide en múltiples bloques de mensajes, llamados paquetes. Cada paquete tiene la información de dirección necesaria del origen y el destino del mensaje. Los routers dentro de la red conmutan los paquetes según la condición de la red en ese momento. Esto significa que todos los paquetes en un mismo mensaje pueden tomar distintas rutas para llegar a destino.

Ejemplos de uso de esta estrategia son:

  • Uso de códigos detectores y correctores de error.
  • Tener módulos pasivos que hacen exactamente lo mismo que otros activos de forma que puedan sustituirlo y evitar que sistema se caiga por el fallo de un ese elemento.
  • Redundancia modular. Consiste en tener un número normalmente impar (para evitar luego empates) de módulos que hacen la misma función aunque pueden implementarla de forma diferente. Luego hay un módulo (el cual puede tener a su vez redundacia modular) que evalúa las salidas de dichos módulos y toma como resultado global el resultado que devuelve la mayoría de los módulos redundantes.

Replicación

Para evitar que un fallo produzca la pérdida de la información almacenada un sistema se suele replicar esa información en más de un soporte físico (redundancia), o en un equipo o dispositivo externo a modo de respaldo. De esta forma, si se produce alguna falla que pueda ocasionar pérdida de datos, el sistema debe ser capaz de restablecer toda la información, recuperando los datos necesarios a partir de algún medio de respaldo disponible.

En esto se basa el sistema de almacenamiento en RAID (Redundant Array of Independent Disks). Los sistemas RAID (a excepción de RAID 0) se basan en la técnica mirroring («en espejo»), que permite la escritura simultánea de los datos en más de un disco del array.

En sistemas distribuidos es frecuente replicar la información para conseguir que sean tolerantes a los fallos. Para hacer que dicha información sea consistente en todo el sistema distribuido se implementan protocolos de consenso

Autocorrección

Esta estrategia es la que hacen los navegadores de internet. Cuando el navegador de internet envía una solicitud HTTP al servidor WEB este responde con el contenido del sitio en formato estandarizado HTML o XHTML, si este código viene con errores (el estándar no se cumple), entonces el navegador es libre de elegir que hacer con él, ya sea no mostrar el contenido con problemas, intentar corregirlo o simplemente mostrarlo en texto plano. Normalmente lo que hacen es intentar corregirlo.

Enlaces externos

  • en Kioskea.net Tolerancia a fallos
  • Failover y failback
  • Browsers error tolerance

Véase también

  •   Datos: Q998767

tolerancia, frente, fallos, informática, tolerancia, fallos, conmutación, error, inglés, failover, refiere, capacidad, sistema, seguir, funcionando, aún, caso, producirse, algún, fallo, sistema, observar, fallos, pueden, intencionados, ejemplo, caídas, sistema. En informatica la tolerancia a fallos o conmutacion por error en ingles failover se refiere a la capacidad de un sistema de seguir funcionando aun en caso de producirse algun fallo en el sistema Observar que los fallos pueden ser no intencionados por ejemplo caidas de sistemas fallos en el cableado fallo hardware o intencionados por alguna parte no confiable del sistema problema de los generales bizantinos El nivel de tolerancia a fallos dependera de las tecnicas utilizadas para conseguirlo No obstante nunca sera absoluta ya que siempre hay algun tipo de fallo masivo que produciria un error irrecuperable Cada sistema hay que disenarlo diseno de tolerancia a fallos de forma que los esfuerzos realizados para mitigar cierto tipo de fallos compensen los perjuicios que provocaria no tolerar ese tipo de fallo Indice 1 Estrategias 1 1 Redundancia 1 2 Replicacion 1 3 Autocorreccion 2 Enlaces externos 3 Vease tambienEstrategias EditarHay distintas estrategias para conseguir un sistema lo mas tolerante de fallos posible Las mas importantes son Redundancia Editar Una de las formas en la que las redes confiables proporcionan redundancia es mediante la implementacion de una red conmutada por paquetes La conmutacion por paquetes divide el trafico en paquetes que se enrutan a traves de una red compartida Un solo mensaje como un correo electronico o una transmision de video se divide en multiples bloques de mensajes llamados paquetes Cada paquete tiene la informacion de direccion necesaria del origen y el destino del mensaje Los routers dentro de la red conmutan los paquetes segun la condicion de la red en ese momento Esto significa que todos los paquetes en un mismo mensaje pueden tomar distintas rutas para llegar a destino Ejemplos de uso de esta estrategia son Uso de codigos detectores y correctores de error Tener modulos pasivos que hacen exactamente lo mismo que otros activos de forma que puedan sustituirlo y evitar que sistema se caiga por el fallo de un ese elemento Redundancia modular Consiste en tener un numero normalmente impar para evitar luego empates de modulos que hacen la misma funcion aunque pueden implementarla de forma diferente Luego hay un modulo el cual puede tener a su vez redundacia modular que evalua las salidas de dichos modulos y toma como resultado global el resultado que devuelve la mayoria de los modulos redundantes Replicacion Editar Para evitar que un fallo produzca la perdida de la informacion almacenada un sistema se suele replicar esa informacion en mas de un soporte fisico redundancia o en un equipo o dispositivo externo a modo de respaldo De esta forma si se produce alguna falla que pueda ocasionar perdida de datos el sistema debe ser capaz de restablecer toda la informacion recuperando los datos necesarios a partir de algun medio de respaldo disponible En esto se basa el sistema de almacenamiento en RAID Redundant Array of Independent Disks Los sistemas RAID a excepcion de RAID 0 se basan en la tecnica mirroring en espejo que permite la escritura simultanea de los datos en mas de un disco del array En sistemas distribuidos es frecuente replicar la informacion para conseguir que sean tolerantes a los fallos Para hacer que dicha informacion sea consistente en todo el sistema distribuido se implementan protocolos de consenso Autocorreccion Editar Esta estrategia es la que hacen los navegadores de internet Cuando el navegador de internet envia una solicitud HTTP al servidor WEB este responde con el contenido del sitio en formato estandarizado HTML o XHTML si este codigo viene con errores el estandar no se cumple entonces el navegador es libre de elegir que hacer con el ya sea no mostrar el contenido con problemas intentar corregirlo o simplemente mostrarlo en texto plano Normalmente lo que hacen es intentar corregirlo Enlaces externos Editaren Kioskea net Tolerancia a fallos Sistemas redundantes y Failover Failover y failback Browsers error toleranceVease tambien Editar Wikcionario tiene definiciones y otra informacion sobre failback RAID Resiliencia ingenieria Datos Q998767 Obtenido de https es wikipedia org w index php title Tolerancia frente a fallos amp oldid 144031317, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos