sábado, 29 de octubre de 2011

DATAWAREHOUSE - DISFRUVER

El presente documento contiene los aspectos esenciales de la propuesta para la implementación de un sistema de información integral para la empresa Disfruver, con el objeto de facilitar los diferentes procesos y requerimientos de la empresa en mención.

UNA PROPUESTA DE ESTRATEGIA EN TRES ETAPAS

Considerando el volumen y la complejidad de la situación para la empresa Disfruver y teniendo en cuenta que en el sistema propuesto, la principal actividad es el transporte de la información por las diferentes plataformas de información existentes, se propone la construcción e implantación de un datawarehouse mediante un proceso evolutivo y único para cada empresa para la cual es desarrollado.

La idea principal es manejar y analizar los volúmenes de datos que tiene la empresa Disfruver, pero que proporcione satisfacción con la mayor precisión posible y en el menor tiempo.

Primera etapa: Elaboración y validación del sistema integral

En una primera etapa, será necesaria la conformación de algunos equipos técnicos que preparen y validen la información para iniciar con el sistema integral de información para Disfruver, estos equipos deben trabajar, con la meta de asegurar en un período máximo de un año desde el inicio de los trabajos, la presentación de un producto que satisfaga las necesidades de la empresa y que esté listo y consensuado con todos los actores claves de la empresa, para de esta forma todos los usuarios tengan un sistema de información deseado y adecuado a las necesidades de la empresa y cada uno de los usuarios.

Segunda etapa: Elaboración y validación de la solución

Como se debe tener en cuenta en la primea etapa, en esta segunda etapa es fundamental identificar los problemas que enfrenta la empresa Disfruver, para proponer soluciones que contribuyan a crear un sistema apropiado que permita una mejor solución y situación frente a los competidores potenciales, y, por consiguiente, tener un efecto positivo en nuestra competitividad como empresa. Finalmente, es necesario identificar los principales obstáculos que enfrenta la empresa en cuanto al sistema integral ya que estos son el objetivo de mejora del ordenamiento de la información empresarial.


Tercera etapa: Proceso de modernización del sistema integral

Todo es considerado en la estrategia para impulsar el proceso de reforma y modernización del sistema integral de información para la empresa Disfruver, ya que en esta etapa se inicia con la implementación de la solución por parte de las dos empresas en la unificación de los esfuerzos realizados en las etapas anteriores.

Como tema principal dentro de las etapas anteriores se contempla la implementación de un sistema datawarehouse, teniendo en cuenta al recurso humano, tecnología y disciplina, este sistema permite integrar varios sistemas de información como si fueran uno solo de manera automática, realizando la comunicación de las diferentes bases de datos y plataformas de manera transparente para los usuarios finales, de esta forma se garantiza que la información esté disponible para quien la necesite y para la toma de decisiones a nivel administrativo gerencial, ya que la pueden utilizar para el análisis de los resultados en un periodo definido.

Requerimientos y arquitectura

Se establecen los estándares y procedimientos únicos para la empresa Disfruver a nivel empresarial, si hablamos de las necesidades de información es fácil, ya que estas las debemos integrar al datawarehouse y complementar las necesidades con el poder que proporciona este sistema.

Los principales resultados del desarrollo de la arquitectura incluyen el modelo de datos fuente, modelo de datos conceptual, arquitectura tecnológica, estándares, procedimientos, plan de implementación incremental.

Los modelos de datos proveen una estructura para identificar, nombrar, describir y asociar los componentes de una base de datos. En general se necesitan modelos de datos para los datos fuente como para los datos seleccionados.

Los estándares son una parte importante en la arquitectura, ya que estos se los puede reusar para evitar posibles riesgos en un futuro.

El plan de implementación permite identificar los incrementos del proyecto y describe la secuencia de desarrollo de estos, además proporciona un control más detallado sobre los avances generados en la implementación.

Con relación a la parte de incrementos del datawarehouse se plantea el uso de datamarts, porque permite generar subconjuntos del sistema propuesto como los diferentes sistemas que posee cada sección de la empresa Disfruver, con el uso de los datamarts se garantiza la evolución del sistema propuesto, pero sin olvidar que cada incremento puede necesitar realizar ajustes en la arquitectura del datawarehouse, lo que implica que cada incremento entregado se debe implantar directamente con el datawarehouse simultáneamente, así se integra de una sola vez con la estructura propuesta y desarrollada, volviéndose más completo y de esta manera satisfacer las necesidades de información en todos los niveles jerárquicos, mediante el sistema DSS.

Para el análisis del sistema se tiene en cuenta que los datos deben ser extraídos, o sea que se leen desde su fuente original, transformados, es la estandarización de los datos de su fuente natural a una estructura diferente y transportados, es llevar los datos extraídos y transformados a un datamart generalmente para su posterior análisis y toma de decisiones, en los diferentes niveles jerárquicos.

A continuación se indican dos ejemplos de los diferentes procesos que se pueden seguir para el desarrollo e implementación de un datawarehouse.



Capacidad de almacenamiento y escalabilidad
La SAN ofertada deberá contar con las siguientes capacidades y características:
Capacidad inicial 10 TB, expandible a 20 TB
Los discos de almacenamiento son tipo SAS, con interfaz mínima de 6 Gb y velocidad de rotación de 10.000 RPM.
La capacidad de cada disco que compone el almacenamiento será de: 300 GB mínimo para discos del tipo FC o SAS, 500 GB mínimo para discos SATA, 200 GB mínimo para discos SSD.
Qué es un almacenamiento SAN: Es una red de almacenamiento de información, la cual es independiente de la red normal de transmisión y compartición de datos y otros dispositivos de red, el almacenamiento SAN es un sistema en el cual se dan o comparten espacios de discos de almacenamiento para los diferentes usuarios de un sistema en red.

Cuáles son los componentes hardware del almacenamiento SAN: Son los host, que son los servidores, dispositivos y software; los cables de fibra óptica, cable UTP fast Ethernet de 1 Gb, los concentradores y los switches; en el almacenamiento están los discos duros, la memoria cache, las cintas.

Cuáles son las soluciones de backup empleando SAN: Primero que todo esta red de backup o almacenamiento de recuperación debe estar situado en un lugar diferente al que se encuentran los servidores de datos, con el fin de evitar ser encontrados y ataques a estos, se lo puede trabajar como un sistema centralizado y de esta manera puede ser escalable y confiable, ya que el backup de la información en una empresa es el segundo bien más importante que tienen, el primero es el talento humano.

Los servidores en clúster para SAN: Se pueden clasificar de la siguiente manera, por software (sistema operativo) y hardware, teniendo la misma configuración todos los equipos que forman el clúster siendo un sistema homogéneo, sistema semihomogéneo genera un rendimiento diferente pero su hardware y software (sistema operativo) son similares en los equipos que lo conforman, y por último está el heterogéneo el cual posee diferente hardware y software (sistema operativo), siendo este último uno de los más utilizados debido a su economía en la construcción del clúster. Los componentes de un clúster son los siguientes: nodos, almacenamiento, sistemas operativos, conexiones de red, middelware, protocolos de comunicación y servicios, aplicaciones, ambientes de programación paralela, entre otros.

La replicación de datos en SAN: Consiste en el transporte de datos entre dos o  más servidores de bases de datos, con la cualidad de que estos datos se pueden almacenar en más de un sitio, aumentando la disponibilidad de los datos y el rendimiento de las diferentes consultas realizadas por los usuarios, es una de las mejores alternativas, ya que genera varias copias de la base en diferentes servidores.
  
Escalabilidad usando SAN: Permite contar con los puertos de conectividad para soportar la conexión de los diferentes equipos respetando los anchos de banda mínimos y necesarios. Permite añadir más equipos y puertos de conectividad además de un ancho de banda adicional
La solución de backup: Teniendo en cuenta la solución presentada a las necesidades en la presente propuesta, se tiene que el mejor plan de recuperación y backup es utilizar una red SAN, la cual puede ser escalable, confiable y administrable, proporcionando las herramientas necesarias para proteger la información, además de parametrizar en tiempo real las opciones de generar copias de respaldo y de recuperación en línea, con el fin de no tener tiempos improductivos, generando un beneficio empresarial a la medida de las necesidades de esta empresa, mediante la programación en días o meses según se llegue a convenir con los ingenieros de la empresa, esto para que la empresa tenga presente la confiabilidad del sistema y seguridad para evitar un desastre.
Características de seguridad: Autenticación de hosts, capacidad de definir zonas, enmascaramiento de volúmenes (LUNs), seguridad de protocolos.

sábado, 15 de octubre de 2011

Desarrollo y Adecuación de Software Distribuido

EJERCICIO DIDÁCTICO 3

SOLUCION DE COMUNICACIÓN VIRTUAL A TRAVES DE UN SISTEMA DISTRIBUIDO


Todos los sistemas basados en internet son conocidos como maquinas virtuales de comunicación y su particularidad es que son sistemas distribuidos, porque son equipos conectados a internet y que hacen uso de diferentes mecanismos de sincronización, balanceo de carga y tolerancia a fallas, estos sistemas son un modelo de intercambio de mensajes entre un emisor y un receptor.
Una característica a tener en cuenta es el radiado de mensajes, es una herramienta que permite simplificar el diseño de varios aspectos de un sistema distribuido y algunas de las características principales son las siguientes:
- Tolerancia a fallos. Característica por la cual un servicio puede seguir funcionando correctamente en presencia de fallos. Esto se logra replicando los servidores que proporcionan el servicio (servidores replicados). En ese caso, el servicio puede permanecer disponible incluso cuando varios de los procesos que lo proporcionan dejen de funcionar. Cuando los clientes desean hacer uso de él, radian los mensajes al grupo de servidores replicados y esperan la respuesta de uno cualquiera de ellos (o de todos, o de ninguno).
- Localización de objetos. Cuando un proceso requiere encontrar un objeto, puede realizar un radiado a todos los procesos donde cree que pueda estar. Esta técnica se usa, por ejemplo, en el Sistema V para localizar ficheros (radiando el mensaje a todos los servidores de ficheros) y en Amoeba para localizar servidores.
- Replicación de datos. Se utiliza para mejorar la eficiencia de un sistema. Por ejemplo, se puede mantener copias de una base de datos en varios servidores. Para actualizar un registro se realiza un radiado a todos los servidores (los datos deben permanecer consistentes).
- Integridad. Todo proceso entrega el mismo mensaje una vez, y sólo si algún otro se lo envió.
Según lo anterior y siguiendo con los ejemplos presentados anteriormente, se tiene que una página virtual de un banco, debe cumplir con ciertas características de seguridad que al  momento de realizar una transacción, la confianza del usuario sea 100% segura de que todo lo realizado es correcto, y todo esto se logra a través de la asignación de un usuario y una contraseña segura, además de seguir las recomendaciones de la entidad, para al final de cada transacción realizada se obtenga el comprobante de esta.
En caso de falla o caída del sistema al momento de realizar la transacción se genere un archivo sobre esta caída y luego se pueda proceder a conocer la situación generada mediante una bitácora que guarda cada eventualidad presentada en el sistema, dentro de esta se tiene en cuenta las millones de transacciones que se pueden realizar a diario y en cualquier lugar al que se pueda tener acceso.
Dentro de todo esto se debe tener la confianza de la seguridad y protección de la información y datos de todos y cada uno de los usuarios.