Mr. gReEn

Mr. gReEn
il bello

domingo, 26 de agosto de 2007

Arquitectura de una BDD

ARQUITECTURA DE BASES DE DATOS
DISTRIBUIDAS

Una de las principales tendencias de la informática a lo largo de los últimos años ha sido el pasar de grandes computadoras centralizadas (que daban como resultado gigantescas bases de datos monolíticas en los setenta y principios de los ochenta) a redes distribuidas de sistemas informáticos (con una mayor descentralización y autonomía del procesamiento). Con la llegada de las mini computadoras, las tareas de procesamiento de datos, tales como el control de inventarios y el procesamiento de pedidos pasaron de mainframes corporativas a sistemas departamentales más pequeños. El explosivo aumento de popularidad de las computadoras personales en los años ochenta llevó la potencia de las computadoras directamente a las mesas de los despachos de millones de personas.

Conforme las computadoras y las redes de computadoras se extendían a través de las organizaciones, los datos ya no residían en un único sistema bajo el control de un único SGBD. En vez de ello, los datos se fueron extendiendo a través de muchos sistemas diferentes, cada uno con su propio gestor de base de datos.

Con frecuencia los diferentes sistemas informáticos y los diferentes sistemas de gestión de base de datos procedían de diferentes fabricantes. Estas tendencias han hecho que la industria informática y la comunidad de gestión de datos enfocar a su atención en los problemas de gestión de bases de datos distribuidas. Un sistema de computación distribuida consiste en un conjunto de computadores (que no necesariamente tienen que ser homogéneos), que están interconectados entre sí formando una red, y que cooperan para realizar una determinada tarea. Un sistema de computación distribuida parte un problema grande en pequeñas piezas, y soluciona cada una de ellas eficientemente de una manera coordinada.

Podemos definir una base de datos distribuida (BDD o DDB ‘Distributed Database System) como aquella cuyos datos están repartidos entre más de una máquina, y un sistema de gestión de bases de datos distribuidas (SGBDD o DDBMS ‘Distributed Database Management System’) como el software que gestiona una base de datos distribuida haciendo que la distribución de los datos sea transparente al usuario, es decir, los usuarios actúan como si todo estuviese junto en una sola base de datos. En la arquitectura distribuida el SGBD y la BD no están asociados a un determinado ordenador, sino a una red cuyos nodos se reparten las funciones. Una base de datos distribuida es vista por las aplicaciones igual que si fuera centralizada. Es el SGBDD el que se encarga de preservar la integridad y coherencia de la BD. Sin embargo existe otra definición mucho menos estricta de base de datos distribuida utilizada por muchos fabricantes de SGBD, según la cual una base de datos es distribuida sí permite lecturas y modificaciones remotas, independientemente de que éstas sean transparentes o no para las aplicaciones. Esta definición no es adecuada cuando se desea seleccionar una BD realmente distribuida.

Se suele distinguir entre sistemas homogéneos y heterogéneos. Un sistema es homogéneo si el SGBD usado en todas las máquinas es el mismo. Si existe más de un SGBD distinto el sistema se denomina heterogéneo. La distribución física, espacial o geográfica de la información puede aconsejar la utilización de esta arquitectura. Cada vez existen más productos disponibles en el mercado aunque no existen estándares.

Arquitectura de referencia para una BDD.

En la siguiente figura muestra una arquitectura de referencia para una BDD conforme a la arquitectura ANSI-SPARC:

martes, 21 de agosto de 2007

COMPARACIÓN ENTRE UNA BASE DE DATOS CENTRALIZADA Y UNA BASE DE DATOS DISTRIBUIDA

BASE DE DATOS CENTRALIZADA

En un sistema de base de datos centralizados, el procesamiento y todos los componentes del sistema residen en un solo computador o sitio, este era conocido con el nombre de Mainframe. Al decir componentes me refiero a los datos, el software, el SMDB y los dispositivos de almacenamiento.

Se podía tener acceso remoto a la base de datos a través de terminales interconectadas con el Mainframe, pero la única tarea que podían realizar estas terminales era "acceder" al Mainframe, es decir que poseían una capacidad de procesamiento nula y carecían de disco duro, esto, les ganó el sobrenombre de Terminales Tontas. Por el contrario los Mainframe eran computadoras de alta capacidad diseñadas para las tareas mas intensas porque se encargan de todo el procesamiento de datos del sistema.

Con el avance del tiempo este tipo de procesamiento, centralizado, vino arrastrando varios problemas, por los cuales los diseñadores se vieron en la necesidad de proponer un nuevo tipo de procesamiento. Y, junto con el abaratamiento de los precios, las terminales tontas empezaron a tener capacidad de procesamiento, es decir que una terminal podía funcionar sin necesidad de estar encendido en mainframe; y a continuación el mainframe pasó a ser un "servidor".

BASE DE DATOS DISTRIBUIDA

Una base de batos distribuida es un conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas en diferentes sitios, y que se encuentran comunicadas entre si a través de una red de comunicación.

Los componentes de este tipo de procesamiento de base de datos son conocidos como Servidores y Estaciones, que son equivalentes al mainframe y a las terminales del procesamiento centralizado respectivamente. Ahora estas estaciones tienen la capacidad de procesamiento autónomo lo cual significa que pueden realizar operaciones locales o distribuidas. Todo esto significa que cualquier usuario en cualquier sitio puede acceder a los datos desde cualquier parte de la red.

Estas son las características principales del procesamiento distribuido de base datos, y que al final las mismas vienen a convertirse en ventajas.