DERIVABILIDAD, REDUNDANCIA Y CONSISTENCIA DE RELACIONES
Enviado por weon117 • 27 de Enero de 2021 • Biografía • 5.111 Palabras (21 Páginas) • 243 Visitas
DERIVABILIDAD, REDUNDANCIA Y CONSISTENCIA DE RELACIONES
ALMACENADOS EN GRANDES BANCOS DE DATOS
E. F. Codd Research Division San José, California
RESUMEN: Los grandes bancos de datos integrados del futuro contendrán muchas relaciones de varios grados en forma almacenada. No será inusual que este conjunto de relaciones almacenadas sea redundante. Se definen y discuten dos tipos de redundancia. Se puede emplear un tipo para mejorar la accesibilidad de ciertos tipos de información que resultan tener una gran demanda. Cuando existe cualquier tipo de redundancia, los responsables del control del banco de datos deben conocerlo y tener algún medio para detectar cualquier inconsistencia "lógica" en el conjunto total de relaciones almacenadas. La verificación de coherencia puede ser útil para rastrear cambios no autorizados (y posiblemente fraudulentos) en el contenido del banco de datos.RJ 599(# 12343) Agosto 19, 1969
AVISO DE DISTRIBUCIÓN LIMITADA: este informe se ha enviado para su publicación en otro lugar y se ha emitido como un informe de investigación para la difusión temprana de su contenido. Como cortesía para el editor previsto, no debe distribuirse ampliamente hasta después de la fecha de publicación externa.
Se pueden solicitar copias en IBM Thomas J. Watson Research Center, Post Office Box 218, Yorktown Heights, Nueva York 10598
CONTENIDO
1. Una visión relacional de los datos 2. Algunos aspectos lingüísticos 3. Operaciones en las relaciones
3.1 Permutación 3.2 Proyección 3.3 Unir
3.4 Composición 4. Relaciones expresables, nombradas y almacenadas 5. Derivabilidad, redundancia y consistencia 6. Control del banco de datos
Wooouuu
INTRODUCCIÓN
La primera parte de este artículo se ocupa de una explicación de una visión relacional de los datos. Esta vista (o modelo) de datos parece ser superior en varios aspectos al modelo gráfico o de red (1, 2) actualmente en boga. Proporciona un medio para describir datos con su estructura natural únicamente: es decir, sin superponer ninguna estructura adicional para fines de representación de la máquina. En consecuencia, proporciona una base para un lenguaje de recuperación de alto nivel que producirá la máxima independencia entre los programas, por un lado, y la presentación y organización de la máquina de datos, por el otro. Una ventaja adicional de la visión relacional es que forma una base sólida para tratar la derivabilidad, la redundancia y la consistencia de las relaciones, que se analizan en la segunda parte de este artículo. El modelo de red, por otro lado, ha generado una serie de confusiones, entre las cuales la la derivación de conexiones para la derivación de relaciones Finalmente, la visión relacional permite una evaluación más clara del alcance y las limitaciones lógicas del presente sistema de información de gestión. temas, y también los méritos relativos (desde un punto de vista lógico) de las representaciones de datos en competencia dentro de un solo sistema.
1. Una visión relacional de los datos
El término relación se utiliza aquí en su sentido matemático aceptado. Dados los conjuntos S, S2, ..., S, (no necesariamente distintos), R es una relación en estos n conjuntos si es un conjunto de n-tuplas, cada uno de los cuales tiene su primer elemento de Suits segundo elemento de Sy, y así. Nos referiremos a S. como el i-ésimo dominio de R. Como se definió anteriormente, se dice que R tiene el grado n. Las relaciones de grado 1 a menudo se denominan unarias, grado 2 binarias, grado 3 ternarias y grado n n-arias.
Por razones expositivas, usaremos frecuentemente una representación de arreglo de relaciones, pero debe recordarse que esta representación particular no es una parte esencial de la visión relacional que se expone. Una matriz que representa una relación n-aria R tiene las siguientes propiedades:
(1) Cada fila representa una n-tupla de R; (2) El orden de las filas es irrelevante; (3) Todas las filas son distintas; (4) El orden de las columnas es significativo:
corresponde al pedido S., Sy, ... SK
de los dominios en los que se define R; (5) El significado de cada columna es parcialmente
transmitido etiquetándolo con el nombre del dominio correspondiente.
El ejemplo de la Figura 1 ilustra una relación de grado 4 denominada buque que refleja los envíos en curso de piezas de proveedores específicos a proyectos específicos en cantidades específicas.
barco (cantidad de proyecto de pieza de proveedor)
1
2 5
17 1 3 5 23
379
ANN
11 12
FIGURA 1: Una relación del grado 4
Uno podría preguntarse: si las columnas están etiquetadas por el nombre de los dominios correspondientes, ¿por qué debería importar el orden de las columnas? Como muestra el ejemplo de la Figura 2, dos columnas pueden tener encabezados idénticos (que indican dominios idénticos), pero poseer significados distintos con respecto a la relación. La relación representada es
llamado componente. Es una relación binaria, cada uno de cuyos dos dominios se llama parte. El significado de componente (x, y) es que la parte x es un componente inmediato (o subensamblaje) de la parte y.
componente (parte parte)
1 5 2 5
3 5. 26 36
Figura 2: Una relación con dos dominios idénticos
00
Ahora afirmamos que un banco de datos es una colección de relaciones que varían en el tiempo. Estas relaciones son de diversos grados. A medida que avanza el tiempo, cada relación n-aria puede estar sujeta a la inserción de n-tuplas adicionales, la eliminación de las existentes y la alteración de componentes de cualquiera de sus n-tuplas existentes.
Considere, por ejemplo, un banco de datos que contiene información sobre piezas, proyectos y proveedores. La descripción individual de un objeto individual (como una parte en particular) se denomina entidad (3). La descripción del prototipo de una clase de objetos se denomina tipo de entidad. El conjunto de entidades de un tipo de entidad determinado puede verse como un relación, y llamaremos a dicha relación una relación de tipo de entidad. En el ejemplo en consideración, podría haber una relación de tipo de entidad llamada parte cefinida en el
siguientes dominios:
(1) número de pieza (2) nombre de pieza (3) color de pieza (4) peso de pieza (5) cantidad disponible (6) cantidad solicitada
y posiblemente también otros dominios. Cada uno de estos dominios es, en efecto, un conjunto de valores, algunos o todos pueden estar representados en el banco de datos en cualquier momento. Si bien es posible que, en algún momento, estén presentes todos los colores de las piezas, es poco probable que lo estén todos los pesos, nombres y números de piezas posibles. Los dominios enumerados anteriormente corresponden a lo que comúnmente se denominan atributos de la parte del tipo de entidad.
...