Como se distribuyen las filas en La Base de Datos Teradata?
Enviado por maumart • 6 de Septiembre de 2018 • Síntesis • 631 Palabras (3 Páginas) • 84 Visitas
Como se distribuyen las filas en
La Base de Datos Teradata?
La base de datos Teradata utiliza un Algoritmo Hash para distribuir aleatoriamente filas de la tabla a través de los AMP.
La elección del Primary Index determina si las filas de una tabla de manera uniforme o desigual distribución en el AMP.
Para trabajos de carga se distribuye uniformemente las filas.
Cada AMP es responsable de su subconjunto de las filas de cada tabla.
Las filas no se colocan en un orden particular.
Los beneficios de las filas desordenadas incluyen:
No necesita mantenimiento para preservar el orden.
El orden es independiente de cualquier consulta que se envía.
Los beneficios de la distribución de Hash son:
La distribución es la misma independientemente del volumen de datos.
La distribución se basa en el contenido de la fila, no la demografía de datos.
Primary Key (PK) vs. Primary Index (PI)
El PK es una convención de modelos de relación que identifica de forma única cada fila.
El PI es una convención de Teradata, que determina la distribución y el acceso a la fila.
Una base de datos bien diseñada tiene tablas en el PI es el mismo que el PK, así como las tablas donde se define la PI en diferentes columnas de la PK.
Rendimiento de un Join y un caminos conocidos de acceso podría dictar un PI que es diferente de la PK.
Primary Key (PK)
Concepto lógico de modelado de datos
Teradata no necesita el PK definido
No hay límite en el número de columnas
Documentado en el modelo de datos lógico
Valor debe tener un valor único
Identifica de forma única cada fila
El valor no debe cambiar
No puede ser NULL
No implica la ruta de acceso
Elegido por la corrección lógica
Primary Index (PI)
Mecanismo para la distribución de filas y el acceso.
Una tabla debe tener un Primary Index
Puede ser de 1 as 64 columnas
Definido en la sentencia CREATE TABLE
Puede tener un valor único o NO único.
Se utiliza para colocar una fila en un AMP
El valor puede ser cambiado (Updated)
Puede ser NULL
Define la más eficiente ruta de acceso
Elegido para el rendimiento físico..
Utilitario batch para cargas de una sola Tabla vacía.
A menudo se utiliza para "batch frecuente" o "mini-lotes", donde se cargan los datos a las tablas staging vacías, en estos casos se usa INSERT-SELECT para poblar las tablas.
Capacidad de Checkponit/Restar automático.
Errores notificados y recogidos en las tablas de error
Soporta las rutinas INMOD y Módulos de Acceso
Las cargas de datos en dos fases
Carga/Mantiene hasta cinco tablas pobladas
...