Preguntas y Respuestas sobre Bases de Datos: Conceptos Clave y Funcionamiento
Enviado por Programa Chuletas y clasificado en Informática y Telecomunicaciones
Escrito el en español con un tamaño de 26,67 KB
1. ¿Por qué resulta costoso tener acceso a un bloque de disco?
El acceso a un bloque de disco es costoso en términos de tiempo porque implica operaciones mecánicas, como el movimiento del cabezal de lectura/escritura y la rotación del disco, que son significativamente más lentas que las operaciones electrónicas dentro de la memoria principal.
2. ¿Cuáles son las 3 opciones (restricciones) de retención en conjuntos del modelo de red? Describa brevemente cada una de ellas.
- Fija: Un registro miembro no puede migrar a otra instancia del conjunto una vez que se ha insertado.
- Obligatoria: Un registro miembro no puede existir sin estar asociado a una instancia del conjunto.
- Opcional: Un registro miembro puede existir sin estar asociado a una instancia del conjunto y puede migrar a otra instancia.
3. ¿Qué diferencia hay entre índices primarios, índices secundarios e índices de agrupamiento?
- Índice primario: Se define sobre un archivo ordenado por la clave primaria. Garantiza que los registros estén físicamente ordenados según la clave primaria. Solo puede haber un índice primario por archivo.
- Índice secundario: Se define sobre cualquier otro atributo que no sea la clave primaria. No afecta el orden físico de los registros. Puede haber múltiples índices secundarios por archivo.
- Índice de agrupamiento: Se define sobre un archivo ordenado por un atributo que no es clave. Los registros con el mismo valor para el atributo de agrupamiento se almacenan juntos. Puede haber un índice de agrupamiento por archivo.
4. ¿Cuáles son los índices ordenados de un solo nivel?
Los índices ordenados de un solo nivel son aquellos que consisten en una sola tabla ordenada, donde cada entrada del índice apunta a un bloque de datos en el archivo principal. Ejemplos incluyen índices primarios, secundarios y de agrupamiento.
5. ¿Cómo mejorar la eficiencia de búsquedas en un archivo de índices con la indización de múltiples niveles?
La indización de múltiples niveles mejora la eficiencia al crear una jerarquía de índices. Un índice de nivel superior apunta a bloques del índice de nivel inferior, y así sucesivamente, hasta llegar al índice de nivel más bajo que apunta a los bloques de datos. Esto reduce el número de bloques que deben leerse para encontrar un registro específico.
6. ¿Cuáles son las propiedades de los sistemas jerárquicos? Enumérelas y descríbalas brevemente.
- Jerarquía: Los datos se organizan en una estructura de árbol, con un nodo raíz y nodos hijos.
- Relación padre-hijo: Cada nodo hijo tiene un solo padre, pero un padre puede tener varios hijos.
- Integridad referencial: Un nodo hijo no puede existir sin un nodo padre.
- Navegación: El acceso a los datos se realiza a través de la navegación por la jerarquía.
7. ¿Cuáles son las técnicas de asignación de bloques de archivo en disco? Describa brevemente cada una de ellas.
- Asignación contigua: Los bloques de un archivo se almacenan en sectores contiguos del disco.
- Asignación enlazada: Los bloques de un archivo se enlazan entre sí mediante punteros.
- Asignación indexada: Se utiliza un bloque índice que contiene punteros a los bloques de datos del archivo.
8. ¿Cuáles son las restricciones inherentes al modelo jerárquico? Describa cada una de ellas.
- Un solo padre: Cada registro hijo solo puede tener un padre, lo que dificulta la representación de relaciones de muchos a muchos.
- Rigidez: La estructura jerárquica es rígida y difícil de modificar.
- Redundancia de datos: La información puede duplicarse en diferentes ramas del árbol.
9. Analice las distintas técnicas para eliminar registros.
- Eliminación física: El registro se elimina físicamente del archivo, liberando el espacio que ocupaba.
- Eliminación lógica: El registro se marca como eliminado mediante un indicador, pero permanece físicamente en el archivo.
10. ¿Qué diferencia hay entre una organización de archivo y un método de acceso?
- Organización de archivo: Se refiere a la forma en que los registros se almacenan físicamente en el disco (por ejemplo, secuencial, indexado, disperso).
- Método de acceso: Se refiere a la forma en que se accede a los registros (por ejemplo, secuencial, directo, por índice).
11. ¿Qué razones hay para tener registros de longitud variable?
- Campos de longitud variable: Algunos campos, como el nombre o la dirección, pueden tener longitudes variables.
- Campos repetidos: Un registro puede tener un número variable de ocurrencias de un campo.
- Tipos de registros opcionales: Un registro puede contener o no ciertos tipos de información.
12. ¿Qué diferencias hay entre un árbol B y un árbol B+?
- Árbol B: Los datos se almacenan tanto en los nodos internos como en las hojas.
- Árbol B+: Los datos solo se almacenan en las hojas. Los nodos internos solo contienen claves y punteros.
- Árbol B+: Las hojas están enlazadas entre sí, lo que permite un acceso secuencial eficiente.
13. ¿Cuáles son los aspectos de los que se encarga el modelo relacional?
El modelo relacional se encarga de la estructura de los datos (tablas), la integridad de los datos (restricciones) y la manipulación de los datos (álgebra relacional y SQL).
14. ¿El álgebra relacional posee propiedad de herencia sobre qué componentes?
El álgebra relacional no posee propiedad de herencia en el sentido de la programación orientada a objetos. Sin embargo, las operaciones del álgebra relacional se aplican a relaciones completas y sus resultados son nuevas relaciones que heredan el esquema (atributos) de las relaciones originales o de una combinación de ellas, dependiendo de la operación.
15. ¿Cuáles son los operadores tradicionales del álgebra relacional? Defina a cada uno de ellos junto con sus propiedades.
- Selección (σ): Selecciona las tuplas que cumplen una condición.
- Proyección (π): Selecciona ciertas columnas de una relación.
- Unión (∪): Combina dos relaciones compatibles en una sola.
- Diferencia (-): Devuelve las tuplas que están en la primera relación pero no en la segunda.
- Producto cartesiano (×): Combina cada tupla de una relación con cada tupla de otra relación.
- Intersección (∩): Devuelve las tuplas que están en ambas relaciones.
- Renombramiento (ρ): Cambia el nombre de los atributos de una relación.
16. ¿Cuáles son los operadores especiales del álgebra relacional? Defina a cada uno de ellos junto con sus propiedades.
- Reunión (⋈): Combina dos relaciones basándose en una condición de igualdad entre atributos.
- División (÷): Devuelve los valores de una relación que están relacionados con todos los valores de otra relación.
- Agregación: Calcula valores agregados como suma, promedio, mínimo, máximo.
17. ¿Cuáles son las principales funciones del DBMS?
- Definición de datos: Permite crear, modificar y eliminar la estructura de la base de datos.
- Manipulación de datos: Permite insertar, actualizar, eliminar y consultar los datos.
- Control de concurrencia: Gestiona el acceso simultáneo a la base de datos por parte de múltiples usuarios.
- Seguridad: Protege la base de datos contra accesos no autorizados.
- Recuperación: Permite recuperar la base de datos en caso de fallos.
- Integridad: Asegura la consistencia y validez de los datos.
18. ¿Cuáles son los distintos tipos de usuario existentes? ¿El administrador de datos es uno de ellos? ¿Cuál es su función?
Tipos de usuarios:
- Usuarios finales: Interactúan con la base de datos a través de aplicaciones.
- Programadores de aplicaciones: Desarrollan las aplicaciones que utilizan la base de datos.
- Administrador de la base de datos (DBA): Responsable del diseño, implementación, mantenimiento y seguridad de la base de datos.
- Administrador de datos (DA): Sí, es un tipo de usuario. Se encarga de la gestión de los datos como un recurso corporativo, incluyendo la definición de políticas, estándares y procedimientos para la gestión de datos.
19. Defina Modelo de Red / Defina Navegabilidad del M. de Red
- Modelo de Red: Un modelo de datos que representa los datos como una colección de registros y relaciones entre ellos, formando un grafo.
- Navegabilidad: El acceso a los datos en el modelo de red se realiza a través de la navegación por las relaciones entre registros, siguiendo punteros.
20. ¿Qué es la propiedad de cierre del álgebra relacional? ¿Para qué nos sirve? ¿Qué relación tiene dicha propiedad sobre las cabeceras de las relaciones?
- Propiedad de cierre: El resultado de cualquier operación del álgebra relacional es otra relación.
- Utilidad: Permite encadenar operaciones del álgebra relacional para formar consultas complejas.
- Relación con las cabeceras: La cabecera de la relación resultante se deriva de las cabeceras de las relaciones originales y de la operación aplicada.
21. ¿Qué son los archivos de montículo? Describa brevemente sus características
Los archivos de montículo son archivos no ordenados donde los registros se almacenan en el orden en que se insertan. Características:
- Inserción rápida: Los nuevos registros se añaden al final del archivo.
- Búsqueda lenta: Se requiere una búsqueda secuencial para encontrar un registro específico.
- Eliminación: Puede ser física o lógica.
- Actualización: Puede requerir reubicar el registro si cambia su tamaño.
22. ¿Qué son los archivos ISAM? ¿Describa brevemente su funcionamiento? ¿Es una estructura fácil de migrar? ¿Por qué?
- Archivos ISAM (Indexed Sequential Access Method): Son archivos secuenciales con un índice que permite el acceso directo a los registros.
- Funcionamiento: Los registros se almacenan ordenados por la clave primaria. Un índice jerárquico permite localizar rápidamente el bloque que contiene el registro buscado.
- Migración: No es fácil de migrar debido a su dependencia de la estructura física del disco y del sistema operativo.
- Razón: La estructura del índice está estrechamente ligada a la ubicación física de los bloques en el disco.
23. ¿Cuáles son los utilitarios de la sección frontal? Describa sus principales características. De ejemplos.
Los utilitarios de la sección frontal son herramientas que interactúan directamente con el usuario final. Características:
- Interfaz de usuario: Proporcionan una interfaz para que los usuarios interactúen con la base de datos.
- Facilidad de uso: Suelen ser fáciles de usar y no requieren conocimientos técnicos profundos.
- Ejemplos: Formularios, generadores de informes, herramientas de consulta gráfica.
24. Dentro de las técnicas de dispersión se encuentra la “Dispersión Interna”. Explique el concepto.
La dispersión interna, también conocida como *hashing* interno, es una técnica de organización de archivos que utiliza una función de *hash* para calcular la dirección de un registro dentro de un área de almacenamiento predefinida en memoria principal o en un archivo en disco. Se gestionan las colisiones dentro de la misma área.
25. Dentro de las técnicas de dispersión se encuentra la “Dispersión Externa”. Explique el concepto.
La dispersión externa, también conocida como *hashing* externo, es una técnica de organización de archivos que utiliza una función de *hash* para calcular la dirección de un registro en un archivo en disco. Las colisiones se gestionan utilizando áreas de desbordamiento separadas o técnicas de encadenamiento.
26. Si en una relación R existe una DF del tipo {A} → {B} y A no es clave candidata, ¿qué pasa? ¿Por qué?
Si existe una dependencia funcional {A} → {B} y A no es clave candidata, la relación R no está en la segunda forma normal (2FN). Esto se debe a que existe un atributo B que depende de un subconjunto propio de una clave candidata (si A forma parte de una clave compuesta) o de un atributo que no es clave, lo que puede provocar anomalías de actualización.
27. ¿Cuáles son las técnicas de dispersión dinámica? Describa el funcionamiento de cada una.
- Dispersión extensible: Utiliza un directorio que se duplica cuando se llena un cubo. La función de *hash* se ajusta para utilizar más bits según sea necesario.
- Dispersión lineal: Los cubos se dividen de forma lineal, uno a la vez, según un criterio predefinido. Se utiliza una familia de funciones de *hash*.
28. ¿Cuáles son los tipos de conjuntos presentes en el modelo de red? Indique cuales son las propiedades básicas. ¿Y cuáles son los tipos especiales de conjuntos? Descríbalos.
Tipos de conjuntos en el modelo de red:
- Conjuntos singulares o de sistema: Tienen un solo registro propietario (el sistema) y varios registros miembro.
- Conjuntos recursivos: Permiten que un registro sea propietario y miembro del mismo tipo de conjunto.
- Conjuntos regulares: Conjuntos con un tipo de registro propietario y uno o más tipos de registros miembro.
Propiedades básicas:
- Nombre: Cada tipo de conjunto tiene un nombre único.
- Propietario: Cada conjunto tiene un registro propietario.
- Miembro: Cada conjunto puede tener uno o más registros miembro.
- Orden: Los registros miembro pueden estar ordenados.
- Retención: Define cómo se comportan los registros miembro (fija, obligatoria, opcional).
Tipos especiales de conjuntos:
- Conjuntos multivía: Permiten que un registro miembro participe en varios conjuntos del mismo tipo.
29. Diferencias entre Administrador de DB y Administrador de Datos.
- Administrador de la base de datos (DBA): Se centra en los aspectos técnicos de la base de datos, como el diseño físico, la implementación, el rendimiento, la seguridad y la recuperación.
- Administrador de datos (DA): Se centra en los aspectos estratégicos de los datos, como la definición de políticas, estándares y procedimientos para la gestión de datos como un recurso corporativo.
30. Defina independencia lógica y física. Beneficios.
- Independencia lógica: La capacidad de modificar el esquema conceptual sin afectar los esquemas externos o las aplicaciones.
- Independencia física: La capacidad de modificar el esquema interno sin afectar el esquema conceptual o los esquemas externos.
- Beneficios: Mayor flexibilidad, mantenimiento más sencillo, mejor escalabilidad y portabilidad.
31. ¿Cuáles son los utilitarios de la sección posterior? Describa sus principales características. De ejemplos
Los utilitarios de la sección posterior son herramientas que se ejecutan en el servidor de la base de datos y no interactúan directamente con el usuario final. Características:
- Administración: Se utilizan para tareas de administración de la base de datos.
- Automatización: Suelen ejecutarse de forma automática o programada.
- Ejemplos: Copias de seguridad, recuperación, reorganización de archivos, monitoreo del rendimiento.
32. Concepto dependencia funcional. Que representa un determinante. ¿Es posible que exista una dependencia funcional establecida entre dos subconjuntos de atributos de la cabecera de una relación que puedan ser a la vez determinantes y dependientes (obviamente en dos dependencias funcionales distintas).
- Dependencia funcional: Una restricción que especifica que el valor de un conjunto de atributos determina el valor de otro conjunto de atributos.
- Determinante: El conjunto de atributos que determina el valor de otro conjunto de atributos.
- Dependencias entre subconjuntos: Sí, es posible. Por ejemplo, si tenemos atributos A, B y C, es posible tener las dependencias funcionales {A} → {B} y {B} → {C}. En este caso, B es dependiente en la primera dependencia y determinante en la segunda.
33. Archivos ordenados y no ordenados
- Archivos ordenados: Los registros se almacenan en un orden específico, generalmente según la clave primaria.
- Archivos no ordenados (montículos): Los registros se almacenan en el orden en que se insertan, sin un orden específico.
34. ¿Qué es y para qué sirve la clave foránea?
Una clave foránea es un atributo o conjunto de atributos en una relación que hace referencia a la clave primaria de otra relación. Sirve para establecer relaciones entre tablas y garantizar la integridad referencial.
35. Describa las reglas de inferencia. Para que sirven
Las reglas de inferencia, también conocidas como axiomas de Armstrong, son un conjunto de reglas que permiten deducir nuevas dependencias funcionales a partir de un conjunto dado de dependencias funcionales. Sirven para determinar el cierre de un conjunto de dependencias funcionales y para el diseño de bases de datos relacionales.
- Reflexividad: Si Y es un subconjunto de X, entonces X → Y.
- Aumentatividad: Si X → Y, entonces XZ → YZ.
- Transitividad: Si X → Y y Y → Z, entonces X → Z.
- Unión: Si X → Y y X → Z, entonces X → YZ.
- Descomposición: Si X → YZ, entonces X → Y y X → Z.
- Pseudotransitividad: Si X → Y y WY → Z, entonces WX → Z.
36. Definir concepto de dato persistente.
Un dato persistente es aquel que sobrevive a la ejecución del programa que lo creó. Se almacena en un medio de almacenamiento no volátil, como un disco duro, y puede ser recuperado posteriormente.
37. Definir concepto de base de datos
Una base de datos es una colección organizada de datos, almacenados y accedidos electrónicamente. Los datos están estructurados para facilitar su almacenamiento, recuperación, modificación y eliminación.
38. ¿Qué representa el nivel conceptual?
El nivel conceptual representa una vista global de la base de datos. Describe qué datos se almacenan en la base de datos y las relaciones entre ellos. Es independiente de la implementación física.
39. Cuáles son las principales funciones del DBA.
- Diseño de la base de datos: Define la estructura de la base de datos.
- Implementación: Crea la base de datos física.
- Seguridad: Define y gestiona los permisos de acceso a la base de datos.
- Mantenimiento: Realiza copias de seguridad, recuperación y optimización del rendimiento.
- Soporte: Proporciona soporte técnico a los usuarios.
40. ¿Qué son los tipos de vínculo padre/hijo virtuales? ¿Cómo mejoran la capacidad de modelado del modelo jerárquico?
- Tipos de vínculo padre/hijo virtuales: Son una extensión del modelo jerárquico que permite que un registro hijo tenga un padre lógico adicional, además de su padre físico.
- Mejora de la capacidad de modelado: Permiten representar relaciones de muchos a muchos y reducir la redundancia de datos.
41. Defina arquitectura de una Base de datos. ¿Qué representa cada nivel? ¿Qué son las trasformaciones?
La arquitectura de una base de datos describe la estructura y organización de la base de datos. La arquitectura ANSI/SPARC define tres niveles:
- Nivel externo: Describe la vista de la base de datos para un usuario o grupo de usuarios específico.
- Nivel conceptual: Describe la vista global de la base de datos, incluyendo todos los datos y sus relaciones.
- Nivel interno: Describe la estructura física de la base de datos, incluyendo cómo se almacenan los datos en el disco.
- Transformaciones: Son los mapeos entre los diferentes niveles de la arquitectura. Permiten que los cambios en un nivel no afecten a los otros niveles.
42. ¿Qué significan las relaciones? ¿Cómo se componen? Defina los conceptos de “Predicado” “proposición verdadera” ¿Qué representan cada uno de ellos?
- Relaciones: Representan asociaciones entre entidades.
- Composición: Se componen de una cabecera (conjunto de atributos) y un cuerpo (conjunto de tuplas).
- Predicado: Una expresión lógica que define las condiciones que deben cumplir las tuplas de una relación.
- Proposición verdadera: Una tupla que satisface el predicado de la relación.
- Representación: El predicado define la regla de pertenencia a la relación, y cada proposición verdadera representa una instancia de la relación.
43. Defina el concepto de dominio ¿Qué consideraciones se deben tener sobre las operaciones?
- Dominio: Un conjunto de valores permitidos para un atributo.
- Consideraciones sobre las operaciones: Las operaciones sobre los atributos deben ser compatibles con el dominio del atributo. Por ejemplo, no se puede sumar un valor numérico con una cadena de texto.
44. ¿Cuáles son las propiedades de las relaciones?
- No hay tuplas duplicadas: Cada tupla en una relación es única.
- El orden de las tuplas no importa: Las tuplas no tienen un orden específico.
- El orden de los atributos no importa: Los atributos no tienen un orden específico.
- Los valores de los atributos son atómicos: Cada valor de atributo es indivisible.
45. Una relación de 5NF puede tener anomalías de actualización. ¿Puede esto darse por dependencia funcional trivial? Justifique
Una relación en 5NF no tiene anomalías de actualización causadas por dependencias multivaluadas ni por dependencias de unión. No puede tener anomalías de actualización debido a una dependencia funcional trivial, ya que una dependencia funcional trivial (como A → A) no causa redundancia ni inconsistencia. Las anomalías en 5NF pueden deberse a otras restricciones no cubiertas por las formas normales, como restricciones semánticas o reglas de negocio complejas.
46. ¿Qué son los indicadores de actualidad? ¿Para qué se usan? Enumere cada uno de ellos
Los indicadores de actualidad son marcas o etiquetas que se utilizan para indicar el estado de un registro en un archivo. Se usan para la eliminación lógica de registros. Ejemplos:
- Indicador de borrado: Indica si un registro ha sido borrado lógicamente.
- Indicador de activo/inactivo: Indica si un registro está activo o inactivo.
- Fecha de borrado: Indica la fecha en que se borró lógicamente un registro.
47. ¿Qué es un tipo de registro virtual? ¿En qué caso es necesario su uso? ¿Por qué?
- Tipo de registro virtual: Un tipo de registro que no se almacena físicamente en la base de datos, sino que se deriva de uno o más tipos de registros físicos.
- Caso de uso: Cuando se necesita representar una vista de los datos que no corresponde directamente a un tipo de registro físico.
- Razón: Permite simplificar las consultas y proporcionar una vista personalizada de los datos a los usuarios.
48. Qué diferencia hay entre índice lógico y físico?
- Índice lógico: Un índice que se define sobre la estructura lógica de los datos, independientemente de su ubicación física.
- Índice físico: Un índice que se define sobre la ubicación física de los datos en el disco.
49. Características del proceso de normalización
- Eliminación de redundancia: Reduce la duplicación de datos.
- Minimización de anomalías de actualización: Evita inconsistencias al insertar, actualizar o eliminar datos.
- Mejora de la integridad de los datos: Asegura la consistencia y validez de los datos.
- Proceso gradual: Se realiza en etapas, aplicando diferentes formas normales.
50. Conceptos: Base de Datos, Datos Persistentes, Producto cartesiano extendido.
- Base de Datos: Colección organizada de datos, almacenados y accedidos electrónicamente.
- Datos Persistentes: Datos que sobreviven a la ejecución del programa que los creó.
- Producto cartesiano extendido: Una generalización del producto cartesiano que permite combinar relaciones que no tienen atributos en común. En el álgebra relacional, el producto cartesiano estándar ya incluye esta funcionalidad, por lo que no se hace una distinción especial.