Database Systems & SQL Fundamentals
AI Summary
Key Insights
- The document explores the need for data management and the evolution of database systems from manual processes to electronic systems.
- It introduces relational databases, their structures, components (attributes, tuplas, domains), and the importance of data normalization.
- Key database concepts are discussed, including data integrity, security, data independence, and the roles of different users such as analysts and programmers.
- It delves into the ANSI/X3/SPARC model for DBMS construction with a focus on the three abstraction levels (external, conceptual and internal) and how SGBD’s implement these models to improve the efficiency and manageability of databases,.
- It outlines SQL (Structured Query Language) and its uses. Covering SQL components like commands, clauses, and operators, and functions, as well as data definition (DDL), data manipulation (DML), and querying, with an emphasis on practical applications and how the algebraic relation is accomplished.

![[1]
[Unidad 1]
gestión de datos
[1.1]
sistemas de información
[1.1.1] introducción
la necesidad de gestionar datos
En el mundo actual existe una cada vez mayor demanda de datos. Esta demanda
siempre ha sido patente en empresas y sociedades, pero en estos años la demanda
todavía de ha disparado más debido al acceso multitudinario a las redes integradas en
Internet y a la aparición de pequeños dispositivos (móviles y PDA) que también
requieren esa información.
En informática se conoce como dato a cualquier elemento informativo que tenga
relevancia para un usuario. Desde su nacimiento, la informática se ha encargado de
proporcionar herramientas que faciliten la gestión de los datos.
Antes de la aparición de las aplicaciones informáticas, las empresas tenían como
únicas herramientas de gestión de datos a los cajones, carpetas y fichas en las que se
almacenaban los datos. En este proceso manual, el tipo requerido para manipular estos
datos era enorme. Sin embargo el proceso de aprendizaje era relativamente sencillo ya
que se usaban elementos que el usuario reconocía perfectamente.
Por esa razón, la informática ha adaptado sus herramientas para que los elementos
que el usuario maneja en el ordenador se parezcan a los que utilizaba manualmente.
Por eso en informática se sigue hablado de ficheros, formularios, carpetas,
directorios,....
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/t5KMIBI-DkSTgUpXr2t72bk9D-zunnY2gDb7nk3TgXU/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMi1sLndlYnA=.webp)
![Sistemas Gestores de Bases de Datos
La gestión de los datos
[2]
la empresa como sistema
Según la RAE, la definición de sistema es “Conjunto de cosas que ordenadamente
relacionadas entre sí contribuyen a un determinado objeto” .
La clientela fundamental del profesional de la informática es la empresa. La
empresa se puede entender como un sistema formado por diversos objetos: el capital,
los recursos humanos, los inmuebles, los servicios que prestas, etc.
El sistema completo que forma la empresa, por otra parte, se suele dividir en los
siguientes subsistemas:
Å Subsistema productivo. También llamado subsistema real o físico. Representa la
parte de la empresa encargada de gestionar la producción de la misma.
Å Subsistema financiero. Encargado de la gestión de los bienes económicos de la
empresa
Å Subsistema directivo. Encargado de la gestión organizativa de la empresa
Hay que hacer notar que cada subsistema se asocia a un departamento concreto de la
empresa.
sistemas de información
Los sistemas que aglutinan los elementos que intervienen para gestionar la información
que manejan los subsistemas empresariales es lo que se conoce como Sistemas de
Información. Se suele utilizar las siglas SI o IS (de Information Server) para referirse a
ello).
Realmente un sistema de información sólo incluye la información que nos interesa de
la empresa y los elementos necesarios para gestionar esa información.
Un sistema de información genérico está formado por los siguientes elementos:
Å Recursos físicos. Carpetas, documentos, equipamiento, discos,...
Å Recursos humanos. Personal que maneja la información
Å Protocolo. Normas que debe cumplir la información para que sea manejada
(formato de la información, modelo para los documentos,...). Aunque es el
elemento en el que menos se repara, es uno de los más importantes, no tener un
protocolo garantiza un desastre.
Las empresas necesitan implantar estos sistemas de información debido a la necesidad
de gestionar las diferentes acciones que realiza una empresa. En cada proceso
empresarial se genera una serie de datos de interés para la misma que deben ser
manipulados adecuadamente por el sistema de información.
el software y la crisis del software
Con la aparición de la informática, se empezó a implantar sistemas de información
donde la mayor parte de la carga de esos sistemas se la llevaba el ordenador. Empezó a
crearse software específico para la manipulación de los sistemas de información.
Inicialmente ese software no constaba de demasiadas instrucciones, pero al
aumentar las necesidades de gestión de datos, los programadores tuvieron que empezar
a codificar miles y miles de instrucciones.](https://d2z384uprhdr6y.cloudfront.net/R02JAnzqw5kFQrZ1aoUGmZM_UsMncuIEkZJ-8WVh3Ug/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMy1sLndlYnA=.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[3]
Tras esos primeros años, ocurrió un problema que se conoció como la crisis del
software. El problema es que el código creció espectacularmente de tamaño de modo
que nuevas necesidades por parte de la empresa desembocaban en una cantidad
interminable de correcciones en el software, lo que le hacía poco productivo (se
gastaba demasiado en él).
La solución a esta crisis (todavía no del todo resuelta por culpa de una mala
concienciación profesional en el sector) es la aportación de personal más cualificado y
de metodologías profesionales. A este punto es al que se dedica la ingeniería del
software.
componentes de un sistema de información electrónico
En el caso de una gestión electrónica de la información (lo que actualmente se
considera un sistema de información), los componentes son:
Å Datos. Se trata de la información relevante que almacena y gestiona el sistema de
información
Å Hardware. Equipamiento físico que se utiliza para gestionar los datos
Å Software. Aplicaciones que permiten el funcionamiento adecuado del sistema
Å Recursos humanos. Personal que maneja el sistema de información
[1.1.2] tipos de sistemas de información
En la evolución de los sistemas de información ha habido dos puntos determinantes, que
han formado los dos tipos fundamentales de sistemas de información.
sistemas de información orientados al proceso
En estos sistemas de información se crean diversas aplicaciones (software) para
gestionar diferentes aspectos del sistema. Cada aplicación realiza unas determinadas
operaciones. Los datos de dichas aplicaciones se almacenan en archivos digitales dentro
de las unidades de almacenamiento del ordenador (a veces en archivos binarios, o en
hojas de cálculo, ...).
Cada programa almacena y utiliza sus propios datos de forma un tanto caótica. La
ventaja de este sistema (la única ventaja), es que los procesos eran independientes por
lo que la modificación de uno no afectaba al resto. Pero tiene grandes inconvenientes:
Å Coste de almacenamiento elevado. Al almacenarse varias veces el mismo dato, se
requiere más espacio en los discos. Luego se agotarán antes.
Å Datos redundantes. Ya que se repiten continuamente
Å Probabilidad alta de inconsistencia en los datos. Ya que un proceso cambia sus
datos y no el resto. Por lo que el mismo dato puede tener valores distintos según
qué aplicación acceda a él.
Å Difícil modificación en los datos Debido a la probabilidad de inconsistencia. Para
que ésta no exista, cada modificación se debe repetir en todas las copias del dato
(algo que normalmente es imposible).
Å Tiempos de procesamiento elevados. Al no poder optimizar el espacio de
almacenamiento.](https://d2z384uprhdr6y.cloudfront.net/AjSMM8Ld16XOPlESD8s_q03SyCBmmnEh2VN69WC2hag/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNC1sLndlYnA=.webp)
![Sistemas Gestores de Bases de Datos
La gestión de los datos
[4]
A estos sistemas se les llama sistemas de ficheros. Se consideran también así a los
sistemas que utilizan programas ofimáticos (como Word y Excel) para gestionar sus
datos. De hecho estos sistemas producen los mismos (si no más) problemas.
sistemas de información orientados a los datos. bases de datos
En este tipo de sistemas los datos se centralizan en una base de datos común a todas
las aplicaciones. Estos serán los sistemas que estudiaremos en este curso.
En esos sistemas los datos se almacenan en una única estructura lógica que es
utilizable por las aplicaciones. A través de esa estructura se accede a los datos que son
comunes a todas las aplicaciones.
ventajas
Å Independencia de los datos y los programas y procesos. Esto permite modificar
los datos sin modificar el código de las aplicaciones.
Å Menor redundancia. No hace falta tanta repetición de datos. Sólo se indica la
forma en la que se relacionan los datos.
Å Integridad de los datos. Mayor dificultad de perder los datos o de realizar
incoherencias con ellos.
Å Mayor seguridad en los datos. Al permitir limitar el acceso a los usuarios. Cada
tipo de usuario podrá acceder a unas cosas..
Å Datos más documentados. Gracias a los metadatos que permiten describir la
información de la base de datos.
Å Acceso a los datos más eficiente. La organización de los datos produce un
resultado más óptimo en rendimiento.
Å Menor espacio de almacenamiento. Gracias a una mejor estructuración de los
datos.
desventajas
Å Instalación costosa. El control y administración de bases de datos requiere de un
software y hardware poderoso
Å Requiere personal cualificado. Debido a la dificultad de manejo de este tipo de
sistemas.
Å Implantación larga y difícil. Debido a los puntos anteriores. La adaptación del
personal es mucho más complicada y lleva bastante tiempo.
Å Ausencia de estándares reales. Lo cual significa una excesiva dependencia hacia
los sistemas comerciales del mercado. Aunque, hoy en día, una buena parte de esta
tecnología está aceptada como estándar de hecho.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/U4K-NZZi6wFqqd34GKJSEABP9bvt-F1Jy14Z63YJ2Io/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNS1sLndlYnA=.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[5]
[1.2]
Sistemas de base de datos
[1.2.1] concepto y objetivos
Como se ha comentado anteriormente, cuando los datos de un sistema de información
se almacenan en una única estructura, se llama base de datos.
Una base de datos es una colección de datos almacenados en un soporte
informático permanente de forma que sea posible obtener la relación entre los
datos a través de un esquema conceptual que oculte la física real de los datos.
El objetivo es que las aplicaciones puedan acceder a los datos sin necesidad de
conocer exactamente cómo están almacenados los datos. Esto se consigue con un
esquema conocido como esquema conceptual. Cualquier desarrollador que conozca ese
esquema puede acceder a los datos desde cualquier aplicación.
[1.2.2] elementos de un sistema de base de datos
Los elementos de un sistema de base de datos son los mismos que los de un sistema de
información. Se comentan a continuación para concretar un poco más la información
que ya poseíamos:
Å Hardware. Máquinas en las que se almacenan las bases de datos. Incorporan
unidades de almacenamiento masivo para este fin.
Å Software. Es el sistema gestor de bases de datos. La aplicación que permite el
manejo de la base de datos.
Å Datos. Incluyen los datos que se necesitan almacenar y los metadatos que son datos
que sirven para describir lo que se almacena en la base de datos.
Å Usuarios. Personas que manipulan los datos del sistema. Hay tres categorías:
² Usuarios finales. Aquellos que utilizan datos de la base de datos para su
trabajo cotidiano que no tiene por qué tener que ver con la informática.
Normalmente no utilizan la base de datos directamente, si no que utilizan
aplicaciones creadas para ellos a fin de facilitar la manipulación de los datos.
Estos usuarios sólo acceden a ciertos datos.
² Desarrolladores. Analistas y programadores encargados de generar
aplicaciones para los usuarios finales.
² Administradores. También llamados DBA (Data Base Administrator), se
encargan de gestionar las bases de datos.
Hay que tener en cuenta que las necesidades de los usuarios son muy diferentes en
función del tipo de usuario que sean: a los finales les interesa la facilidad de uso, a los
desarrolladores la potencia y flexibilidad de los lenguajes incorporados del sistema de
bases de datos, a los administradores herramientas de gestión avanzada para la base de
datos.](https://d2z384uprhdr6y.cloudfront.net/QpMvykZ9ufsLjRU0f8BGnv4aaxc6-AL5LQXl-2wcKDg/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNi1sLndlYnA=.webp)
![Sistemas Gestores de Bases de Datos
La gestión de los datos
[6]
[1.2.3] estructura de una base de datos
Las bases de datos están compuestas (como ya se han comentado), de datos y de
metadatos. Los metadatos son datos (valga la redundancia) que sirven para especificar
la estructura de la base de datos; por ejemplo qué tipo de datos se almacenan (si son
texto o números o fechas ...), qué nombre se le da a cada dato (nombre, apellidos,...),
cómo están agrupados, cómo se relacionan,....
De este modo se producen dos visiones de la base de datos:
Å Estructura lógica o conceptual. Indica la composición y distribución teórica de la
base de datos. La estructura lógica sirve para que las aplicaciones puedan utilizar
los elementos de la base de datos sin saber realmente cómo se están almacenando.
Å Estructura física. Es la estructura de los datos tan cual se almacenan en las
unidades de disco. La correspondencia entre la estructura lógica y la física se
almacena en la base de datos (en los metadatos).](https://d2z384uprhdr6y.cloudfront.net/U2aLRKglIYvTN661o0TFAx4dD2NeTNtVjkbDPF7Vhc4/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNy1sLndlYnA=.webp)
![[7]
[Unidad 2]
sistemas
gestores de
bases de datos
[2.1]
objetivo de los SGBD
Un sistema gestor de bases de datos o SGBD (aunque se suele utilizar más a menudo las
siglas DBMS procedentes del inglés, Data Base Management System) es el software
que permite a los usuarios procesar, describir, administrar y recuperar los datos
almacenados en una base de datos.
En estos Sistemas se proporciona un conjunto coordinado de programas,
procedimientos y lenguajes que permiten a los distintos usuarios realizar sus tareas
habituales con los datos, garantizando además la seguridad de los mismos.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/jo6eDM-tUzQFxg1fgjVpFapV1qzRTdggKSeCRT4nWvo/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfOC1sLndlYnA=.webp)
![Sistemas Gestores de Bases de Datos
sistemas gestores de bases de datos
[8]
DBMS
Ilustración 1, Esquema del funcionamiento y
utilidad de un sistema gestor de bases de datos
El éxito del SGBD reside en mantener la seguridad e integridad de los datos.
Lógicamente tiene que proporcionar herramientas a los distintos usuarios. Entre las
herramientas que proporciona están:
Å Herramientas para la creación y especificación de los datos. Así como la
estructura de la base de datos.
Å Herramientas para administrar y crear la estructura física requerida en las
unidades de almacenamiento.
Å Herramientas para la manipulación de los datos de las bases de datos, para
añadir, modificar, suprimir o consultar datos.
Å Herramientas de recuperación en caso de desastre
Å Herramientas para la creación de copias de seguridad
Å Herramientas para la gestión de la comunicación de la base de datos
Å Herramientas para la creación de aplicaciones que utilicen esquemas externos de
los datos
Å Herramientas de instalación de la base de datos
Å Herramientas para la exportación e importación de datos
[2.2]
niveles de abstracción de una base de
datos
[2.2.1] introducción
En cualquier sistema de información se considera que se pueden observar los datos
desde dos puntos vista:](https://d2z384uprhdr6y.cloudfront.net/RuboXifchDPEBCDoJVhNvMbvOto1Qcq_larSOiuUvk8/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfOS1sLndlYnA=.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[9]
Å Vista externa. Esta es la visión de los datos que poseen los usuarios del Sistema de
Información.
Å Vista física. Esta es la forma en la que realmente están almacenados los datos.
En un Sistema de ficheros, los usuarios ven los datos desde las aplicaciones creadas por
los programadores. Esa vista pueden ser formularios, informes visuales o en papel,...
Pero la realidad física de esos datos, tal cual se almacenan en los discos, no la ven. Esa
visión está reservada a los administrados.
En el caso de los Sistemas de Base de datos, se añade una tercera vista, que es la
vista conceptual. Esa vista se sitúa entre la física y la externa. Se habla pues en Bases
de datos de la utilización de tres esquemas para representar los datos.
[2.2.2] esquema físico
Representa la forma en la que están almacenados los datos. Esta visión sólo la requiere
el administrador. El administrador la necesita para poder gestionar más eficientemente
la base de datos.
En este esquema es donde aparecen las unidades de disco, archivos y carpetas del
sistema.
[2.2.3] esquema conceptual
Se trata de un esquema teórico de los datos en la que figuran organizados en
estructuras reconocibles del mundo real y en el que también aparece la forma de
relacionarse los datos.
Esta estructura es utilizada por el desarrollador, que necesita conocerla para al
crear aplicaciones saber como acceder. Todas las aplicaciones que se crean sobre la
base de datos utilizan este esquema.
Realmente cuando se habla del diseño de la base de datos, se suele referir a este
esquema. El esquema conceptual lo realiza el diseñador de la base de datos.
[2.2.4] esquema externo
Se trata de la visión de los datos que poseen los usuarios finales. Esa visión es la que
obtienen a través de las aplicaciones. Las aplicaciones creadas por los desarrolladores
abstraen la realidad conceptual de modo que el usuario no conoce las relaciones entre
los datos, como tampoco conoce todos los datos que realmente se almacenan.
Realmente cada aplicación produce un esquema externo diferente (aunque algunos
pueden coincidir) o vistas de usuario. El conjunto de todas las vistas de usuario es lo
que se denomina esquema externo global.
[2.2.5] independencia en los esquemas
Lo interesante de estos esquemas es que trabajan independientemente. Cada usuario
utiliza el esquema que necesita sin saber nada del resto. Esa independencia se traduce
en:
Å Independencia física de los datos. Aunque el esquema físico cambie, el esquema
conceptual no debe verse afectado. En la práctica esto significa que aunque la base
de datos se almacene en otro disco duro, la parte conceptual de la base de datos no
debe verse afectada. No habrá que modificar dicho esquema.](https://d2z384uprhdr6y.cloudfront.net/gM74lOx6K8QyOfZV5EB2KDa0-v1_d3u-hXTKnWHpTFA/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTAtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
sistemas gestores de bases de datos
[10]
Å Independencia lógica de los datos. Significa que aunque se modifique los datos del
esquema conceptual, las vistas que poseen las aplicaciones (los esquemas externos)
no se verán afectados.
[2.3]
funciones
Los SGBD tienen que realizar tres tipos de funciones para ser considerados válidos.
[2.3.1] función de descripción o definición
Permite al diseñador de la base de datos crear las estructuras apropiadas para integrar
adecuadamente los datos. Este función es la que permite definir las tres estructuras de
la base de datos (relacionadas con sus tres esquemas).
Å Estructura interna
Å Estructura conceptual
Å Estructura externa
Esta función se realiza mediante el lenguaje de descripción de datos o DDL. Mediante
ese lenguaje:
Å Se definen las estructuras de datos
Å Se definen las relaciones entre los datos
Å Se definen las reglas que han de cumplir los datos
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/YFnE0ciimoZZoyIip9k4Q2h5hyKFov9nKvqYvSXF9xc/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTEtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[11]
[2.3.2] función de manipulación
Permite modificar y utilizar los datos de la base de datos. Se realiza mediante el
lenguaje de modificación de datos o DML. Mediante ese lenguaje se puede:
Å Añadir datos
Å Eliminar datos
Å Modificar datos
Å Buscar datos
Actualmente se suele distinguir la función de buscar datos respecto del resto. Para lo
cual se proporciona un lenguaje de consulta de datos o DQL.
[2.3.3] función de control
Mediante esta función los administradores poseen mecanismos para determinar las
visiones de los datos permitidas a cada usuario, además de proporcionar elementos de
creación y modificación de esos usuarios.
Se suelen incluir aquí las tareas de copia de seguridad, carga de ficheros, auditoria,
protección ante ataques externos, configuración del sistema,...
El lenguaje que implementa esta función es el lenguaje de control de datos o DCL.
[2.4]
estandarización
Es uno de los aspectos que todavía sigue pendiente. Desde la aparición de los primeros
gestores de base de datos se intentó llegar a un acuerdo para que hubiera una
estructura común para todos ellos, a fin de que el aprendizaje y manejo de este
software fuera más provechoso y eficiente.
El acuerdo nunca se ha conseguido del todo, no hay estándares aceptados del todo.
Aunque sí hay unas cuentas propuestas de estándares que sí funcionan como tales.
[2.4.1] organismos de estandarización
Los intentos por conseguir una estandarización han estado promovidos por organismos
de todo tipo. Algunos son estatales, otros privados y otros promovidos por los propios
usuarios. Los tres que han tenido gran relevancia en el campo de las bases de datos son
ANSI/SPARC/X3, CODASYL y ODMG. Los organismos grandes (que recogen grandes
responsabilidades) dividen sus tareas en comités, y éstos en grupos de trabajo que se
encargan de temas concretos.
[2.4.2] SC21
Å ISO (International Organization for Standardization). Es un organismo
internacional de definición de estándares de gran prestigio.](https://d2z384uprhdr6y.cloudfront.net/JNyv17JPU9XkTieJHo8nE9NGiHuf8W4VRRz8_XXIztc/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTItbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
sistemas gestores de bases de datos
[12]
Å IEC (International Electrotechnical Commission). Organismo de definición de
normas en ambientes electrónicos
Å JTC1 (Joint Technical Committee). Comité formado por los dos organismos
anteriores encargado de diversos proyectos. En el campo de las bases de datos, el
subcomité SC21 (en el que participan otros organismos nacionales, como el español
AENOR) posee un grupo de trabajo llamado WG 3 que se dedica a las bases de
datos. Este grupo de trabajo es el que define la estandarización del lenguaje SQL
entre otras cuestiones.
[2.4.3] DBTG Codasyl
Codasyl (Conference on Data System Languages) es el nombre de una conferencia de
finales de los años 60 en la que participaron organismos privados y públicos del gobierno
de Estados Unidos con la finalidad de definir estándares (Codasyl definió el lenguaje
COBOL) para la informática de gestión.
De ahí salió DBTG (Data Base Task Group, grupo de tareas para bases de datos)
grupo que definió el modelo en red de bases de datos que desde entonces se llama
Codasyl o DBTG y que fue aceptado por la ANSI
[2.4.4] ANSI/X3/SPARC
ANSI (American National Science Institute) es un organismo científico de Estados
Unidos que ha definido diversos estándares en el campo de las bases de datos. X3 es la
parte de ANSI encargada de los estándares en el mundo de la electrónica. Finalmente
SPARC System Planning and Repairments Committee, comité de planificación de
sistemas y reparaciones es una subsección de X3 encargada de los estándares en Sistemas
Informáticos en especial del campo de las bases de datos. Su logro fundamental ha sido
definir un modelo de referencia para las bases de datos (que se estudiará posteriormente).
ANSI
Estados
Unidos
X3
(Otras secciones)
SPARC
ISO Internacional
España AENOR
Francia AFNOR
BSI
Reino
Unido
Otros
JTC1
(Otras secciones)
(Otras secciones)
Ilustración 2, Relación entre los organismos de estandarización](https://d2z384uprhdr6y.cloudfront.net/0H_CcgKgo3fXjlRHWv4N2D_fRcsrYt3Z0Vin7tMpVuM/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTMtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[13]
En la actualidad ANSI para Estados Unidos e ISO para todo el mundo son nombres
equivalentes en cuanto a estandarización de bases de datos, puesto que se habla ya de
un único modelo de sistema de bases de datos.
[2.4.5] Modelo ANSI/X3/SPARC
El grupo ANSI ha marcado la referencia para la construcción de SGBD. Se basa en los
estudios anteriores en los que se indicaban tres niveles de abstracción de la base de
datos. ANSI profundiza más en esta idea y define cómo debe ser el proceso de creación
y utilización de estos niveles.
En el modelo ANSI se indica que hay tres modelos (externo, conceptual e interno)
entendiendo por modelo las normas que permiten crear esquemas (diseños de la base de
datos). Los esquemas externos reflejan la información preparada para el usuario final,
el esquema conceptual refleja los datos y relaciones de la base de datos y el esquema
interno la preparación de los datos para ser almacenados.
Ilustración 3, Niveles en el modelo ANSI
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/rjgksR_Lw-xQqBSovjPsK20TniNiUtOMzhAkDITGwNo/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTQtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
sistemas gestores de bases de datos
[14]
Ilustración 4, Arquitectura ANSI
El paso de un esquema a otro se realiza utilizando un interfaz o función de traducción.
En su modelo, la ANSI no indica cómo se debe realizar esta función, sólo que debe
existir.
La arquitectura completa (Ilustración 4) esta dividida en dos secciones, la zona de
definición de datos y la de manipulación. Esa arquitectura muestra las funciones
realizadas por humanos y las realizadas por programas.
En la fase de definición, una serie de interfaces permiten la creación de los
metadatos que se convierten en el eje de esta arquitectura. La creación de la base de
datos comienza con la elaboración del esquema conceptual realizándola el
administrador de la empresa (actualmente es el diseñador, pero ANSI no lo llamó así).
Ese esquema se procesa utilizando un procesador del esquema conceptual
(normalmente una herramienta CASE, interfaz 1 del dibujo anterior) que lo convierte
en los metadatos (interfaz 2).
La interfaz 3 permite mostrar los datos del esquema conceptual a los otros dos
administradores: el administrador de la base de datos y el de aplicaciones (el
desarrollador). Mediante esta información construyen los esquemas internos y externos](https://d2z384uprhdr6y.cloudfront.net/Gc85JRNksP5OOH7kcoKfppCQLlAwUdKBag5TL6pGIcQ/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTUtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[15]
mediante las interfaces 4 y 5 respectivamente, los procesadores de estos esquemas
almacenan la información correspondiente a estos esquemas en los metadatos
(interfaces 6 y 7).
En la fase de manipulación el usuario puede realizar operaciones sobre la base de
datos usando la interfaz 8 (normalmente una aplicación) esta petición es transformada
por el transformador externo/conceptual que obtiene el esquema correspondiente
ayudándose también de los metadatos (interfaz 9). El resultado lo convierte otro
transformador en el esquema interno (interfaz 10) usando también la información de
los metadatos (interfaz 11). Finalmente del esquema interno se pasa a los datos usando
el último transformador (interfaz 12) que también accede a los metadatos (interfaz
13) y de ahí se accede a los datos (interfaz 14). Para que los datos se devuelvan al
usuario en formato adecuado para él se tiene que hacer el proceso contrario (observar
dibujo).
[2.4.6] Estructuras operacionales
Actualmente casi todos los sistemas gestores de base de datos poseen también la misma
idea operacional en la que se entiende que la base de datos se almacena en un servidor
y hay una serie de clientes que pueden acceder a los datos del mismo. Las posibilidades
son:
Å Estructura Cliente-Servidor. Estructura clásica, la base de datos y su SGBD están
en un servidor al cual acceden los clientes. El cliente posee software que permite al
usuario enviar instrucciones al SGBD en el servidor y recibir los resultados de estas
instrucciones. Para ello el software cliente y el servidor deben utilizar software de
comunicaciones en red.
Å Cliente multi-servidor. Ocurre cuando los clientes acceden a datos situados en más
de un servidor. También se conoce esta estructura como base de datos distribuida.
El cliente no sabe si los datos están en uno o más servidores, ya que el resultado es
el mismo independientemente de dónde se almacenan los datos. En esta estructura
hay un servidor de aplicaciones que es el que recibe las peticiones y el encargado
de traducirlas a los distintos servidores de datos para obtener los resultados. Una
posibilidad muy extendida hoy en día es la posibilidad Cliente/Servidor
Web/Servidor de datos, el cliente se conecta a un servidor mediante un navegador
web y desde las páginas de este ejecuta las consultas. El servidor web traduce esta
consulta al servidor (o servidores) de datos.
[2.5]
recursos humanos de las bases de datos
Intervienen (como ya se ha comentado) muchas personas en el desarrollo y
manipulación de una base de datos. Habíamos seleccionado cuatro tipos de usuarios
(administradores/as, desarrolladores, diseñadores/as y usuarios/as). Ahora vamos a
desglosar aún más esta clasificación.](https://d2z384uprhdr6y.cloudfront.net/BxkzqIZ2Srm9M2AjgAZMPwtpxWHgseVFpL-qvJYYxqo/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTYtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
sistemas gestores de bases de datos
[16]
[2.5.1] informáticos
Lógicamente son los profesionales que definen y preparan la base de datos. Pueden ser:
Å Directivos/as. Son los organizadores y coordinadores del proyecto a desarrollar.
Esto significa que son los encargados de decidir los recursos que se pueden utilizar,
planificar el tiempo y las tareas, la atención al usuario y de dirigir las entrevistas y
reuniones pertinentes.
Å Analistas. Son los encargados de controlar el desarrollo de la base de datos
aprobada por la dirección. Son además los diseñadores de la base de datos
(especialmente de los esquemas interno y conceptual) y los coordinadores de la
programación de la misma.
Å Administradores/as de las bases de datos. Definen la seguridad de la base de datos
y gestionan las copias de seguridad y la gestión física de la base de datos. Los
analistas suelen tener esta funcionalidad cuando la base de datos está creada.
Å Desarrolladores/as o programadores/as. Encargados de la realización de las
aplicaciones de usuario de la base de datos.
Å Equipo de mantenimiento. Encargados de dar soporte a los usuarios en el trabajo
diario (suelen incorporar además tareas administrativas).
[2.5.2] usuarios
Å Expertos/as. Utilizan el lenguaje de manipulación de datos (DML) para acceder a la
base de datos. Son usuarios que utilizan la base de datos para gestión avanzada de
decisiones.
Å Habituales. Utilizan las aplicaciones creadas por los desarrolladores para consultar
y actualizar los datos. Son los que trabajan en la empresa a diario con estas
herramientas y el objetivo fundamental de todo el desarrollo de la base de datos.
Å Ocasionales. Son usuarios que utilizan un acceso mínimo a la base de datos a través
de una aplicación que permite consultar ciertos datos. Serían por ejemplo los
usuarios que consultan el horario de trenes a través de Internet.
[2.6]
componentes del SGBD
[2.6.1] estructura multicapa
Un SGBD está en realidad formado por varias capas que actúan como interfaces entre el
usuario y los datos. El propio ANSI/X3/SPARC introdujo una mejora de su modelo en
1988 a través de un grupo de trabajo llamado UFTG (User Facilities Task Group, grupo
de trabajo para las facilidades de usuario). Este modelo toma como objeto principal, al
usuario habitual de la base de datos y orienta el funcionamiento de la base de datos de
modo que este usuario ignora el funcionamiento externo.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/0N7Qpe9RncXiFyDX5acJ88KE7eTlYsV8FjAbkuvwuz8/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTctbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[17]
Desde esta óptica para llegar a los datos hay que pasar una serie de capas que poco
a poco van entrando más en la realidad física de la base de datos. Esa estructura se
muestra en la siguiente figura:
Ilustración 5, Modelo de referencia de las facilidades de usuario
[2.6.2] núcleo
El núcleo de la base de datos es el encargado de traducir las operaciones que le llegan a
instrucciones ejecutables por el sistema operativo en el lenguaje que éste último
requiera.
[2.6.3] diccionario de datos
Se trata del elemento que posee todos los metadatos. Gracias a esta capa las solicitudes
de los clientes se traducen en instrucciones que hacen referencia al esquema interno de
la base de datos. La capa de acceso a datos es la que permite comunicar a las
aplicaciones de usuario con el diccionario de datos a través de las herramientas de
gestión de datos que incorpore el SGBD.
[2.6.4] facilidades de usuario
Son las herramientas que proporciona el SGBD a los usuarios para permitir un acceso
más sencillo a los datos. Actúan de interfaz entre el usuario y la base de datos, y son el
único elemento que maneja el usuario.](https://d2z384uprhdr6y.cloudfront.net/qouSRfhULPoQfkD5ouZ_DW4dnisPAlA_ZeZd91nkOG8/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTgtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
sistemas gestores de bases de datos
[18]
[2.6.5] funcionamiento del SGBD
El esquema siguiente presenta el funcionamiento típico de un SGBD:
Ilustración 6, Esquema del funcionamiento de un SGBD
El esquema anterior reproduce la comunicación entre un proceso de usuario que desea
acceder a los datos y el SGBD:
[1] El proceso lanzado por el usuario llama al SGBD indicando la porción de la
base de datos que se desea tratar
[2] El SGBD traduce la llamada a términos del esquema lógico de la base de
datos. Accede al esquema lógico comprobando derechos de acceso y la
traducción física
[3] El SGBD obtiene el esquema físico
[4] El SGBD traduce la llamada a los métodos de acceso del Sistema Operativo
que permiten acceder a los datos requeridos
[5] El Sistema Operativo accede a los datos tras traducir las órdenes dadas por el
SGBD
[6] Los datos pasan del disco a una memoria intermedia o buffer. En ese buffer se
almacenarán los datos según se vayan recibiendo
[7] Los datos pasan del buffer al área de trabajo del usuario (ATU) del proceso
del usuario.](https://d2z384uprhdr6y.cloudfront.net/ZCGSlQMWmTh0S2lMuPPi5k5r8ap0ZsIOldQN1OGlpjk/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTktbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[19]
[8] El SGBD devuelve indicadores en los que manifiesta si ha habido errores o
advertencias a tener en cuenta. Esto se indica al área de comunicaciones del
proceso de usuario. Si las indicaciones son satisfactorias, los datos de la ATU
serán utilizables por el proceso de usuario.
[2.7]
tipos de SGBD
[2.7.1] introducción
Como se ha visto en los apartados anteriores, resulta que cada SGBD puede utilizar un
modelo diferente para los datos. Por lo que hay modelos conceptuales diferentes según
que SGBD utilicemos.
No obstante existen modelos lógicos comunes, ya que hay SGBD de diferentes tipos.
En la realidad el modelo ANSI se modifica para que existan dos modelos internos: el
modelo lógico (referido a cualquier SGBD de ese tipo) y el modelo propiamente interno
(aplicable sólo a un SGBD en particular). De hecho en la práctica al definir las bases de
datos desde el mundo real hasta llegar a los datos físicos se pasa por los siguientes
esquemas:
Ilustración 7, Modelos de datos utilizados en el desarrollo de una BD
Por lo tanto la diferencia entre los distintos SGBD está en que proporcionan diferentes
modelos lógicos.
diferencias entre el modelo lógico y el conceptual
Å El modelo conceptual es independiente del DBMS que se vaya a utilizar. El lógico
depende de un tipo de SGBD en particular
Å El modelo lógico es más cercano al ordenador
Å El modelo conceptual es más cercano al usuario, el lógico es el encargado de
establecer el paso entre el modelo informático y el modelo físico del sistema.
Algunos ejemplos de modelos conceptuales son:
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/CgHQ7azmDFGtgV7bKkzhp1T-8lZgCSpm4l1tDr1gwn4/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMjAtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
sistemas gestores de bases de datos
[20]
Å Modelo E/R
Å Modelo RM/T
Å Modelos semánticos
Ejemplos de modelos lógicos son:
Å Modelo relacional
Å Modelo Codasyl
Å Modelo Jerárquico
A continuación se comentarán los modelos lógicos más importantes.
[2.7.2] modelo jerárquico
Era utilizado por los primeros SGBD, desde que IBM lo definió para su IMS (Information
Management System, Sistema Administrador de Información) en 1970. Se le llama
también modelo en árbol debido a que utiliza una estructura en árbol para organizar los
datos.
La información se organiza con un jerarquía en la que la relación entre las entidades
de este modelo siempre es del tipo padre / hijo. De esta forma hay una serie de nodos
que contendrán atributos y que se relacionarán con nodos hijos de forma que puede
haber más de un hijo para el mismo padre (pero un hijo sólo tiene un padre).
Los datos de este modelo se almacenan en estructuras lógicas llamadas segmentos.
Los segmentos se relacionan entre sí utilizando arcos.
La forma visual de este modelo es de árbol invertido, en la parte superior están los
padres y en la inferior los hijos.
Departamento
Documentos Personal
Tareas
Ilustración 8, Ejemplo de esquema jerárquico
Este esquema está en absoluto desuso ya que no es válido para modelar la mayoría de
problemas de bases de datos.
[2.7.3] modelo en red (Codasyl)
Es un modelo que ha tenido una gran aceptación (aunque apenas se utiliza
actualmente). En especial se hizo popular la forma definida por Codasyl a principios de
los 70 que se ha convertido en el modelo en red más utilizado.](https://d2z384uprhdr6y.cloudfront.net/tuEO_BIhKoNl8WdDqtu4MIyuAOPzRIpVUZm9L2SXFh0/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMjEtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[21]
El modelo en red organiza la información en registros (también llamados nodos) y
enlaces. En los registros se almacenan los datos, mientras que los enlaces permiten
relacionar estos datos. Las bases de datos en red son parecidas a las jerárquicas sólo
que en ellas puede haber más de un padre.
En este modelo se pueden representar perfectamente cualquier tipo de relación
entre los datos (aunque el Codasyl restringía un poco las relaciones posibles), pero hace
muy complicado su manejo.
Ilustración 9, ejemplo de diagrama de estructura de datos Codasyl
[2.7.4] modelo relacional
En este modelo los datos se organizan en tablas cuyos datos se relacionan. Es el modelo
más popular y se describe con más detalle en los temas siguientes.
[2.7.5] modelo de bases de datos orientadas a objetos
Desde la aparición de la programación orientada a objetos (POO u OOP) se empezó a
pensar en bases de datos adaptadas a estos lenguajes. La programación orientada a
objetos permite cohesionar datos y procedimientos, haciendo que se diseñen
estructuras que poseen datos (atributos) en las que se definen los procedimientos
(operaciones) que pueden realizar con los datos. En las bases orientadas a objetos se
utiliza esta misma idea.
A través de este concepto se intenta que estas bases de datos consigan arreglar las
limitaciones de las relacionales. Por ejemplo el problema de la herencia (el hecho de
que no se puedan realizar relaciones de herencia entre las tablas), tipos definidos por el
usuario, disparadores (triggers) almacenables en la base de datos, soporte multimedia...
Se supone que son las bases de datos de tercera generación (la primera fue las bases
de datos en red y la segunda las relacionales), lo que significa que el futuro parece
estar a favor de estas bases de datos. Pero siguen sin reemplazar a las relacionales,
aunque son el tipo de base de datos que más está creciendo en los últimos años.
Su modelo conceptual se suele diseñar en UML y el lógico actualmente en ODMG
(Object Data Management Group, grupo de administración de objetos de datos,
organismo que intenta crear estándares para este modelo).
[2.7.6] bases de datos objeto relacionales
Tratan de ser un híbrido entre el modelo relacional y el orientado a objetos. El
problema de las bases de datos orientadas a objetos es que requieren reinvertir capital
y esfuerzos de nuevo para convertir las bases de datos relacionales en bases de datos
orientadas a objetos. En las bases de datos objeto relacionales se intenta conseguir una](https://d2z384uprhdr6y.cloudfront.net/5k_j7Ki_ICwy3aj85DAs7QEtQiW_C_foX04nuxcL830/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMjItbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
sistemas gestores de bases de datos
[22]
compatibilidad relacional dando la posibilidad de integrar mejoras de la orientación a
objetos.
Estas bases de datos se basan en el estándar SQL 99. En ese estándar se añade a las
bases relacionales la posibilidad de almacenar procedimientos de usuario, triggers, tipos
definidos por el usuario, consultas recursivas, bases de datos OLAP, tipos LOB,...
Las últimas versiones de la mayoría de las clásicas grandes bases de datos
relacionales (Oracle, SQL Server, Informix, ...) son objeto relacionales.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/kjXSEG73d-DJ_hQvAOcyu_HU5b7UPttH4DeHfzdzxIA/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMjMtbC53ZWJw.webp)
![[23]
[Unidad 3]
bases de datos
relacionales
[3.1]
el modelo relacional
[3.1.1] introducción
Edgar Frank Codd a finales definió las bases del modelo relacional a finales de los 60.
En 1970 publica el documento “A Relational Model of data for Large Shared Data
Banks” (“Un modelo relacional de datos para grandes bancos de datos
compartidos”). Actualmente se considera que ese es uno de los documentos más
influyentes de toda la historia de la informática.
Anteriormente el único modelo teórico estandarizado era el Codasyl que se utilizó
masivamente en los años 70. Codd introduce el término relación (en inglés
relationship, a veces traducido como interrelación) que es el que aglutina los datos de
forma independiente a lo que será su almacenamiento físico.
Lo que Codd intenta precisamente es que este modelo oculte completamente
conceptos y términos de la computadora en sí, es decir se abstrae más que los modelos
anteriores.
Trabajaba para IBM, empresa que tardó un poco en implementar sus bases. De hecho
fueron otras empresas (en especial Oracle) las que implementaron sus teorías. Pocos
años después el modelo se empezó a utilizar cada vez más, hasta finalmente ser el](https://d2z384uprhdr6y.cloudfront.net/ht5BfOptkF7myi3K9FEmGAzruJf89svrA-yZiYl_TrU/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMjQtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
bases de datos relacionales
[24]
modelo de bases de datos más popular. Hoy en día casi todas las bases de datos siguen
este modelo.
[3.1.2] objetivos
Codd perseguía estos objetivos con su modelo:
Å Independencia física. La forma de almacenar los datos, no debe influir en su
manipulación lógica. Si el almacenamiento físico cambia, los usuarios no tienen ni
siquiera porque enterarse, seguirán funcionando sus aplicaciones.
Å Independencia lógica. Las aplicaciones que utilizan la base de datos no deben ser
modificadas por que se modifiquen elementos de la base de datos. Es decir, añadir,
borrar y suprimir datos, no influye en las vistas de los usuarios.
Å Flexibilidad. La base de datos ofrece fácilmente distintas vistas en función de los
usuarios y aplicaciones.
Å Uniformidad. Las estructuras lógicas siempre tienen una única forma conceptual
(las tablas)
Å Sencillez.
[3.1.3] historia del modelo relacional
Año Hecho
1970 Codd publica las bases del modelo relacional
1971-72 Primeros desarrollos teóricos
1973-78 Primeros prototipos (System R de IBM)
1978 Aparece el lenguaje QBE (Query By Example) lenguaje de
acceso relacional a los archivos VSAM de IBM
1979 Aparece Oracle, el primer SGBD relacional. Codd revisa su
modelo relacional y lanza el modelo RM/T como un intento
de subsanar sus deficiencias.
1980 Aparece Ingres, SGBD relacional basado en cálculo relacional.
Utilizaba el lenguaje Quel que era el favorito para las
universidades.
1981 Aparece SQL que se convertirá en el estándar en la creación
de bases de datos relacionales
1982 Aparece DB2, el sistema gestor de bases de datos
relacionales de IBM
1986 ANSI normaliza el SQL (SQL/ANSI)
1987 ISO también normaliza SQL. Es el SQL ISO(9075)
1989 ISO revisa el estándar y publica el estándar SQL Addendum
1990 Versión dos del modelo relacional (RM/V2) realizada por
Codd. Propuesta de Stonebraker para añadir al modelo
relacional capacidades de orientación a objetos.
1992 ISO publica el estándar SQL 92 (todavía el más utilizado)
1995 Manifiesto de Darwen y Date en el que animan a
reinterpretar el modelo relacional desde una perspectiva de
objetos.](https://d2z384uprhdr6y.cloudfront.net/dLelqCPNZYn4Lx7KLvS02HGXH-ko0vwgXRz4kKuG4zo/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMjUtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[25]
Año Hecho
1999 ISO publica un nuevo estándar que incluye características
más avanzadas. Se llama SQL 99
[3.2]
estructura de las bases de datos
relacionales
[3.2.1] relación o tabla
Según el modelo relacional (desde que Codd lo enunció) el elemento fundamental es
lo que se conoce como relación, aunque más habitualmente se le llama tabla (o también
array o matriz). Codd definió las relaciones utilizando un lenguaje matemático, pero se
pueden asociar a la idea de tabla (de filas y columnas) ya que es más fácil de entender.
Las relaciones constan de:
Å Atributos. Referido a cada dato que se almacena en la relación (nombre, dni,...).
Å Tuplas. Referido a cada elemento de la relación. Por ejemplo si una relación
almacena personas, una tupla representaría a una persona en concreto.
Puesto que una relación se representa como una tabla; podemos entender que las
columnas de la tabla son los atributos; y las filas, las tuplas.
atributo 1 atributo 2 atributo 3 .... atributo n
valor 1,1 valor 1,2 valor 1,3 .... valor 1,n Å tupla 1
valor 2,1 valor 2,2 valor 2,3 .... valor 2,n Å tupla 2
..... ..... ...... .... ..... ....
valor m,1 valor m,2 valor m,3 .... valor m,n Å tupla m
La tabla superior representa la estructura de una relación según el modelo de Codd.
[3.2.2] tupla
Cada una de las filas de la tabla. Se corresponde con la idea de registro. Representa por
tanto cada elemento individual de esa relación. Tiene que cumplir que:
Å Cada tupla se debe corresponder con un elemento del mundo real.
Å No puede haber dos tuplas iguales (con todos los valores iguales).
[3.2.3] dominio
Un dominio contiene todos los posibles valores que puede tomar un determinado
atributo. Dos atributos distintos pueden tener el mismo dominio.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/b9Nat_cd5qDJBuitZlMfRZ6ydOW8G4uLP3_X3jsgAMs/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMjYtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
bases de datos relacionales
[26]
Un dominio en realidad es un conjunto finito de valores del mismo tipo. A los
dominios se les asigna un nombre y así podemos referirnos a ese nombre en más de un
atributo.
La forma de indicar el contenido de un dominio se puede hacer utilizando dos
posibles técnicas:
Å Intensión. Se define el nomino indicando la definición exacta de sus posibles
valores. Por intensión se puede definir el dominio de edades de los trabajadores
como: números enteros entre el 16 y el 65 (un trabajador sólo podría tener una
edad entre 16 y 65 años).
Å Extensión. Se indican algunos valores y se sobreentiende el resto gracias a que se
autodefinen con los anteriores. Por ejemplo el dominio localidad se podría definir
por extensión así: Palencia, Valladolid, Villamuriel de Cerrato,...
[3.2.4] grado
Indica el tamaño de una relación en base al número de columnas (atributos) de la
misma. Lógicamente cuanto mayor es el grado de una relación, mayor es su complejidad
al manejarla.
[3.2.5] cardinalidad
Número de tuplas de una relación, o número de filas de una tabla.
[3.2.6] sinónimos
Los términos vistos anteriormente tienen distintos sinónimos según la nomenclatura
utilizada. A ese respecto se utilizan tres nomenclaturas:
Términos 1
(nomenclatura relacional)
Términos 2
(nomenclatura tabla)
Términos 3
(nomenclatura ficheros)
relación = tabla = fichero
tupla = fila = registro
atributo = columna = campo
grado = nº de columnas = nº de campos
cardinalidad = nº de filas = nº de registros
[3.2.7] definición formal de relación
Una relación está formada por estos elementos:
Å Nombre. Identifica la relación.
Å Cabecera de relación. Conjunto de todos los pares atributo-domino de la relación:
{ } ( ) Ai Di
n
i : =1 donde n es el grado.
Å Cuerpo de la relación. Representa el conjunto de m tuplas {t1, t2,... tn} que
forman la relación. Cada tupla es un conjunto de n pares atributo-valor {(Ai:Vij)},
donde Vij es el valor j del dominio Di asociado al atributo Ai.](https://d2z384uprhdr6y.cloudfront.net/9nS4YN-0cm0Iop5RBUdUKpGI5jBW7UD4pFAV-EKWctM/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMjctbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[27]
Å Esquema de la relación. Se forma con el nombre R y la cabecera. Es decir:
R{ } ( ) Ai Di
n
i : =1
Å Estado de la relación. Lo forman el esquema y el cuerpo.
Ejemplo:
Cliente
DNI Nombre Edad
12333944C Ana 52
12374678G Eva 27
28238232H Martín 33
Esquema: Cliente(DNI:DNI, Nombre:Nombre, Edad:Edad)
Cuerpo: {(DNI: “12333944C”, Nombre:”Ana”, Edad:52), (DNI: “12374678G”,
Nombre:”Eva”, Edad;52), (DNI: “28238232H”, Nombre:”Martín”,Edad:33)}
[3.2.8] tipos de tablas (o relaciones)
Å Persistentes. Sólo pueden ser borradas por los usuarios:
² Base. Independientes, se crean indicando su estructura y sus ejemplares.
² Vistas. Son tablas que sólo almacenan una definición de consulta, resultado
de la cual se produce una tabla cuyos datos proceden de las bases o de otras
vistas e instantáneas. Si los datos de las tablas base cambian, los de la vista
que utiliza esos datos también cambia.
² Instantáneas. Son vistas (creadas de la misma forma) que sí que almacenan
los datos que muestra, además de la consulta que dio lugar a esa vista. Sólo
modifican su resultado (actualizan los datos) siendo refrescadas por el
sistema cada cierto tiempo.
Å Temporales. Son tablas que se eliminan automáticamente por el sistema. Pueden
ser de cualquiera de los tipos anteriores. Las utiliza el SGBD como almacén
intermedio de datos.
[3.2.9] claves
clave candidata
Conjunto de atributos que identifican unívocamente cada tupla de la relación. Es decir
columnas cuyos valores no se repiten en ninguna otra tupla de esa tabla.
clave primaria
Clave candidata que se escoge como identificador de las tuplas. Se elige como primaria
la candidata que identifique mejor a cada tupla en el contexto de la base de datos.
Por ejemplo un campo con el DNI sería clave candidata de una tabla de clientes, si
esa relación tiene un campo de código de cliente, éste sería mejor candidato (y por lo
tanto clave principal) porque es mejor identificador para ese contexto.](https://d2z384uprhdr6y.cloudfront.net/Zi47UJDpp2r9MEvhBWCDlWefwuyn4jtwCL0M326YY98/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMjgtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
bases de datos relacionales
[28]
clave alternativa
Cualquier clave candidata que no sea primaria.
clave externa, ajena o secundaria
Son los datos de atributos de una tabla cuyos valores están relacionados con atributos
de otra tabla.
Por ejemplo en la tabla equipos tenemos estos datos:
Equipo Nº Equipo
Real Madrid 1
F.C. Barcelona 2
Athletic Bilbao 3
En la tabla anterior la clave principal es el atributo nº equipo. En otra tabla tenemos:
Nº Jugador Jugador Nº Equipo
1 Karanka 3
2 Ronaldinho 2
3 Raul 1
4 Beckham 1
El atributo Nº Equipo sirve para relacionar el Jugador con el equipo al que pertenece.
Ese campo en la tabla de jugadores es una clave secundaria.
[3.2.10] nulos
En los lenguajes de programación se utiliza el valor nulo para reflejar que un
identificador no tiene ningún contenido. Al programar en esos lenguajes se trata de un
valor que no permite utilizarse en operaciones aritméticas o lógicas.
En las bases de datos relacionales se utiliza con más posibilidades, aunque su
significado no cambia: valor vacío, se utiliza para diversos fines.
En claves secundarias indican que el registro actual no está relacionado con ninguno.
En otros atributos indica que no se puede rellenar ese valor por la razón que sea.
Es importante indicar que el texto vacío “”, no es lo mismo que el nulo. Como
tampoco el valor cero significa nulo.
Puesto que ese valor se utiliza continuamente, resulta imprescindible saber como
actúa cuando se emplean operaciones lógicas sobre ese valor. Eso significa definir un
tercer valor en la lógica booleana, además de los clásicos verdadero y falso. Un valor
nulo no es ni verdadero ni falso (se suele interpretar como un quizás). El uso de
operadores lógicos con el nulo da lugar a que:
Å verdadero Y (AND) nulo da como resultado, nulo
Å falso Y (AND) nulo da como resultado, falso
Å verdadero O (OR) nulo da como resultado, verdadero
Å falso O nulo da como resultado nulo
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/RIm9ZvAeZieeIJiOfARSeUQW4a9Nec0xE19sdvBaEHQ/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMjktbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[29]
Å la negación de nulo, da como resultado nulo
Se utiliza un operador en todas las bases relacionales llamado es_nulo (is null) que
devuelve verdadero si el valor con el que se compara es nulo.
[3.3]
restricciones
Se trata de unas condiciones de obligado cumplimiento por los datos de la base de
datos. Las hay de varios tipos.
[3.3.1] inherentes
Son aquellas que no son determinadas por los usuarios, sino que son definidas por el
hecho de que la base de datos sea relacional. Las más importantes son:
Å No puede haber dos tuplas iguales
Å El orden de las tuplas no es significativo
Å El orden de los atributos no es significativo
Å Cada atributo sólo puede tomar un valor en el dominio en el que está inscrito
[3.3.2] semánticas
El modelo relacional permite a los usuario incorporar restricciones personales a los
datos. Se comentan las diferentes reglas semánticas a continuación:
clave primaria (primary key)
Hace que los atributos marcados como clave primaria no puedan repetir valores.
Además obliga a que esos atributos no puedan estar vacíos (nulos); es más si la clave
primaria la forman varios atributos, ninguno de ellos podrá estar vacío.
unicidad (unique)
Impide que los valores de los atributos marcados de esa forma, puedan repetirse. Esta
restricción debe indicarse en todas las claves alternativas.
Al marcar una clave primaria se añade automáticamente sobre los atributos que
forman la clave un criterio de unicidad.
obligatoriedad (not null)
Prohíbe que el atributo marcado de esta forma no tenga ningún valor (es decir impide
que pueda contener el valor nulo, null).
integridad referencial (foreign key)
Sirve para indicar una clave externa. Cuando esa clave se marca con integridad
referencial, no se podrán introducir valores que no estén incluidos en los campos
relaciones con esa clave.](https://d2z384uprhdr6y.cloudfront.net/UngComfCRWsOfpztgBGjEtce3TgtVwbxMSRXSYIHSzc/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMzAtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
bases de datos relacionales
[30]
Es decir si hay una tabla de alquileres en la que cada fila es un alquiler, existirá un
atributo cod_cliente que indicará el código del cliente y que estará relacionado con una
tabla de clientes, en la que dicho atributo es la clave principal. De hecho no se podrá
incluir un código que no esté en la tabla clientes; eso es lo que prohíbe la integridad
referencial.
Eso causa problemas en las operaciones de borrado y modificación de registros; ya
que si se ejecutan esas operaciones sobre la tabla principal (si se modifica o borra un
cliente) quedarán filas en la tabla secundaria con la clave externa haciendo referencia a
un valor que ya no existe.
Esto último se puede manipular de estas formas:
Å Prohibiendo la operación (no action).
Å Transmitiendo la operación en cascada (cascade). Es decir si se modifica o borra
un cliente; también se modificarán o barrarán los alquileres relacionados con él.
Å Colocando nulos (set null) Las referencias al cliente en la tabla de alquileres se
colocan como nulos (es decir, alquileres sin cliente).
Å Usando el valor por defecto (default). Se colocan un valor por defecto en las
claves externas relacionadas.
regla de validación (check)
Condición que debe de cumplir un dato concreto para que sea actualizado. Puede
afectar a una tabla o a varias. Por ejemplo restringir el campo sueldo para que siempre
sea mayor de 1000, sería una regla de validación.
[3.4]
las 12 reglas de Codd
Preocupado por los productos que decían ser sistemas gestores de bases de datos
relacionales (RDBMS) sin serlo, Codd publica las 12 reglas que debe cumplir todo DBMS
para ser considerado relacional. Estas reglas en la práctica las cumplen pocos sistemas
relacionales. Las reglas son:
[1] Información. Toda la información de la base de datos debe estar
representada explícitamente en el esquema lógico. Es decir, todos los datos
están en las tablas.
[2] Acceso garantizado. Todo dato es accesible sabiendo el valor de su clave y el
nombre de la columna o atributo que contiene el dato.
[3] Tratamiento sistemático de los valores nulos. El DBMS debe permitir el
tratamiento adecuado de estos valores
[4] Catálogo en línea basado en el modelo relacional. Los metadatos deben de
ser accesibles usando un esquema relacional.](https://d2z384uprhdr6y.cloudfront.net/Ddp4pbxbU2usAfFdtu8gSsEmqStaAUIJxDMptEvY77w/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMzEtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[31]
[5] Sublenguaje de datos completo. Al menos debe de existir un lenguaje que
permita el manejo completo de la base de datos. Este lenguaje, por lo tanto,
debe permitir realizar cualquier operación.
[6] Actualización de vistas. El DBMS debe encargarse de que las vistas muestren
la última información
[7] Inserciones, modificaciones y eliminaciones de dato nivel. Cualquier
operación de modificación debe actuar sobre conjuntos de filas, nunca deben
actuar registro a registro.
[8] Independencia física. Los datos deben de ser accesibles desde la lógica de la
base de datos aún cuando se modifique el almacenamiento.
[9] Independencia lógica. Los programas no deben verse afectados por cambios
en las tablas
[10] Independencia de integridad. Las reglas de integridad deben almacenarse en
la base de datos (en el diccionario de datos), no en los programas de
aplicación.
[11] Independencia de la distribución. El sublenguaje de datos debe permitir que
sus instrucciones funciones igualmente en una base de datos distribuida que
en una que no lo es.
[12] No subversión. Si el DBMS posee un lenguaje que permite el recorrido registro
a registro, éste no puede utilizarse para incumplir las reglas relacionales.
[3.5]
álgebra relacional
[3.5.1] dinámica del modelo relacional
Lo visto anteriormente pertenece al campo de la estática de las bases de datos
relacionales. La dinámica en cambio dicta las transformaciones que se pueden realizar
sobre la base de datos. La estática se refiere a las tablas base, la dinámica a las vistas.
[3.5.2] lenguajes formales
Las bases de datos relacionales sólo contienen tablas, por lo que la dinámica manipula
esas tablas. Para indicar la transformación se emplean lenguajes formales, estos
lenguajes manipulan los datos sin tener en cuenta cómo se almacenan
Codd definió dos lenguajes formales
Å Álgebra relacional. Operaciones que combinan tablas y que dan como resultado
otra tabla.
Å Cálculo relacional. Operaciones que a partir de una fórmula obtienen un conjunto
de tuplas.
Se supone que ambos son equivalentes.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/NZP-7QRzu4w7E1RDz3lWzHnhp3nFuGBrzbdbIXMhKiU/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMzItbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
bases de datos relacionales
[32]
En este apartado se explica el álgebra relacional.
[3.5.3] operaciones básicas unitarias
renombrado
La operación de renombrado se utiliza exclusivamente para cambiar el nombre de una
relación. Se utiliza de esta forma:
RÆR’
La relación R pasa a llamarse R’
selección (σ)
Es una operación que aplicada a una tabla obtiene un subconjunto de filas de esa tabla
en la que sólo aparecen las filas que cumplan un determinado criterio.
Formalmente se define de esta forma:
Dado una relación R de cardinalidad C y grado G, una operación consiste en la creación
de una relación R’, cuyos elementos son las tuplas de R que cumplen una fórmula F.
Esto se expresa de esta forma:
σF(R)=R’
F es una fórmula que puede contener diversos operadores:
Å Operadores de comparación. <, >, ≤, ≥, ≠, =
Å Operadores booleanos. ∧ (AND), ∨ (OR) y NO
Ejemplo:
σnombre=”Pepe”(Cliente)
Eso obtiene una tabla cuyo contenido son las filas de la tabla Cliente cuya columna
nombre valga “Pepe”
σnombre=”Pepe” ∧edad>25 (Cliente)
Eso obtiene una tabla cuyo contenido son las filas de la tabla Cliente cuya columna
nombre valga “Pepe” y la columna edad valga más que 25.
Las operaciones se pueden mezclar (ejemplo de selección y renombrado):
(σnombre=”Pepe” ∧edad>25 (Cliente)) ÆPepes](https://d2z384uprhdr6y.cloudfront.net/qTKjSW6PQeNwy6BEKfl3qIZklrOIuQiwFImd9y-6Azc/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMzMtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[33]
proyección
Se trata de una operación que obtiene un subconjunto de una tabla basado sólo en
algunas columnas de la tabla original.
Su definición formal es:
Πi,j,k,.. (R)
Si R es una relación de grado G, entonces la proyección Πi,j,k,... de R es un relación de
grado G’ con G’<G, formada por los atributos de nombre i, j, k,...
Ejemplo
Πnombre, apellidos(Cliente)
Obtiene una tabla con las columnas nombre y apellidos de la tabla Cliente
[3.5.4] operaciones básicas binarias
unión
Si R y S son dos relaciones del mismo grado y definidas sobre el mismo conjunto de
atributos; R ∪ S es una relación del mismo grado que R y S y definida sobre el mismo
conjunto de atributos, donde las tuplas de esa nueva relación son todas las de R y todas
las de S.
Hay que tener en cuenta que las tuplas exactas no aparecen repetidas en la relación
resultante.
Ejemplo:
R A B S A B
a 1 a 1
a 3 b 2
b 2 b 4
c 1
R ∪ S A B
a 1
a 3
b 2
b 4
c 1](https://d2z384uprhdr6y.cloudfront.net/1Cd0PfM2HR1KGT67JPPARSRqePiUmiCaz5OHl4fFzkM/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMzQtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
bases de datos relacionales
[34]
diferencia
Si R y S son dos relaciones del mismo grado y definidas sobre el mismo conjunto de
atributos; R - S es una relación del mismo grado y atributos formada por todas las tuplas
de R que no están presentes en S. Ejemplo (basado en las tablas anteriores):
R - S A B
a 3
c 1
intersección
Si R y S son dos relaciones del mismo grado y definidas sobre el mismo conjunto de
atributos; R ∩ S es una relación del mismo grado y atributos formada por todas las
tuplas de R que están también presentes en S. Ejemplo (basado en las tablas
anteriores):
R ∩ S A B
a 1
b 2
producto cartesiano
Si R es una relación de grado G1 y S es una relación de grado G2; R × S es una relación
de grado G1+G2 cuyos G1 primeros componentes forman una tupla de R y los siguientes
G2 forman una tupla de S.
Es decir el producto cartesiano es una relación que contiene todas las tuplas que
resultan de combinar cada tupla de R con cada tupla de S. Ejemplo:
R A B S D E F
a 1 a 3 1
a 3 b 4 2
c 5 4
R × S A B D E F
a 1 a 3 1
a 1 b 4 2
a 1 c 5 4
a 3 a 3 1
a 3 b 4 2
a 3 c 5 4
combinación (join)
Se trata de un producto cartesiano en el que las tuplas resultantes cumplen una
determinada condición.
R ∞ S
a Θ
b
Donde Θ simboliza a cualquier operador de relación y a y b son atributos de R o de S.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/7AmEbUyqz_nO5wnjZdkbSJMhMMjHFk4UkfQufJduBnY/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMzUtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[35]
Ejemplo:
cliente ∞ alquiler
cliente.dni = alquiler.dni
Esto combinaría todos los clientes con todos los alquileres mostrando sólo las filas cuyo
número de dni de la tabla de clientes coincida con el dni de la tabla de alquileres.
Es decir:
cliente ∞ alquiler
cliente.dni = alquiler.dni = σcliente.dni = alquiler.dni(cliente×alquiler)
combinación natural (natural join)
Es una combinación que no indica condición alguna y que automáticamente obtiene las
tuplas combinadas cuyos atributos comunes a ambas tablas sean del mismo valor. Es
decir si la tabla cliente y la tabla alquiler tienen en común el atributo dni, entonces:
cliente ∞ alquiler
Obtiene los datos combinados de cliente y alquiler cuyos dnis coincidan. La definición
de R∞S es:
R∞S=σR.A1=S.A1∧R.A2=S.A2∧...∧R.An=S.An (R×S)
En ese esquema los atributos A1, A2,...An son atributos comunes a ambas relaciones.
división
Si R y S son relaciones de grado G1 y G2 respectivamente y A es el conjunto de atributos
comunes a ambas relaciones; R : S obtiene una relación de de grado G1-G2 en la que las
tuplas resultantes son las tuplas formadas por los atributos distintos de A que poseen
todos los valores posibles de A en la tabla S.
Es decir se obtienen las tuplas cuyos contenidos en los atributos comunes poseen
todas las combinaciones almacenadas en S.
Ejemplo:
R D E F S F
a 34 uno uno
a 34 dos dos
c 23 uno
d 11 dos
R : S D E
a 34](https://d2z384uprhdr6y.cloudfront.net/AizDivuVkyAs9NZrT0rT8xcWkNNvkY_U2OJed2CqTXE/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMzYtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
bases de datos relacionales
[36]
[3.6]
cálculo relacional
Utiliza expresiones matemáticas para generar fórmulas que han de cumplir los
elementos de la relación; de modo que se obtiene una relación formada por las tuplas
que cumplen esa fórmula.
La dificultad está en saber escribir la fórmula.
[3.6.1] cálculo relacional orientado a tuplas
Se basa en responder a la pregunta ¿Qué tuplas se encuentran en el resultado?
Å Esta pregunta se resuelve con una fórmula cuyo formato es
{t|P(t)}
Se lee: el conjunto de las tuplas t tales que cumplen el predicado P. Ese predicado es
una expresión que puede contener una o más variables de tupla (variables que
representan tuplas arbitrarias de una relación)
Hay dos tipos de variable de tupla:
Å ligadas. Se cuantifican mediante los operadores ∀ y ∃ . Ejemplo:
{t|∃ s(s ∈ cliente ∧ t[dni]=s[dni] ∧ t[edad]>25)}
Obtiene clientes con más de 25 años.
Å libres. Son las que no utilizan los operadores anteriores (∀ y ∃ .)
Las fórmulas pueden contener:
Å Valores constantes
Å Variables de tupla. Se denotan con una letra minúscula (normalmente t, u, v,...)
Å Expresiones como t[i], que significan la i-ésima componente de t.
Å Expresiones como t[N], donde N es el nombre de un atributo de t.
La construcción sigue estas reglas:
[2] Se llaman átomos de fórmula a:
ª R(s), donde R es el nombre de una relación y s una variable de tupla.
Significa que la variable de tupla s, pertenece a R
ª S[i]Θu[j], donde Θrepresenta un operador de relación (>,<,>=,<=,..). El
atributo i-ésimo de S estará relacionad con el j-ésimo componente de u
[3] Las expresiones de la fórmula se construyen:
ª Sabiendo que los átomos de fórmula son expresiones válidads](https://d2z384uprhdr6y.cloudfront.net/oWjy-Gy_f67Hd1lEwuCnvRRZp4_WT5kkeSTnLZ0Vdos/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMzctbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[37]
ª Si F1 y F2 son fórmulas, las expresiones F1∧F2, F1 ∨F2, F1⇐F2 y ¬ F1 , son
válidas
ª Si F es una fórmula se puede indicar ∀ s F(s), que significa para todas las
tuplas de s se cumple F.
ª Si F es una fórmula se puede indicar ∃ s F(s), que significa que existe una
tupla de s que cumple la fórmula F
ª Se admiten paréntesis en las fórmulas
[3.6.2] cálculo relacional orientado a dominios
Utilizan una sintaxis semejante, en esta forma:
{V1, V2, V3,....Vn|P(V1,V2,V3,...Vn)}
Donde V1, V2,.. son variables de dominio de cada atributo y P(V1,V2,....) es una
fórmula sobre esas variables. Con esas variables se pueden utilizar los mismos
operadores indicados anteriormente. De hecho la diferencia está en la aplicación a
dominios y no a tuplas, lo que varía las expresiones.
Gracias este cálculo se generan expresiones en cálculo relacional semejantes a las
del álgebra relacional.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/D1wc68CP9QmSKFXraRmAMSAwu3u_6m2r9rU7j838POg/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMzgtbC53ZWJw.webp)

![[39]
[Unidad 4]
diseño de
bases de datos
relacionales
[4.1]
el modelo entidad - relación
[4.1.1] introducción
Se ha visto en temas anteriores (unidades 2, Sistemas Gestores de Base de Datos y 3,
Bases de Datos Relacionales) que existen varios esquemas a realizar para poder
representar en forma de base de datos informática un problema procedente del
ordenador.
El primero de esos esquemas es el llamado esquema conceptual, que representa la
información de forma absolutamente independiente al Sistema Gestor de Base de Datos.
Los esquemas internos de las diferentes bases de datos no captan suficientemente bien
la semántica del mundo real, de ahí que primero haya que pasar por uno o dos
esquemas previos más cercanos al mundo real.](https://d2z384uprhdr6y.cloudfront.net/zGbi0nNePXpsrmcgtgEBZMQxy9llnkHBQPTxAL6sAxs/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNDAtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
diseño de bases de datos relacionales
[40]
El hecho de saltarse el esquema conceptual conlleva un problema de pérdida con el
problema real. El esquema conceptual debe reflejar todos los aspectos relevantes del
mundo a real a modelar.
Peter P. Chen y el modelo entidad/relación
En 1976 y 1977 dos artículos de Peter P. Chen presentan un modelo para realizar
esquemas que posean una visión unificada de los datos. Este modelo es el modelo
entidad/interrelación (entity/relationship en inglés) que actualmente se conoce más
con el nombre de entidad/relación (Modelo E/R o ME/R, en inglés E/RM).
Posteriormente otros autores han añadido mejoras a este modelo lo que ha
producido una familia de modelos. La más aceptada actualmente es el modelo
entidad/relación extendido (ERE) que complemente algunas carencias del modelo
original. No obstante las diversas variantes del modelo hacen que la representación de
este modelo no sea muy estándar, aunque hay ideas muy comunes a todas las variantes.
Hay que insistir en que este modelo no tiene nada que ver con las bases de datos
relacionales, los esquemas entidad/relación se pueden utilizar con cualquier SGBD ya
que son conceptuales. Confunde el uso de la palabra relación, pero el concepto de
relación en este esquema no tiene nada que ver con la idea de relación expuesta por
Codd en su modelo relacional.
[4.1.2] componentes del modelo
entidad
Se trata de cualquier objeto u elemento (real o abstracto) acerca del cual se pueda
almacenar información en la base de datos. Es decir cualquier elemento informativo
que tenga importancia para una base de datos.
Ejemplos de entidades son Pedro, la factura número 32456, el coche matrícula
3452BCW, etc. Una entidad no es un propiedad concreta sino un objeto que puede
poseer múltiples propiedades (atributos). Es decir “Sánchez” es el contenido del
atributo Primer Apellido de la entidad que representa a la persona Pedro Sánchez
Crespo con DNI 12766374,...
Una entidad es un objeto concreto, no un simple dato: el coche que tenemos en el
garaje es una entidad, “Mercedes” sin embargo es la marca de ese coche, es decir es un
atributo de esa entidad.
conjuntos de entidades
Las entidades que poseen las mismas propiedades forman conjuntos de entidades.
Ejemplos de conjuntos de entidades son los conjuntos: personas, facturas, coches,...
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/j1yq9_DYqWuGM13PM0fem6gS3sG7Sn0WCiFL4sEzh1Y/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNDEtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[41]
Ana
Pedro
José
María
Consuelo
Jaime
Lourdes
PERSONAS
Conjunto de
entidades
Entidades
Ilustración 10, Ejemplos de entidad y conjunto de entidad
En la actualidad se suele llamar entidad a lo que anteriormente se ha definido como
conjunto de entidades. De este modo hablaríamos de la entidad PERSONAS. Mientras
que cada persona en concreto sería una ocurrencia o un ejemplar de la entidad
persona.
Esa terminología es la que actualmente vamos a utilizar en
representación gráfica de las entidades
En el modelo entidad relación los conjuntos de entidades se representan con un
rectángulo dentro del cual se escribe el nombre de la entidad:
PERSONAS
Ilustración 11, Representación de la
entidad persona
tipos de entidades
Å Regulares. Son las entidades normales que tienen existencia por sí mismas sin
depender de otras. Su representación gráfica es la indicada arriba
Å Débiles. Su existencia depende de otras. Por ejemplo la entidad tarea laboral
sólo podrá tener existencia si existe la entidad trabajo. Las entidades débiles
se presentan de esta forma:
TAREAS LABORALES
Ilustración 12, Entidad débil](https://d2z384uprhdr6y.cloudfront.net/LghudnLANGH1KneJQ5kfV5vNYIzZGIbTqZTdHYyNlgE/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNDItbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
diseño de bases de datos relacionales
[42]
[4.1.3] relaciones
qué es una relación
Representan asociaciones entre entidades. Es el elemento del modelo que permite
relacionar en sí los datos del mismo. Por ejemplo, en el caso de que tengamos una
entidad personas y otra entidad trabajos. Ambas se realizan ya que las personas
trabajan y los trabajos son realizados por personas:
Ana
Pedro
José
María
Consuelo
Jaime
Lourdes
PERSONAS
Fontanero
Electricista
Peluquero
Administrativo
TRABAJOS
Ilustración 13, ejemplo de relación
En una relación (Chen llamaba conjunto de relaciones a lo que ahora se llama relación a
secas) cada ejemplar (relación en la terminología de Chen) asocia un elemento de una
entidad con otro de la otra entidad. En una relación no pueden aparecer dos veces
relacionados los mismos ejemplares. Es decir en el ejemplo anterior, en la relación no
puede aparecer dos veces el mismo trabajador asociado al mismo trabajo.
representación gráfica
La representación gráfica de las entidades se realiza con un rombo al que se le unen
líneas que se dirigen a las entidades, las relaciones tienen nombre (se suele usar un
verbo). En el ejemplo anterior podría usarse como nombre de relación, trabajar:
PERSONAS TRABAJAR TRABAJOS](https://d2z384uprhdr6y.cloudfront.net/tFfW7uw-H-NTtQZU1P1YblJdULR32B3_WeCot7GB2H8/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNDMtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[43]
ejemplos de relaciones
CURSO IMPARTIR AULA
DIA
Relación ternaria
PERSONA
ES PAREJA
Relación reflexiva
LOCALIDAD PROVINCIA
PERTENECE
ES CAPITAL
Relación doble
CURSO IMPARTIR AULA
Relación binaria
Å Relaciones Binarias. Son las relaciones típicas. Se trata de relaciones que
asocian dos entidades.
Å Relaciones Ternarias. Relacionan tres entidades. A veces se pueden simplificar
en relaciones binarias, pero no siempre es posible.
Å Relaciones n-arias. Relacionan n entidades
Å Relaciones dobles. Se llaman así a dos relaciones distintas que sirven para
relacionar a las mismas relaciones. Son las más difíciles de manejar ya que al
manipular las entidades hay que elegir muy bien la relacionan a utilizar para
relacionar los datos.
Å Relación reflexiva. Es una relación que sirve para relacionar ejemplares de la
misma entidad (personas con personas, piezas con piezas, etc.)
cardinalidad
Indica el número de relaciones en las que una entidad puede aparecer. Se anota en
términos de:
Å cardinalidad mínima. Indica el número mínimo de asociaciones en las que
aparecerá cada ejemplar de la entidad (el valor que se anota es de cero o uno,
aunque tenga una cardinalidad mínima de más de uno, se indica sólo un uno)
Å cardinalidad máxima. Indica el número máximo de relaciones en las que puede
aparecer cada ejemplar de la entidad. Puede ser uno, otro valor concreto
mayor que uno (tres por ejemplo) o muchos (se representa con n)
En los esquemas entidad / relación la cardinalidad se puede indicar de muchas formas.
Quizá la más completa (y la que se utiliza en este documento es ésta) consiste en
anotar en los extremos la cardinalidad máxima y mínima de cada entidad en la relación.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/8JrSK5Bmt1ECCuNGbZtFf7Xg7Lm8ZG8vjeaPnj16YOM/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNDQtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
diseño de bases de datos relacionales
[44]
Ejemplo de uso de cardinalidad:
Ilustración 14, Cardinalidades.
En el ejemplo un jugador tiene una cardinalidad mínima de 0 (puede no estar en ningún
equipo) y una máxima de 1 (como mucho está en un equipo, no puede estar en dos a la
vez). Cada equipo tiene una cardinalidad mínima de uno (en realidad sería una
cardinalidad mínima más alta, pero se anota un uno) y una máxima de n (en cada
equipo hay muchos jugadores)
En la página siguiente se indican otras notaciones para las cardinalidades.
Muchos
De cero a muchos
Uno
De uno a muchos
De cero a uno
Ejemplo:
JUGADOR JUEGA EQUIPO
ENTRENADOR
ENTRENA
En el ejemplo, cada equipo cuenta con varios jugadores. Un jugador juega como mucho
en un equipo y podría no jugar en ninguno. Cada entrenador entrena a un equipo
(podría no entrenar a ninguno), el cual tiene un solo entrenador como mucho y como
poco.](https://d2z384uprhdr6y.cloudfront.net/zJlj16uocTtpG4nqPOL58qYWv43FqLmOOEbKkSm7Mmo/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNDUtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[45]
Otra notación es:
Y aún habría más pero nos quedaremos con la primera ya que es la más completa.
roles
A veces en las líneas de la relación se indican roles. Los roles representan el papel que
juega una entidad en una determinada relación.
Ejemplo:
Ilustración 15, Ejemplo de rol. Un trabajador puede ser visto como jefe o como empleado
según a qué lado de la relación esté
[4.1.4] atributos
Describen propiedades de las entidades y las relaciones. En este modelo se representan
con un círculo, dentro del cual se coloca el nombre del atributo. Ejemplo:
Ilustración 16, Atributos](https://d2z384uprhdr6y.cloudfront.net/5sSFVpntHQenH-Sb1anGayfk6RN1n-zZFfvwPqfJQXs/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNDYtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
diseño de bases de datos relacionales
[46]
tipos de atributos
compuesto
múltiples
Pueden tomar varios valores (varios teléfonos para el mismo cliente):
opcionales
Lo son si pueden tener valor nulo:
identificador o clave
Se trata de uno o más campos cuyos valores son únicos en cada ejemplar de una
entidad. Se indican subrayando el nombre del identificador.
Para que un atributo sea considerado un buen identificador tiene que cumplir con los
siguientes requisitos:
[1] Deben distinguir a cada ejemplar teniendo en cuenta las entidades que utiliza
el modelo. No tiene que ser un identificador absoluto.
[2] Todos los ejemplares de una entidad deben tener el mismo identificador.
[3] Cuando un atributo es importante aun cuando no tenga una entidad concreta
asociada, entonces se trata de una entidad y no de un atributo
identificador alternativo
Se trata de uno o más campos cuyos valores son únicos para cada ejemplar de una
entidad, pero que no son identificadores ya que existen identificadores mejores en la
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/Q_WDaTjg1XrCXLc31FsLV2btktmzyFTyoRvKjEgqK4Y/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNDctbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[47]
entidad. En este caso los candidatos es aconsejable marcarlos con un subrayado
discontinuo (ejemplo de subrayado discontinuo)
[4.1.5] modelo entidad relación extendido
En el modelo entidad relación extendido aparecen nuevos tipos de relaciones. Son las
relaciones ISA (es un) y las entidades débiles
relaciones is a o relaciones de herencia
Se utilizan para unificar entidades agrupándolas en una entidad más general
(generalización) o bien para dividir una entidad general en entidades más específicas
(especificación).
Se habla de generalización si inicialmente partimos de una serie de entidades que al
estudiarlas en detalle descubrimos que todas ellas pertenecen al mismo conjunto. En la
generalización las entidades son totalmente heterogéneas, es decir, los atributos son
diferentes. La entidad general se llama superentidad las otras se denominan
subentidades. La superentidad normalmente tiene una clave principal distinta de las
subentidades.
La especialización ocurre cuando partimos de una entidad que podemos dividir en
subentidades para detallar atributos que varían en las mismas. Comparten clave con la
superentidad y los atributos de la superclase se heredan en las subclases.
En la práctica se manejan casi igual ambas; de hecho la representación es la misma:
Ilustración 17, Relación ISA
La entidad general personal se ha dividido en tres pequeñas entidades. La cuestión de si
es generalización o especialización no suele ser excesivamente importante salvo por el
tema de la herencia de los atributos; hay que recordar que en la especialización, las
subentidades heredan los atributos de la superentidad.
En el diseño la herencia de los atributos queda reflejado por las cardinalidades, si en
la superentidad se indica una cardinalidad mínima de uno, se entiende entonces que se
trata de de una especialización en las que las subentidades heredan los atributos de la
superclase. Si la cardinalidad mínima es cero se entiende que las subclases no heredan
los atributos.
Como se comentó antes la cuestión de si es una especialización o generalización se
suele distinguir por las claves; si se comparte clave entre la superentidad y sus
descendientes, se habla de especialización; de otro modo se habla de generalización
(aunque esto es muy rebatible, en la práctica suele ser la única forma de distinguir
ambos conceptos en el esquema).
De cualquier modo, la cuestión de si tenemos una generalización o una
especialización no es tan importante como el hecho de no fallar con las cardinalidades,
ya que al pasar el esquema al modelo relacional es lo que importa más.](https://d2z384uprhdr6y.cloudfront.net/hcN4Z1xQbdyXyxibylTxXOmz-1MPmn3O5qFqr23r7PE/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNDgtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
diseño de bases de datos relacionales
[48]
La representación de relaciones ISA (independientemente de si es generalización o
especialización) es esta:
Ilustración 18, Relación ISA con cardinalidades
Con atributos el esquema sería:
PERSONAL
PROFESORES
ISA
BEDELES TÉCNICOS
(0,1) (0,1) (0,1)
(1,1)
Id personal Nombre
Departamento Categoría Meses
Trienios
Ilustración 19, Especialización
En la especialización anterior (lo es porque la clave la tiene la superentidad) los
profesores, bedeles y técnicos heredan el atributo id personal y el nombre, el resto son
atributos propios sólo de cada entidad (trienios pertenece sólo a los profesores, en este
ejemplo)](https://d2z384uprhdr6y.cloudfront.net/_RKC0m5gU49a-6ZSZ6IDgkFLvOe3QdnzH4iCWBJZV8Y/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNDktbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[49]
ARTÍCULOS
DISCOS
ISA
LIBROS MERCHANDISING
(0,1) (0,1) (0,1)
(0,1)
Id artículo Precio
Titulo
Id Libro Id Merc
Id Disco
Páginas Título
Tipo
Ilustración 20, Generalización
En la ilustración anterior artículo es una generalización de los discos, libros y artículos
de merchandising, se utiliza una clave distinta para esta entidad. Incluso en este caso
podría haber discos o libros o merchandising que no están relacionados con los artículos
(la cardinalidad de artículos es 0,1).
obligatoriariedad
En las relaciones ISA (y también en otros tipos de relaciones) se puede indicar el hecho
de que cada ejemplar obligatoriamente tiene que participar en una de entre varias
ramas de una relación. Este hecho se marca con un arco entre las distintas relaciones.
En las relaciones ISA se usa mucho, por ejemplo:
PERSONAL
PROFESORES
ISA
BEDELES TÉCNICOS
(0,1) (0,1) (0,1)
(1,1)
Ilustración 21, Relación ISA con obligatoriedad
En el ejemplo, el personal tiene que ser obligatoriamente un bedel, o un profesor o un
técnico; una de las tres cosas (no puede haber personal que no sea una de estas tres
cosas).
entidades débiles
Ya se ha comentado antes que una entidad débil es aquella cuya existencia depende de
otra. Ahora vamos a clarificar más estas entidades. Efectivamente ocurren cuando hay
una entidad más fuerte de la que dependen. Lógicamente tienen relación con esa
entidad. En la forma clásica se representaría de esta forma:
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/JHwdAFFpGjT0aEjHhf8rt8LhM7k0a1Ei0kUHkdC16xA/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNTAtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
diseño de bases de datos relacionales
[50]
TRABAJOS
TAREAS
ES PARTE DE
(1,1)
(1,n)
Id Trabajo Descripción
Id Trabajo Id Tarea
Nombre Tipo
Ilustración 22, Relación candidata a entidad débil
En el diagrama la relación entre las tareas y los trabajos es 1 a n (cada trabajo se
compone de n tareas). Una tarea obligatoriamente está asignada a un trabajo, es más
no tiene sentido hablar de tareas sin hablar del trabajo del que forma parte.
Hay incluso (aunque no siempre) una dependencia de identificación ya que las
tareas se identifican por un número de tarea y el número de trabajo al que se asignan.
Esto es un síntoma definitivo de que se trata de una entidad débil.
Todas las entidades débiles tienen este tipo de relación 1 a n con respecto a la
entidad fuerte de la que depende su existencia, por eso se representan de esta otra
forma:
Id Trabajo TRABAJOS Descripción
Id Tarea
Nombre Tipo
Id Trabajo TAREAS
Ilustración 23, Entidad débil relacionada con su entidad fuerte
No hace falta dibujar el rombo de la relación ni la cardinalidad, se sobreentiende el tipo
y cardinalidad (1 a n) que posee.](https://d2z384uprhdr6y.cloudfront.net/HFMst32CXoAXqHOvvcFb_B7FA01YanP4QJ_60RktVuE/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNTEtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[51]
[4.2]
el modelo entidad/relación y el modelo
relacional
El modelo entidad/relación es un modelo conceptual que sirve para cualquier tipo de
sistema gestor de base de datos. El modelo relacional (visto en el tema 3) es un modelo
lógico sólo sirve para sistemas gestores de bases de datos relacionales (y no para
jerárquicas, o codasyl, por ejemplo).
Esto significa que el esquema entidad/relación que hayamos obtenido en el
modelado conceptual, habrá que convertirle al esquema relacional correspondiente.
Todos los diseñadores y administradores de bases de datos relacionales usan (al menos
deberían usar) esquemas conceptuales entidad/relación (hay que recordar que hay otros
modelos conceptuales) porque se adaptan muy bien a este modelo. Pero para realizar
este cambio hay que conocer las reglas que permiten este cambio.
Hay que insistir en la diferencia de la palabra relación en ambos modelos. En el
modelo relacional una relación es una tabla mientras que en el entidad/relación es la
asociación que se produce entre dos entidades. A partir de este momento tomaremos el
significado de relación que da el modelo entidad/relación. A las relaciones del modelo
relacional las llamaremos simplemente tablas para evitar confusiones.
[4.3]
paso de entidad/relación al modelo
relacional
[4.3.1] transformación de las entidades fuertes
En principio las entidades fuertes del modelo Entidad Relación son transformados al
modelo relacional siguiendo estas instrucciones:
Å Entidades. Las entidades pasan a ser tablas
Å Atributos. Los atributos pasan a ser columnas o atributos de la tabla.
Å Identificadores principales. Pasan a ser claves primarias
Å Identificadores candidatos. Pasan a ser claves candidatas.](https://d2z384uprhdr6y.cloudfront.net/G3Jb36MKWAl1a4NgLCT7mMgTSYmT1d2syjVJbKlMN5s/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNTItbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
diseño de bases de datos relacionales
[52]
Esto hace que la transformación se produzca según este ejemplo:
Nombre
Identificador Atributo1
Atributo2 Atributo2
Nombre( , Atributo 1, Atributo 2, Atributo 3) Identificador
Ilustración 24,Transformación de una entidad fuerte al esquema relacional
[4.3.2] transformación de relaciones
La idea inicial es transformar a cada relación en una tabla en el modelo relacional. Pero
hay que distinguir según el tipo de relación.
relaciones varios a varios
En las relaciones varios a varios (n a n en la cardinalidad mayor, la cardinalidad menor
no importa salvo para determinar los índices), la relación se transforma en una tabla
cuyos atributos son: los atributos de la relación y las claves de las entidades
relacionadas (que pasarán a ser claves externas). La clave de la tabla la forman todas
las claves externas:
Ilustración 25, Transformación de una relación varios a varios
relaciones de orden n
Las relaciones ternarias, cuaternarias y n-arias que unen más de dos relaciones se
transforman en una tabla que contiene los atributos de la relación más los
identificadores de las entidades relacionadas. La clave la forman todas las claves
externas:
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/wXhlwWNiW88dNWP53pys2x3PuuP5e1H0591uDWhEagA/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNTMtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[53]
Ilustración 26, Transformación en el modelo relacional de una entidad n-aria
relaciones uno a varios y uno a uno
Las relaciones binarios de tipo uno a varios no requieren ser transformadas en una tabla
en el modelo relacional. En su lugar la tabla del lado varios (tabla relacionada) incluye
como clave externa1
el identificador de la entidad del lado uno (tabla principal):
Ilustración 27, Transformación de una relación uno a varios
Así en el dibujo, el identificador2 en la tabla Entidad1 pasa a ser una clave externa.
En el caso de que el número mínimo de la relación sea de cero (puede haber ejemplares
de la entidad uno sin relacionar), se deberá permitir valores nulos en la clave externa
identificador2. En otro caso no se podrán permitir (ya que siempre habrá un valor
relacionado).
En el caso de las relaciones uno a uno, ocurre lo mismo: la relación no se convierte
en tabla, sino que se coloca en una de las tablas (en principio daría igual cuál) el
identificador de la entidad relacionada como clave externa.
1
Clave externa, clave ajena, clave foránea, clave secundaria y foreign key son sinónimos](https://d2z384uprhdr6y.cloudfront.net/EQ9BM-Pa9z4APNQShfWHAbas7y_ngRT_Fp3eZKT-NV0/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNTQtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
diseño de bases de datos relacionales
[54]
En el caso de que una entidad participe opcionalmente en la relación, entonces es el
identificador de ésta el que se colocará como clave externa en la tabla que representa a
la otra entidad.
Entidad
Relación
(1,n)
(1,1)
Rol2
Rol1
Entidad( ,Atributo1, Identificador Rol1, Atributo2) Identificador
Identificador
Atributo1
Atributo2
Entidad
Relación
(1,n)
(1,n)
Rol2
Rol1
Entidad( ,Atributo1) Identificador
Identificador
Atributo1
Atributo2
Relación( , Atributo2) Identificador Rol1, Identificador Rol2
Ilustración 28, Transformación de relaciones recursivas en el modelo relacional
relaciones recursivas
Las relaciones recursivas se tratan de la misma forma que las otras, sólo que un mismo
atributo puede figurar dos veces en una tabla como resultado de la transformación
(véase ilustración anterior)
[4.3.3] entidades débiles
Toda entidad débil incorpora una relación implícita con una entidad fuerte. Esta
relación no necesita incorporarse como tabla en el modelo relacional. Sí se necesita
incorporar la clave de la entidad fuerte como clave externa en la entidad débil. Es más,
en muchos casos esa clave externa, forma parte de la clave principal de la tabla que
representa a la entidad débil. El proceso es:
Id Fuerte
Entidad Fuerte
Atributo1
Id Débil
Entidad Débil
Atributo2
Entidad1( , Atributo2) Id Débil Id Fuerte,
Entidad Fuerte( , Atributo 1) Id Fuerte
Ilustración 29, transformación de una entidad débil en el modelo relacional
En ocasiones el identificador de la entidad débil es suficiente para identificar los
ejemplares de dicha entidad, entonces ese identificador quedaría como clave principal,](https://d2z384uprhdr6y.cloudfront.net/GPOlk__I-MJWWMEfkHVBA66tV118WLyfLYlvZ10m6WQ/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNTUtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[55]
pero el identificador de la entidad fuerte seguiría figurando como clave externa en la
entidad débil.
[4.3.4] generalizaciones y especificaciones
Las generalizaciones y/o especificaciones se convierten al modelo relacional de esta
forma (superentidad es la entidad más general, subentidades son las entidades más
específicas):
[1] Las subentidades pasan a ser tablas.
[2] Si la clave de la superentidad es distinta de las subentidades, entonces se
coloca el identificador de la superentidad en cada subentidad como clave
externa o secundaria. Si la clave es la misma, entonces no es necesario.
Superentidad
Subentidad1 Subentidad2
Id1 Atributo1
Id2
Atributo2
Id3
Atributo3
Subentidad1( , Atributo 2, Id1) Id2
Subentidad2( , Atributo 3, Id1) Id3
Superentidad( , Atributo 1) Id1
Ilustración 30, Proceso de transformación de relaciones ISA con clave propia
[3] Si la clave es la misma, entonces todas las entidades tendrán el mismo
atributo como clave principal:
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/uiVpZ6uRGdhkgzvJleUw6r2rKlT_M1738YOgkmI-kyA/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNTYtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
diseño de bases de datos relacionales
[56]
Superentidad
Subentidad1 Subentidad2
Id Atributo1
Id
Atributo2
Id
Atributo3
Subentidad1( Atributo 2) Id,
Subentidad2( , Atributo 3) Id
Superentidad( , Atributo 1) Id
Ilustración 31, Proceso de transformación de relaciones ISA en el modelo relacional si tienen
la misma clave
[4] La superentidad debe generar una tabla sólo en el caso de que haya
posibilidad de que exista un ejemplar de dicha entidad que no sea ejemplar
de las subentidades (un trabajador que no sea ni bedel, ni administrativo, ni
ninguna categoría). Esto se detecta en el caso de que no haya obligatoriedad.
De otro modo basta con generar las tablas de las subentidades e incluir los
atributos de la entidad superior:
Superentidad
Subentidad1 Subentidad2
Id Atributo1
Id
Atributo2
Id
Atributo3
Subentidad1( Atributo 2, Atributo1) Id,
Subentidad2( , Atributo 3, Atributo1) Id
Ilustración 32, Paso de relaciones ISA al modelo relacional cuando toda superentidad figura
como subentidad. En ese caso se heredan los atributos de la superentidad
También se suele evitar este hecho de heredar los atributos en el caso de que haya
subentidades que no están asociadas a ninguna superentidad. En este caso se generaría](https://d2z384uprhdr6y.cloudfront.net/v4MB0F2oqm1Qf6VEEYHQXR1ahlyfRQ5NQHtRFFapctg/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNTctbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[57]
una tabla para la superentidad y no se heredan los atributos, sólo se copia la clave de la
superentidad en las subentidades.
[4.3.5] notas finales
El modelo conceptual entidad/relación es el verdadero mapa de la base de datos. Hay
aspectos que no se reflejan al instante, por ejemplo el hecho de si la cardinalidad
mínima es 0 o uno, o la obligatoriedad en una relación,.... Son aspectos a tener en
cuenta en el siguiente modelo (en el interno) al crear por ejemplo índices y
restricciones. Por ello ese modelo es la referencia obligada de los profesionales de la
base de datos (en especial de los administradores) y su contenido no se debe ignorar al
convertirle a la forma relacional.
[4.4]
representación de esquemas de bases de
datos relacionales
En el tema 3, ya vimos como eran los esquemas relacionales. Ejemplo:
PIEZA(Tipo, Modelo, Nombre, Apellido1, Apellido2)
EMPRESA(CIF, Cod_Empresa, Nombre, Dirección)
SUMINISTROS(Tipo,Modelo, Cod_Empresa, Precio)
EXISTENCIAS(Tipo, Modelo, N_Almacen, Cantidad)
En ese tipo de esquemas es difícil ver las relaciones en los datos, algo que sí se ve muy
bien en los esquemas entidad relación. Por ello se suelen complementar los esquemas
clásicos con líneas y diagramas que representan esa información.
[4.4.1] Grafos relacionales
Es un esquema relacional en el que hay líneas que enlazan las claves principales con las
claves secundarias para representar mejor las relaciones. A veces se representa en
forma de nodos de grafos y otras se complementa el clásico. Ejemplo:](https://d2z384uprhdr6y.cloudfront.net/Igbx4AvRQig7VvkEB6jIdkGbKemFUc4vhs12w0R8jh4/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNTgtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
diseño de bases de datos relacionales
[58]
[4.4.2] Esquemas relacionales derivados del modelo
entidad/relación
Hay quien los llama esquemas entidad/relación relacionales. De hecho es una mezcla
entre los esquemas relacionales y los entidad/relación. Hoy en día se utiliza mucho, en
especial por las herramientas CASE de creación de diseños de bases de datos.
Las tablas se representan en forma de rectángulo que contiene una fila por cada
atributo y una fila inicial para la cabecera en la que aparece el nombre de la tabla.
Después aparecen líneas que muestran la relación entre las claves y su cardinalidad.
Uno de los más utilizados actualmente es éste:
cif asistir
telefono
direccion
localidad
provincia
nmr o be
empresas
tipo
modelo
precio venta _
piezas cif
tipo
modelo
precio compra _
suministros
cantidad
modelo
n_almacen
tipo
existencias
Las cardinalidades se pueden mostrar en otros formatos, pero siempre se mostrarán en
este tipo de esquemas.
Se ha hecho muy popular la forma de presentar esquemas relacionales del programa
Microsoft Access.
Ejemplo:
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/It1Fhkg3wiaUs3oOxsKqbaLTqYgQ5_IliHfNxCcwMhY/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNTktbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[59]
Es una forma muy clara de representar relaciones y cardinalidades.
[4.5]
normalización
[4.5.1] problemas del esquema relacional
Una vez obtenido el esquema relacional resultante del esquema entidad/relación que
representa la base de datos, normalmente tendremos una buena base de datos. Pero
otras veces, debido a fallos en el diseño o a problemas indetectables, tendremos un
esquema que puede producir una base de datos que incorpore estos problemas:
Å Redundancia. Se llama así a los datos que se repiten continua e
innecesariamente por las tablas de las bases de datos. Cuando es excesiva es
evidente que el diseño hay que revisarlo, es el primer síntoma de problemas y
se detecta fácilmente.
Å Ambigüedades. Datos que no clarifican suficientemente el registro al que
representan. Los datos de cada registro podrían referirse a más de un registro o
incluso puede ser imposible saber a qué ejemplar exactamente se están
refiriendo. Es un problema muy grave y difícil de detectar.
Å Pérdida de restricciones de integridad. Normalmente debido a dependencias
funcionales. Más adelante se explica este problema. Se arreglan fácilmente
siguiendo una serie de pasos concretos.
Å Anomalías en operaciones de modificación de datos. El hecho de que al
insertar un solo elemento haya que repetir tuplas en una tabla para variar unos
pocos datos. O que eliminar un elemento suponga eliminar varias tuplas
necesariamente (por ejemplo que eliminar un cliente suponga borrar seis o
siete filas de la tabla de clientes, sería un error muy grave y por lo tanto un
diseño terrible).
El principio fundamental reside en que las tablas deben referirse a objetos o situaciones
muy concretas, relacionados exactamente con elementos reconocibles por el sistema de
información de forma inequívoca. Cada fila de una tabla representa inequívocamente un
elemento reconocible en el sistema. Lo que ocurre es que conceptualmente es difícil
agrupar esos elementos correctamente.](https://d2z384uprhdr6y.cloudfront.net/shCHHQRGqih44cFu7HABuYCCfLToQs8xy_JF6EXKDwQ/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNjAtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
diseño de bases de datos relacionales
[60]
En cualquier caso la mayor parte de problemas se agravan si no se sigue un modelo
conceptual y se decide crear directamente el esquema relacional. En ese caso el diseño
tiene una garantía casi asegurada de funcionar mal.
Cuando aparecen los problemas enumerados entonces se les puede resolver usando
reglas de normalización. Estas reglas suelen forzar la división de una tabla en dos o más
tablas para arreglar ese problema.
[4.5.2] formas normales
Las formas normales se corresponde a una teoría de normalización iniciada por el propio
Codd y continuada por otros autores (entre los que destacan Boyce y Fagin). Codd
definió en 1970 la primera forma normal, desde ese momento aparecieron la segunda,
tercera, la Boyce-Codd, la cuarta y la quinta forma normal.
Una tabla puede encontrarse en primera forma normal y no en segunda forma
normal, pero no al contrario. Es decir los números altos de formas normales son más
restrictivos (la quinta forma normal cumple todas las anteriores).
La teoría de formas normales es una teoría absolutamente matemática, pero en el
presente manual se describen de forma más intuitiva.
Hay que tener en cuenta que muchos diseñadores opinan que basta con llegar a la
forma Boyce-Codd, ya que la cuarta, y sobre todo la quinta, forma normal es polémica.
Hay quien opina que hay bases de datos peores en quinta forma normal que en tercera.
En cualquier caso debería ser obligatorio para cualquier diseñador llegar hasta la forma
normal de Boyce-Codd.
[4.5.3] primera forma normal (1FN)
Es una forma normal inherente al esquema relacional. Es decir toda tabla realmente
relacional la cumple.
Se dice que una tabla se encuentra en primera forma normal si impide que un
atributo de una tupla pueda tomar más de un valor. La tabla:
TRABAJADOR
DNI Nombre Departamento
12121212A Andrés Mantenimiento
12345345G Andrea Dirección
Gestión
Visualmente es un tabla, pero no una tabla relacional (lo que en terminología de bases
de datos relacionales se llama relación). No cumple la primera forma normal. Lo
cumpliría si:
TRABAJADOR
DNI Nombre Departamento
12121212A Andrés Mantenimiento
12345345G Andrea Dirección
12345345G Andrea Gestión
Esa tabla sí esta en primera forma normal.](https://d2z384uprhdr6y.cloudfront.net/sgw04SvoI9O-9p2MmZoP1uQuktHF4sCx3AD-cN4tgks/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNjEtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[61]
[4.5.4] dependencias funcionales
Se dice que un conjunto de atributos (Y) depende funcionalmente de otro conjunto de
atributos (X) si para cada valor de X hay un único valor posible para Y. Simbólicamente
se denota por X→Y.
Por ejemplo el nombre de una persona depende funcionalmente del DNI, para un DNI
concreto sólo hay un nombre posible. En la tabla ejemplo anterior, el departamento no
tiene dependencia funcional, ya que para un mismo DNI puede haber más de un
departamento posible. Pero el nombre sí que depende del DNI.
Al conjunto X del que depende funcionalmente el conjunto Y se le llama
determinante. Al conjunto Y se le llama implicado.
dependencia funcional completa
Un conjunto de atributos (Y) tiene una dependencia funcional completa sobre otro
conjunto de atributos (X) si Y tiene dependencia funcional de X y además no se puede
obtener de X un conjunto de atributos más pequeño que consiga una dependencia
funcional de Y (es decir, no hay en X un determinante formado por atributos más
pequeños).
Por ejemplo en una tabla de clientes, el conjunto de atributos formado por el
nombre y el dni producen una dependencia funcional sobre el atributo apellidos. Pero
no es plena ya que el dni sólo también produce una dependencia funcional sobre
apellidos. El dni sí produce una dependencia funcional completa sobre el campo
apellidos.
Una dependencia funcional completa se denota como X⇒Y
dependencia funcional elemental
Se produce cuando X e Y forman una dependencia funcional completa y además Y es un
único atributo.
dependencia funcional transitiva
Es más compleja de explicar, pero tiene también utilidad. Se produce cuando tenemos
tres conjuntos de atributos X, Y y Z. Y depende funcionalmente de X (X→Y), Z depende
funcionalmente de Y (Y→Z). Además X no depende funcionalmente de Y (Y-/→X).
Entonces ocurre que X produce una dependencia funcional transitiva sobre Z. Esto se
denota como:
(X⎯ →Z)
Por ejemplo si X es el atributo Número de Clase de un instituto, e Y es el atributo
Código Tutor. Entonces X→Y (el tutor depende funcionalmente del número de clase).
Si Z representa el Código del departamento, entonces Y→Z (el código del
departamento depende funcionalmente del código tutor, cada tutor sólo puede estar en
un departamento). Como ocurre que Y-/→X (el código de la clase no depende
funcionalmente del código tutor, un código tutor se puede corresponder con varios
códigos de clase). Entonces X⎯ →Z (el código del departamento depende
transitivamente del código de la clase).
[4.5.5] segunda forma normal (2FN)
Ocurre si una tabla está en primera forma normal y además cada atributo que no sea
clave, depende de forma funcional completa respecto de cualquiera de las claves. Toda
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/8sBk7FDBSovlMuVaLtPodt7aUq-wmuPa9Bm1_k9g-VY/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNjItbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
diseño de bases de datos relacionales
[62]
la clave principal debe hacer dependientes al resto de atributos, si hay atributos que
depende sólo de parte de la clave, entonces esa parte de la clave y esos atributos
formarán otra tabla.
Ejemplo:
ALUMNOS
DNI Cod Curso Nombre Apellido1 Nota
12121219A 34 Pedro Valiente 9
12121219A 25 Pedro Valiente 8
3457775G 34 Ana Fernández 6
5674378J 25 Sara Crespo 7
5674378J 34 Sara Crespo 6
Suponiendo que el DNI y el código de curso formen una clave principal para esta tabla,
sólo la nota tiene dependencia funcional completa. El nombre y los apellidos dependen
de forma completa del DNI. La tabla no es 2FN, para arreglarlo:
ALUMNOS
DNI Nombre Apellido1
12121219A Pedro Valiente
3457775G Ana Fernández
5674378J Sara Crespo
ASISTENCIA
DNI Cod Curso Nota
12121219A 34 9
12121219A 25 8
3457775G 34 6
5674378J 25 7
5674378J 34 6
[4.5.6] tercera forma normal (3FN)
Ocurre cuando una tabla está en 2FN y además ningún atributo que no sea clave
depende transitivamente de las claves de la tabla. Es decir no ocurre cuando algún
atributo depende funcionalmente de atributos que no son clave.](https://d2z384uprhdr6y.cloudfront.net/-ZXnZ6Tk8CG9Wr0jviq6Cxc14J6MrWFJZfX8r7DSXwQ/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNjMtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[63]
Ejemplo:
ALUMNOS
DNI Nombre Apellido1 Cod Provincia Provincia
12121349A Salvador Velasco 34 Palencia
12121219A Pedro Valiente 34 Palencia
3457775G Ana Fernández 47 Valladolid
5674378J Sara Crespo 47 Valladolid
3456858S Marina Serrat 08 Barcelona
La Provincia depende funcionalmente del código de provincia, lo que hace que no esté
en 3FN. El arreglo sería:
ALUMNOS
DNI Nombre Apellido1 Cod Provincia
12121349A Salvador Velasco 34
12121219A Pedro Valiente 34
3457775G Ana Fernández 47
5674378J Sara Crespo 47
3456858S Marina Serrat 08
PROVINCIA
Cod Provincia Provincia
34 Palencia
47 Valladolid
08 Barcelona
[4.5.7] forma normal de Boyce-Codd (FNBC o BCFN)
Ocurre si una tabla está en tercera forma normal y además todo determinante es una
clave candidata. Ejemplo:
TUTORÍAS
DNI Asignatura Tutor
12121219A Lenguaje Eva
12121219A Matemáticas Andrés
3457775G Lenguaje Eva
5674378J Matemáticas Guillermo
5674378J Lenguaje Julia
5634823H Matemáticas Guillermo
Esa tabla está en tercera forma normal (no hay dependencias transitivas), pero no en
forma de Boyce - Codd, ya que (DNI, Asignatura) →Tutor y Tutor→Asignatura. En](https://d2z384uprhdr6y.cloudfront.net/1KCs_utGK4W7K2cNE_Ab1gm990zdVWL2gb28bqGYySw/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNjQtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
diseño de bases de datos relacionales
[64]
este caso la redundancia ocurre por mala selección de clave. La redundancia de la
asignatura es completamente evitable. La solución sería:
TUTORÍAS
DNI Tutor
12121219A Eva
12121219A Andrés
3457775G Eva
5674378J Guillermo
5674378J Julia
5634823H Guillermo
ASIGNATURASTUTOR
Asignatura Tutor
Lenguaje Eva
Matemáticas Andrés
Matemáticas Guillermo
Lenguaje Julia
En las formas de Boyce-Codd hay que tener cuidado al descomponer ya que se podría
perder información por una mala descomposición
[4.5.8] cuarta forma normal (4FN). dependencias
multivaluadas
dependencia multivaluada
Para el resto de formas normales (las diseñadas por Fagin, mucho más complejas), es
importante definir este tipo de dependencia, que es distinta de las funcionales. Si las
funcionales eran la base de la segunda y tercera forma normal (y de la de Boyce-Codd),
éstas son la base de la cuarta forma normal.
Una dependencia multivaluada de una tabla con atributos X, Y, Z de X sobre Z (es
decir X->>Z) ocurre cuando los posibles valores de Y sobre cualquier par de valores X y Z
dependen sólo del valor de X y son independientes de Z. Se refiere a posibles valores
(en plural) y se trata de que los valores de ese atributo siempre son los mismos según el
valor de un atributo y no del otro.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/vkAwy2xD6MMDhXhdsst8i99PhnwvQLQfDk6RmoSH1Po/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNjUtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[65]
Ejemplo:
Nº Curso Profesor Material
17 Eva 1
17 Eva 2
17 Julia 1
17 Julia 2
25 Eva 1
25 Eva 2
25 Eva 3
La tabla cursos, profesores y materiales del curso. La tabla está en FNBC ya que no hay
dependencias transitivas y todos los atributos son clave sin dependencia funcional hacia
ellos. Sin embargo hay redundancia. Los materiales se van a repetir para cualquier
profesor dando cualquier curso, ya que los profesores van a utilizar todos los materiales
del curso (de no ser así no habría ninguna redundancia).
Los materiales del curso dependen del curso y no del profesor en una dependencia
multivaluada (no hay dependencia funcional ya que los posibles valores son varios). Para
el par Nº de curso y profesor podemos saber los materiales; pero lo sabemos por el curso
y no por el profesor.
cuarta forma normal
Ocurre esta forma normal cuando una tabla está en forma normal de Boyce Codd y toda
dependencia multivaluada es una dependencia funcional. Para la tabla anterior la
solución serían dos tablas:
Nº Curso Material
17 1
17 2
25 1
25 2
25 3
Nº Curso Profesor
17 Eva
17 Julia
25 Eva
Un teorema de Fagin indica cuando hay tres pares de conjuntos de atributos X, Y y Z si
ocurre X->>Y|Z (Y y Z tienen dependencia multivaluada sobre X), entonces las tablas
X,Y y º reproducen sin perder información lo que poseía la tabla original. Este teorema
marca la forma de dividir las tablas hacia una 4FN](https://d2z384uprhdr6y.cloudfront.net/JWyY4rrU4oAmwFpk6f0PU1HKzcxV8RY2dF-JqtUg68s/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNjYtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
diseño de bases de datos relacionales
[66]
[4.5.9] quinta forma normal (5FN)
dependencias de JOIN o de unión
Una proyección de una tabla es la tabla resultante de tomar un subconjunto de los
atributos de una tabla (se trata de la operación proyección, Π, del álgebra relacional).
Se dice que se tiene una tabla con dependencia de tipo JOIN si se puede obtener esa
tabla como resultado de combinar (mediante la operación JOIN del álgebra relacional)
varias proyecciones de la misma.
quinta forma normal
Ocurre cuando está en 4FN y además no hay proyecciones que combinadas formen la
tabla original. Es la más compleja y polémica de todas. Polémica pues no está claro en
muchas ocasiones que sea una solución mejor sacar las proyecciones de la tabla. Fue
definida también por Fagin.
Es raro encontrarse este tipo de problemas cuando la normalización llega a 4FN. Se
deben a restricciones muy concretas. Ejemplo:
Proveedor Material Proyecto
1 1 2
1 2 1
2 1 1
1 1 1
Indican códigos de material suministrado por un proveedor y utilizado en un
determinado proyecto.
Si ocurre una restricción especial como por ejemplo: Cuando un proveedor nos ha
suministrado alguna vez un determinado material, si ese material aparece en otro
proyecto, haremos que el proveedor nos suministre también ese material para ese
proyecto.
Eso ocurre en los datos como el proveedor número 1 nos suministró el material
número 1 para el proyecto 2 y en el proyecto 1 utilizamos el material 1, aparecerá la
tupla proveedor 1, material 1 y proyecto 1.
La dependencia que produce esta restricción es lejana y se la llama de reunión.
Para esa restricción esta división en tablas sería válida:
Proveedor Material
1 1
1 2
2 1
Material Proyecto
1 2
2 1
1 1](https://d2z384uprhdr6y.cloudfront.net/458pXEmkR-cuK1W5XIznENDDeE7dBprz0d4vlpTejlc/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNjctbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[67]
Esa descomposición no pierde valores en este caso, sabiendo que si el proveedor nos
suministra un material podremos relacionarle con todos los proyectos que utilizan ese
material.
Resumiendo, una tabla no está en quinta forma normal si hay una descomposición de
esa tabla que muestre la misma información que la original.
Normalmente se crean tablas en quinta forma normal cuando en la misma tabla hay
muchos atributos y es casi inmanejable o cuando hay muchos registros y pocos
atributos. En el caso de que haya muchos atributos se divide la tabla en dos donde la
clave es la misma en ambas tablas.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/M_D2Auc6WePPCFf5Wk7-os4rhtrcxpbSli2EpGXBGOo/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNjgtbC53ZWJw.webp)

![[69]
[Unidad 5]
el lenguaje SQL
(y Oracle SQL)
notas previas
versión de SQL
Aunque este tema sirven como guía de uso de SQL, en estos apuntes sobre todo se
escenifica el SQL del programa comercial Oracle. Normalmente se indican las
diferencias entre Oracle y SQL estándar, pero todos los ejemplos han sido pensados
para utilizarse en Oracle.
La razón de utilizar Oracle como base de trabajo se debe a su respeto por SQL
estándar (hasta cierto punto) y por ser el SGBD de referencia en el mundo desde hace
ya muchos años.
formato de las instrucciones en los apuntes
En este manual en muchos apartados se indica sintaxis de comandos. Esta sintaxis sirve
para aprender a utilizar el comando, e indica la forma de escribir dicho comando en el
programa utilizado para escribir SQL.
En el presente manual la sintaxis de los comandos se escribe en párrafos sombreados
de azul celeste con el reborde en azul oscuro.](https://d2z384uprhdr6y.cloudfront.net/aeKplEB9N1LcIIMubvOiEM-P6rH29dKBLjkvrvN9WBY/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNzAtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[70]
Ejemplo:
SELECT * | {[DISTINCT] columna | expresión [alias], ...}
FROM tabla;
Otras veces se describen códigos de ejemplo de un comando. Los ejemplos se escriben
también con fondo celeste, pero sin el reborde. Ejemplo:
SELECT nombre FROM cliente;
Los ejemplos sirven para escenificar una instrucción concreta, la sintaxis se utiliza para
indicar las forma de utilizar un comando. Para indicar la sintaxis de un comando se usan
símbolos especiales. Los símbolos que utiliza este libro (de acuerdo con la sintaxis que
se utiliza normalmente en cualquier documentación de este tipo) son:
Å PALABRA Cuando en la sintaxis se utiliza una palabra en negrita, significa que es
un comando que hay que escribir literalmente.
Å texto El texto que aparece en cursiva sirve para indicar que no hay que escribirle
literalmente, sino que se refiere a un tipo de elemento que se puede utilizar en el
comando. Ejemplo:
SELECT columna FROM tabla;
El texto columna hay que cambiarlo por un nombre concreto de columna (nombre,
apellidos,...) , al igual que tabla se refiere a un nombre de tabla concreto.
Å [] (corchetes). Los corchetes sirven para encerrar texto que no es obligatorio en
el comando, es decir para indicar una parte opcional.
Å | (barra vertical). Este símbolo (|) , la barra vertical, indica opción, es decir que
se puede elegir entre varias opciones
Å ... (puntos suspensivos) Indica que se puede repetir el texto anterior en el
comando continuamente (significaría, y así sucesivamente)
Å {} (llaves) Las llaves sirven para indicar opciones mutuamente exclusivas pero
obligatorias. Es decir, opciones de las que sólo se puede elegir una opción, pero
de las que es obligado elegir una. Ejemplo:
SELECT { * | columna | expresión }
FROM tabla;
El ejemplo anterior indicaría que se debe elegir obligatoriamente el asterisco o un
nombre de columna o una expresión. Si las llaves del ejemplo fueran corchetes,
entonces indicarían que incluso podría no aparecer ninguna opción.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/48u_OuxPwW8e-AsgPqhww6AESN_ip-cjqORtpIldh0k/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNzEtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[71]
[5.1]
características y conceptos básicos
[5.1.1] Historia del lenguaje SQL
El nacimiento del lenguaje SQL data de 1970 cuando E. F. Codd publica su libro: "Un
modelo de datos relacional para grandes bancos de datos compartidos". Ese libro
dictaría las direcrices de las bases de datos relacionales. Apenas dos años después IBM
(para quien trabajaba Codd) utiliza las directrices de Codd para crear el Standard
English Query Language (Lenguaje Estándar Inglés para Consultas) al que se le llamó
SEQUEL. Más adelante se le asignaron las siglas SQL (Standard Query Language,
lenguaje estándar de consulta) aunque en inglés se siguen pronunciando SEQUEL. En
español se le llama esecuele.
Poco después se convertía en un estándar en el mundo de las bases de datos avalado
por los organismos ISO y ANSI (el primer estándar es del año 1982). Aún hoy sigue siendo
uno de los estándares más importantes de la industria informática.
Los estándares más seguidos son los de los años 1992 y 1999 (el último estándar).
Sobre estos dos estándares giran estos apuntes.
[5.1.2] objetivos
SQL pretende ser un lenguaje que simula su escritura en lenguaje normal. De ahí que se
le considere un lenguaje de cuarta generación. Consta de palabras especiales y de
expresiones.
Se trata de un lenguaje que intenta agrupar todas las funciones que se le pueden
pedir a una base de datos
[5.2]
modos de utilización
[5.2.1] ejecución directa. SQL interactivo
Las instrucciones SQL se introducen a través de una herramienta que las traduce
inmediatamente a la base de datos, por lo que se ejecutan al instante.
[5.2.2] ejecución incrustada o embebida
Las instrucciones SQL se colocan como parte del código de otro lenguaje anfitrión (C,
Java, Pascal, Visual Basic,...). Estas instrucciones están separadas del resto del código
de forma conveniente. Al compilar el código se utiliza un precompilador de la propia
base de datos para traducir el SQL.](https://d2z384uprhdr6y.cloudfront.net/07kEvun3RdVNwMoFLAZo41J1MgdYEj6EV0HUjvdT87I/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNzItbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[72]
[5.2.3] ejecución dinámica
Se trata de SQL incrustado en módulos especiales que pueden ser invocados una y otra
vez desde distintas aplicaciones.
[5.3]
elementos del lenguaje SQL
[5.3.1] código SQL
El código SQL consta de los siguientes elementos:
Å Comandos. Las distintas instrucciones que se pueden realizar desde SQL
² SELECT. Se trata del comando que permite realizar consultas sobre los datos de
la base de datos. Obtiene datos de la base de datos.
² DML, Data Manipulation Language (Lenguaje de manipulación de datos).
Modifica filas (registros) de la base de datos. Lo forman las instrucciones
INSERT, UPDATE, MERGE y DELETE.
² DDL, Data Definition Language (Lenguaje de definición de datos). Permiten
modificar la estructura de las tablas de la base de datos. Lo forman las
instrucciones CREATE, ALTER, DROP, RENAME y TRUNCATE.
² Instrucciones de transferencia. Administran las modificaciones creadas por las
instrucciones DML. Lo forman las instrucciones ROLLBACK, COMMIT y
SAVEPOINT
² DCL, Data Control Language (Lenguaje de control de datos). Administran los
derechos y restricciones de los usuarios. Lo forman las instrucciones GRANT y
REVOKE.
Å Cláusulas. Son palabras especiales que permiten modificar el funcionamiento de un
comando (WHERE, ORDER BY,...)
Å Operadores. Permiten crear expresiones complejas. Pueden ser aritméticos (+,-
,*,/,...) lógicos (>, <, !=,<>, AND, OR,...)
Å Funciones. Para conseguir valores complejos (SUM(), DATE(),...)
Å Constantes. Valores literales para las consultas, números, textos, caracteres,...
Å Datos. Obtenidos de la propia base de datos
[5.3.2] normas de escritura
Å En SQL no se distingue entre mayúsculas y minúsculas. Da lo mismo como se
escriba.
Å El final de una instrucción lo determina el signo del punto y coma](https://d2z384uprhdr6y.cloudfront.net/OvxTO9lypx5vNGlkfSVBnjCRqCP1r7d12FrzhLWB8Jw/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNzMtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[73]
Å Los comandos SQL (SELECT, INSERT,...) pueden ser partidos por espacios o saltos de
línea antes de finalizar la instrucción
Å Se pueden tabular líneas para facilitar la lectura si fuera necesario
Å Los comentarios en el código SQL comienzan por /* y terminan por */ (excepto en
algunos SGBD)
[5.4]
DDL
[5.4.1] introducción
El DDL es la parte del lenguaje que realiza la función de definición de datos.
Fundamentalmente se encarga de la creación de esquemas, tablas y vistas. Por ahora
veremos como crear tablas.
Cada usuario de una base de datos posee un esquema. El esquema suele tener el
mismo nombre que el usuario y sirve para almacenar los objetos de esquema, es decir
los objetos que posee el usuario.
Esos objetos pueden ser: tablas, vistas, índices y otras objetos relacionados con la
definición de la base de datos. Los objetos son manipulados y creados por los usuarios.
En principio sólo los administradores y los usuarios propietarios pueden acceder a cada
objeto, salvo que se modifiquen los privilegios del objeto para permitir el acceso a otros
usuarios.
Hay que tener en cuenta que ninguna instrucción DDL puede ser anulada por una
instrucción ROLLBACK (la instrucción ROLLBACK está relacionada con el uso de
transacciones que se comentarán más adelante) por lo que hay que tener mucha
precaución a la hora de utilizarlas. Es decir, las instrucciones DDL son definitivas.
[5.4.2] creación de bases de datos
Esta es una tarea administrativa que se comentará más profundamente en otros temas.
Por ahora sólo se comenta de forma simple. Crear la base de datos implica indicar los
archivos y ubicaciones que se utilizarán para la misma, además de otras indicaciones
técnicas y administrativas que no se comentarán en este tema.
Lógicamente sólo es posible crear una base de datos si se tienen privilegios DBA
(DataBase Administrator) o SYSDBA.
El comando SQL de creación de una base de datos es CREATE DATABASE. Este
comando crea una base de datos con el nombre que se indique. Ejemplo:
CREATE DATABASE prueba;
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/Oslsa1PBjOd8G2fiZFhGShHTB2jD9opvbxthMn_Fv0w/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNzQtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[74]
Pero normalmente se indican más parámetros. Ejemplo:
CREATE DATABASE prueba
LOGFILE prueba.log
MAXLOGFILES 25
MAXINSTANCES 10
ARCHIVELOG
CHARACTER SET WIN1214
NATIONAL CHARACTER SET UTF8
DATAFILE prueba1.dbf AUTOEXTEND ON MAXSIZE 500MB;
[5.4.3] objetos de la base de datos
Según los estándares actuales, una base de datos es un conjunto de objetos pensados
para gestionar datos. Estos objetos están contenidos en esquemas, los esquemas suelen
estar asociados al perfil de un usuario en particular.
En el estándar SQL existe el concepto de catálogo que sirve para almacenar
esquemas. Así el nombre completo de un objeto vendría dado por:
catálogo.esquema.objeto
Si no se indica el catálogo se toma el catálogo por defecto. Si no se indica el esquema
se entiende que el objeto está en el esquema actual.
[5.4.4] creación de tablas
nombre de las tablas
Deben cumplir las siguientes reglas (en algunos SGBD podrían cambiar):
Å Deben comenzar con una letra
Å No deben tener más de 30 caracteres
Å Sólo se permiten utilizar letras del alfabeto (inglés), números o el signo de
subrayado (también el signo $ y #, pero esos se utilizan de manera especial por lo
que no son recomendados)
Å No puede haber dos tablas con el mismo nombre para el mismo esquema (pueden
coincidir los nombres si están en distintos esquemas)
Å No puede coincidir con el nombre de una palabra reservada SQL (por ejemplo no se
puede llamar SELECT a una tabla)
Å En el caso de que el nombre tenga espacios en blanco o caracteres nacionales
(permitido sólo en algunas bases de datos), entonces se suele entrecomillar (en
Oracle con comillas dobles, en SQLServer con comillas simples). En el estándar SQL
99 (respetado por Oracle) se pueden utilizar comillas dobles al poner el nombre de
la tabla a fin de hacerla sensible a las mayúsculas (se diferenciará entre
“FACTURAS” y “Facturas”)](https://d2z384uprhdr6y.cloudfront.net/ph993MltoLywLf8zI9JeM07me_ztzxBR1v2BKzPVz64/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNzUtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[75]
orden CREATE TABLE
Es la orden SQL que permite crear una tabla. Por defecto será almacenada en el espacio
y esquema del usuario que crea la tabla. Sintaxis:
CREATE TABLE [esquema.] nombreDeTabla
(nombreDeLaColumna1 tipoDeDatos [, ...]);
Ejemplo:
CREATE TABLE proveedores (nombre varchar(25));
Crea una tabla con un solo campo de tipo varchar.
Sólo se podrá crear la tabla si el usuario posee los permisos necesarios para ello. Si
la tabla pertenece a otro esquema (suponiendo que el usuario tenga permiso para
grabar tablas en ese otro esquema), se antepone al nombre de la tabla , el nombre del
esquema:
CREATE TABLE otroUsuario.proveedores (nombre varchar2(25));
[5.4.5] consultar las tablas del usuario
consultar el diccionario de datos
Todas las bases de datos poseen un diccionario de datos que contiene la lista de tablas.
En cada sistema de base de datos se accede a esos datos de una forma. En el caso de
Oracle, hay una tabla en el diccionario de datos que se llama USER_TABLES y que
contiene una lista de las tablas del usuario actual. Así para sacar una lista de las tablas,
se usa:
SELECT * FROM USER_TABLES;
Hay diversas columnas que muestran datos sobre cada tabla, entre ellas la columna
TABLES_NAME muestra el nombre de cada tabla del usuario; el resto muestra
información sobre el almacenamiento de la tabla. La tabla ALL_TABLES mostrará una
lista de todas las tablas accesibles por el usuario. Finalmente DBA_TABLES es una tabla
que contiene todas las tablas del sistema; esto es accesible sólo por el usuario
administrador (DBA).
orden DESCRIBE
El comando DESCRIBE, permite obtener la estructura de una tabla. Ejemplo:
DESCRIBE existencias;
Y aparecerán los campos de la tabla proveedores. Esta instrucción no es parte del SQL
estándar, pero casi es considerada así ya que casi todos los SGBD la utilizan.](https://d2z384uprhdr6y.cloudfront.net/L1rUs63BSmdwawlGe2R6zcsV-PMxzwUp_e0KcjJS7jo/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNzYtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[76]
El resultado de la orden anterior (en Oracle) sería:
Nombre ¿Nulo? Tipo
N_ALMACEN NOT NULL NUMBER(2)
TIPO NOT NULL VARCHAR2(2)
MODELO NOT NULL NUMBER(2)
CANTIDAD NUMBER(7)
[5.4.6] orden INSERT
Permite añadir datos a las tablas. Más adelante se comenta de forma más detallada. Su
sintaxis básica es:
INSERT INTO tabla [(columna1 [, columna2...])]
VALUES (valor1 [,valor2]);
Indicando la tabla se añaden los datos que se especifiquen tras el apartado values en un
nuevo registro. Los valores deben corresponderse con el orden de las columnas. Si no es
así se puede indicar tras el nombre de la tabla y entre paréntesis.
Ejemplo:
INSERT INTO proveedores(nombre, CIF)
VALUES (‘Adaja SA’,’14244223Y’);
Si la inserción es correcta se nos indicarán las filas insertadas
[5.4.7] borrar tablas
La orden DROP TABLE seguida del nombre de una tabla, permite eliminar la tabla en
cuestión.
Al borrar una tabla:
Å Desaparecen todos los datos
Å Cualquier vista y sinónimo referente a la tabla seguirán existiendo, pero ya no
funcionarán (conviene eliminarlos)
Å Las transacciones pendientes son aceptadas (COMMIT), en aquellas bases de datos
que tengan la posibilidad de utilizar transacciones.
Å Lógicamente sólo se pueden eliminar las tablas sobre las que tenemos permiso de
borrado.
Normalmente, el borrado de una tabla es irreversible, y no hay ninguna petición de
confirmación, por lo que conviene ser muy cuidadoso con esta operación.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/2CyjBERWXUAedc0bswluNOyA7hwynxmPZRd-so9ntAk/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNzctbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[77]
[5.4.8] tipos de datos
A la hora de crear tablas, hay que indicar el tipo de datos de cada campo. Para ello
describimos la siguiente tabla:
Descripción Tipos ANSI SQL SQL Server Oracle SQL Tipo MySQL
Texto de
anchura fija
CHARACTER(n)
CHAR(n)
CHAR(n) CHAR(n) CHAR(n)
Texto de
anchura
variable
CHARACTER
VARYING(n)
CHAR VARYING(n)
VARCHAR(n) VARCHAR2(n) VARCHAR(n)
Texto de
anchura fija
para
caracteres
nacionales
NATIONAL
CHARACTER(n)
NATIONAL CHAR(n)
NCHAR(n)
NCHAR(n) NCHAR(n)
Texto de
anchura
variable para
caracteres
nacionales
NATIONAL
CHARACTER
VARYING(n)
NATIONAL CHAR
VARYING(n)
NCHAR VARYING(n)
NVARCHAR(n) NVARCHAR2(n)
Enteros INTEGER
INT
SMALLINT
INT
INT
SMALL INT
NUMBER(38) INT
SMALL INT
TINY INT
Decimal de
coma variable
FLOAT(b)
DOUBLE
DOUBLE
PRECISSION
REAL
FLOAT NUMBER FLOAT(m,d)
DOUBLE(m,d)
Decimal de
coma fija
NUMERIC(m,d)
DECIMAL(m,d)
NUMERIC(m,d)
DECIMAL(m,d)
NUMBER(m,d)
DECIMAL(m,d)
Fechas DATE DATE DATE
Fecha y hora TIMESTAMP TIMESTAMP
DATETIME
SMALLDATETIME
TIMESTAMP TIMESTAMP
DATETIME
TIME
Intervalos INTERVAL INTERVAL YEAR](https://d2z384uprhdr6y.cloudfront.net/skybmMn2esIZKdqtgVYXpuO5MdHeQcZX_BGNd_b07Bk/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNzgtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[78]
Descripción Tipos ANSI SQL SQL Server Oracle SQL Tipo MySQL
Lógicos BIT BINARY BIT
BOOL
Texto gran
longitud
CLOB TEXT y NTEXT LONG (en
desuso) y CLOB
TEXT, MEDIUM
TEXT y LONG
TEXT
Binario de gran
longitud
BLOB IMAGE RAW, LONG RAW
BLOB
BLOB, MEDIUM
BLOB y LONG
BLOB
textos
Para los textos disponemos de los siguientes tipos (Oracle):
Å VARCHAR . Para textos de longitud variable. Su tamaño depende de la base de
datos (en Oracle es de 4000)
Å CHAR. Para textos de longitud fija (en Oracle hasta 2000 caracteres).
Å NCHAR. Para el almacenamiento de caracteres nacionales de texto fijo
Å NVARCHAR. Para el almacenamiento de caracteres nacionales de longitud variable.
En todos estos tipos se indican los tamaños entre paréntesis tras el nombre del tipo.
Conviene poner suficiente espacio para almacenar los valores. En el caso de los
VARCHAR, no se malgasta espacio por poner más espacio del deseado ya que si el texto
es más pequeño que el tamaño indicado, el resto del espacio se ocupa.
números
Si son enteros se indican con INT (en Oracle es el tipo NUMBER seguido del tamaño) que
equivale a los long del lenguaje C. Si son decimales se elige FLOAT o DOUBLE si se
desea precisión doble. En Oracle es el tipo NUMBER a secas, seguido de dos números
separados por comas.
También existe la posibilidad de utilizar el tipo DECIMAL que representa decimales
de longitud fija (gastan más espacio, pero son más precisos). En ese caso se indica el
tamaño completo del número y el número de decimales. Por ejemplo, DECIMAL (8,3)
indica que se representan números de ocho cifras de precisión y tres decimales. En
Oracle se usa igual pero sustituyendo la palabra DECIMAL por la palabra NUMBER
(NUMBER(8,3) por ejemplo). Las cifras de precisión incluyen los decimales, es decir para
almacenar el número 64563,2345 se usaría NUMBER(9,4) (o DECIMAL(9,4)).
tipos LONG y CLOB
Se trata de la posibilidad de utilizar textos muy grandes (varias MB o incluso GB).
Dependiendo de la base de datos son tipos LONG, LOB o CLOB (en Oracle CLOB). Pero el
uso es el mismo.
tipos BLOB y RAW
Parecidos a los anteriores pero utilizados para almacenar datos binarios (imágenes,
vídeo,...).](https://d2z384uprhdr6y.cloudfront.net/n86D8WnWdwsrK4HCckxz_cfv8ahcK2Qc4wks4Oy53bE/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfNzktbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[79]
fechas y horas
DATE
El tipo DATE permite almacenar fechas. Las fechas se pueden escribir en formato día,
mes y año entre comillas. El separador puede ser una barra de dividir, un guión y casi
cualquier símbolo.
Para almacenar la fecha actual la mayoría de bases de datos proporcionan funciones
(como SYSDATE en Oracle) que devuelven ese valor.
TIMESTAMP
Es una extensión del anterior, almacena valores de día, mes y año, junto con hora,
minuto y segundos (incluso con decimales). Con lo que representa un instante concreto
en el tiempo. Un ejemplo de TIMESTAMP sería ‘2/2/2004 18:34:23,34521’. En este caso
si el formato de fecha y hora del sistema está pensado para el idioma español, el
separador decimal será la coma (y no el punto).
intervalos
Sirven para almacenar intervalos de tiempo (no fechas, sino una suma de elementos de
tiempo). En el caso de Oracle son:
INTERVAL YEAR TO MONTH
Este tipo de datos almacena años y meses. Tras la palabra YEAR se puede indicar la
precisión de los años (cifras del año), por defecto es de dos. Ejemplo:
CREATE TABLE tiempos (meses INTERVAL YEAR(3) TO MONTH);
INSERT INTO tiempos VALUES(’3-2’);
En el ejemplo se inserta un registro que representa 3 años y dos meses.
INTERVAL DAY TO SECOND
Representa intervalos de tiempo que expresan días, horas, minutos y segundos. Se
puede indicar la precisión tras el texto DAY y el número de decimales de los segundos
tras el texto SECOND. Ejemplo:
CREATE TABLE tiempos (dias INTERVAL DAY(3) TO SECOND(0));
INSERT INTO tiempos VALUES(’2 7:12:23’);
[5.4.9] modificar tablas
cambiar de nombre
La orden RENAME permite el cambio de nombre de cualquier objeto. Sintaxis:
RENAME nombreViejo TO nombreNuevo
borrar contenido de tablas
La orden TRUNCATE TABLE seguida del nombre de una tabla, hace que se elimine el
contenido de la tabla, pero no la tabla en sí. Incluso borra del archivo de datos el
espacio ocupado por la tabla.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/h95iIgzgUtktyWCUGdbniYqA7DzDmok6VA5td1425gs/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfODAtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[80]
modificar tablas
La versátil instrucción ALTER TABLE permite hacer cambios en la estructura de una
tabla.
añadir columnas
ALTER TABLE nombreTabla ADD(nombreColumna TipoDatos
[Propiedades][,columnaSiguiente tipoDatos [propiedades]...)
Permite añadir nuevas columnas a la tabla. Se deben indicar su tipo de datos y sus
propiedades si es necesario (al estilo de CREATE TABLE).
Las nuevas columnas se añaden al final, no se puede indicar otra posición. Ejemplo:
ALTER TABLE facturas ADD (fecha DATE)
borrar columnas
ALTER TABLE nombreTabla DROP(columna [,columnaSiguiente,...]);
Elimina la columna indicada de manera irreversible e incluyendo los datos que contenía.
No se puede eliminar la última columna (habrá que usar DROP TABLE).
ALTER TABLE facturas DROP (fecha);
modificar columna
Permite cambiar el tipo de datos y propiedades de una determinada columna. Sintaxis:
ALTER TABLE nombreTabla MODIFY(columna tipo [propiedades]
[columnaSiguiente tipo [propiedades] ...]
Los cambios que se permiten son (en Oracle):
Å Incrementar precisión o anchura de los tipos de datos
Å Sólo se puede reducir la anchura si la anchura máxima de un campo si esa columna
posee nulos en todos los registros, o todos los valores so o no hay registros
Å Se puede pasar de CHAR a VARCHAR y viceversa (si no se modifica la anchura)
Å Se puede pasar de DATE a TIMESTAMP y viceversa
Ejemplo:
ALTER TABLE facturas MODIFY(fecha TIMESTAMP);
renombrar columna
Esto permite cambiar el nombre de una columna. Sintaxis
ALTER TABLE nombreTabla
RENAME COLUMN nombreAntiguo TO nombreNuevo
Ejemplo:](https://d2z384uprhdr6y.cloudfront.net/6Pd715nN9rlLJY8dIR6XT0d3XokCgHbfzB6QGBA__kA/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfODEtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[81]
ALTER TABLE facturas RENAME fecha TO fechaYhora;
[5.4.10] valor por defecto
A cada columna se le puede asignar un valor por defecto durante su creación mediante
la propiedad DEFAULT. Se puede poner esta propiedad durante la creación o
modificación de la tabla, añadiendo la palabra DEFAULT tras el tipo de datos del campo
y colocando detrás el valor que se desea por defecto.
Ejemplo:
CREATE TABLE articulo (cod NUMBER(7), nombre VARCHAR2(25),
precio NUMBER(11,2) DEFAULT 3.5);
La palabra DEFAULT se puede añadir durante la creación o la modificación de la tabla
(comando ALTER TABLE)
[5.4.11] restricciones
Una restricción es una condición de obligado cumplimiento para una o más columnas de
la tabla. A cada restricción se le pone un nombre, en el caso de no poner un nombre (en
las que eso sea posible) entonces el propio Oracle le coloca el nombre que es un
mnemotécnico con el nombre de tabla, columna y tipo de restricción.
Su sintaxis general es:
{CREATE TABLE nombreTabla |
ALTER TABLE nombreTabla {ADD | MODIFY}}
(campo tipo [propiedades] [,...]
CONSTRAINT nombreRestricción tipoRestricción (columnas)
[,CONSTRAINT nombrerestricción tipoRestricción (columnas) ...)
Las restricciones tienen un nombre, se puede hacer que sea Oracle el que les ponga
nombre, pero entonces será críptico. Por eso es mejor ponerle uno mismo.
Los nombres de restricción no se pueden repetir para el mismo esquema, por lo que
es buena idea incluir de algún modo el nombre de la tabla, los campos involucrados y el
tipo de restricción en el nombre de la misma. Por ejemplo pieza_id_pk podría indicar
que el campo id de la tabla pieza tiene una clave principal (PRIMARY KEY).
Oracle aconseja esta regla a la hora de poner nombre a las restricciones:
Å Tres letras para el nombre de la tabla
Å Carácter de subrayado
Å Tres letras con la columna afectada por la restricción
Å Carácter de subrayado
Å Dos letras con la abreviatura del tipo de restricción. La abreviatura puede ser:
² NN. NOT NULL.
² PK. PRIMARY KEY](https://d2z384uprhdr6y.cloudfront.net/vd-qe2V2NAgeRoraeKPjaY0QKu-oabyLh_JgeC82tQU/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfODItbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[82]
² UK. UNIQUE
² FK. FOREIGN KEY
² CK. CHECK (validación)
Por ejemplo para hacer que la clave principal de la tabla Alumnos sea el código del
alumno, el nombre de la restricción podría ser:
alu_cod_pk
prohibir nulos
La restricción NOT NULL permite prohibir los nulos en una determinada tabla. Eso obliga
a que la columna tenga que tener obligatoriamente un valor para que sea almacenado el
registro.
Se puede colocar durante la creación (o modificación) del campo añadiendo la
palabra NOT NULL tras el tipo:
CREATE TABLE cliente(dni VARCHAR2(9) NOT NULL);
En ese caso el nombre le coloca la propia base de datos (en el caso de Oracle el nombre
sería algo como SY002341 por ejemplo). No es recomendable no poner nombre a las
restricciones para controlarlas mejor. Para poner el nombre se usa:
CREATE TABLE cliente(dni VARCHAR2(9)
CONSTRAINT cli_dni_nn NOT NULL);
La restricción NOT NULL es la única que sólo se puede poner seguida al nombre de la
columna a la que se aplica (la razón es que NOT NULL sólo se puede aplicar a un campo
a la vez)
valores únicos
Las restricciones de tipo UNIQUE obligan a que el contenido de una o más columnas no
puedan repetir valores. Nuevamente hay dos formas de colocar esta restricción:
CREATE TABLE cliente(dni VARCHAR2(9) UNIQUE);
En ese caso el nombre de la restricción la coloca el sistema Oracle. Otra forma es:
CREATE TABLE cliente(dni VARCHAR2(9) CONSTRAINT dni_u UNIQUE);
Esta forma permite poner un nombre a la restricción. Si la repetición de valores se
refiere a varios campos, la forma sería:
CREATE TABLE alquiler(dni VARCHAR2(9),
cod_pelicula NUMBER(5),
CONSTRAINT alquiler_uk UNIQUE(dni,cod_pelicula) ;
La coma tras la definición del campo cod_pelicula hace que la restricción sea
independiente de ese campo. Eso obliga a que, tras UNIQUE se indique la lista de
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/IPUgSFzTrEbMPHcc4spsBZ-jXTgyRkjULKJuke8CcWs/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfODMtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[83]
campos. Incluso para un solo campo se puede colocar la restricción al final de la lista en
lugar de definirlo a continuación del nombre y tipo de la columna.
Las claves candidatas deben llevar restricciones UNIQUE y NOT NULL
clave primaria
La clave primaria de una tabla la forman las columnas que indican a cada registro de la
misma. La clave primaria hace que los campos que la forman sean NOT NULL (sin
posibilidad de quedar vacíos) y que los valores de los campos sean de tipo UNIQUE (sin
posibilidad de repetición).
Si la clave está formada por un solo campo basta con:
CREATE TABLE cliente(
dni VARCHAR2(9) PRIMARY KEY,
nombre VARCHAR(50)) ;
O, poniendo un nombre a la restricción:
CREATE TABLE cliente(
dni VARCHAR2(9) CONSTRAINT cliente_pk PRIMARY KEY,
nombre VARCHAR(50)) ;
Si la clave está formada por más de un campo:
CREATE TABLE alquiler(dni VARCHAR2(9),
cod_pelicula NUMBER(5),
CONSTRAINT alquiler_pk PRIMARY KEY(dni,cod_pelicula) ;
clave secundaria o foránea
Una clave secundaria o foránea, es uno o más campos de una tabla que están
relacionados con la clave principal (o incluso con una clave candidata) de otra tabla.
La forma de indicar una clave foránea es:
CREATE TABLE alquiler(
dni VARCHAR2(9) CONSTRAINT dni_fk REFERENCES clientes(dni),
cod_pelicula NUMBER(5) CONSTRAINT pelicula_fk
REFERENCES peliculas(cod),
CONSTRAINT alquiler_pk PRIMARY KEY(dni,cod_pelicula)
);
Significa esta instrucción (en cuanto a claves foráneas) que el campo dni se relaciona
con la columna dni de la tabla clientes.](https://d2z384uprhdr6y.cloudfront.net/RLiExkbz_6IXPsYWYm0qpJmAvHnuCtQl-8y63GzlFWI/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfODQtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[84]
Si el campo al que se hace referencia es la clave principal, se puede obviar el nombre
del campo:
CREATE TABLE alquiler(
dni VARCHAR2(9) CONSTRAINT dni_fk REFERENCES clientes,
cod_pelicula NUMBER(5) CONSTRAINT pelicula_fk
REFERENCES peliculas,
CONSTRAINT alquiler_pk PRIMARY KEY(dni,cod_pelicula)
);
En este caso se entiende que los campos hacen referencia a las claves principales de las
tablas referenciadas (si la relación la forma más un campo, el orden de los campos debe
de ser el mismo).
Esto forma una relación entre dichas tablas, que además obliga al cumplimiento de
la integridad referencial. Esta integridad obliga a que cualquier dni incluido en la
tabla alquiler tenga que estar obligatoriamente en la tabla de clientes. De no ser así el
registro no será insertado en la tabla (ocurrirá un error).
Otra forma de crear claves foráneas (útil para claves formadas por más de un
campo) es:
CREATE TABLE existencias(
tipo CHAR2(9),
modelo NUMBER(3),
n_almacen NUMBER(1)
cantidad NUMBER(7),
CONSTRAINT exi_t_m_fk FOREIGN KEY(tipo,modelo)
REFERENCES piezas,
CONSTRAINT exi_nal_fk FOREIGN KEY(n_almacen)
REFERENCES almacenes,
CONSTRAINT exi_pk PRIMARY KEY(tipo,modelo,n_almacen)
);
Si la definición de clave secundaria se pone al final hace falta colocar el texto FOREIGN
KEY para indicar en qué campos se coloca la restricción de clave foránea. En el ejemplo
anterior es absolutamente necesario que forman la clave principal de la tabla piezas a
la que hace referencia la clave sean tipo y modelo y en que estén en ese orden.
La integridad referencial es una herramienta imprescindible de las bases de datos
relacionales. Pero provoca varios problemas. Por ejemplo, si borramos un registro en la
tabla principal que está relacionado con uno o varios de la secundaria ocurrirá un error,
ya que de permitírsenos borrar el registro ocurrirá fallo de integridad (habrá claves
secundarios refiriéndose a una clave principal que ya no existe).
Por ello se nos pueden ofrecer soluciones a añadir tras la cláusula REFERENCES:
Å ON DELETE SET NULL. Coloca nulos todas las claves secundarias relacionadas con la
borrada.
Å ON DELETE CASCADE. Borra todos los registros cuya clave secundaria es igual que
la clave del registro borrado.](https://d2z384uprhdr6y.cloudfront.net/jurYokoBnVHmqy0VR1dJyVQs1EuBOLlCh65_ArQt1-s/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfODUtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[85]
Å ON DELETE SET DEFAULT. Coloca en el registro relacionado el valor por defecto en
la columna relacionada
Å ON DELETE NOTHING. No hace nada.
En esas cuatro cláusulas se podría sustituir la palabra DELETE por la palabra UPDATE,
haciendo que el funcionamiento se refiera a cuando se modifica un registro de la tabla
principal.
En la base de datos Oracle sólo se permite utilizar ON DELETE SET NULL o ON DELETE
CASCADE.
La sintaxis completa para añadir claves foráneas es:
CREATE TABLE tabla(lista_de_campos
CONSTRAINT nombreRestriccion FOREIGN KEY (listaCampos)
REFERENCES tabla(clavePrincipalRelacionada)
[ON UPDATE {SET NULL | CASCADE}]
);
Si es de un solo campo existe esta alternativa:
CREATE TABLE tabla(lista_de_campos tipos propiedades,
nombreCampoClaveSecundaria
CONSTRAINT nombreRestriccion
REFERENCES tabla(clavePrincipalRelacionada)
[ON UPDATE {SET NULL | CASCADE}]
);
Ejemplo (no válido para Oracle, por el uso de ON UPDATE):
CREATE TABLE alquiler(dni VARCHAR2(9),
cod_pelicula NUMBER(5),
CONSTRAINT alquiler_pk PRIMARY KEY(dni,cod_pelicula),
CONSTRAINT dni_fk FOREIGN KEY (dni)
REFERENCES clientes(dni)
ON DELETE SET NULL ON UPDATE CASCADE,
CONSTRAINT pelicula_fk FOREIGN KEY (cod_pelicula)
REFERENCES peliculas(cod)
ON DELETE CASCADE
);
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/DyFJbKINCTScanRou1I97ioEzHE0OgmiXyWzJNwHu9o/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfODYtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[86]
restricciones de validación
Son restricciones que dictan una condición que deben cumplir los contenidos de una
columna. Una misma columna puede tener múltiples CHECKS en su definición (se
pondrían varios CONSTRAINT seguidos, sin comas).
Ejemplo:
CREATE TABLE ingresos(cod NUMBER(5) PRIMARY KEY,
concepto VARCHAR2(40) NOT NULL,
importe NUMBER(11,2) CONSTRAINT importe_min
CHECK (importe>0)
CONSTRAINT importe_max
CHECK (importe<8000)
);
En este caso la CHECK prohíbe añadir datos cuyo importe no esté entre 0 y 8000
Para poder hacer referencia a otras columnas hay que construir la restricción de
forma independiente a la columna (es decir al final de la tabla):
CREATE TABLE ingresos(cod NUMBER(5) PRIMARY KEY,
concepto VARCHAR2(40) NOT NULL,
importe_max NUMBER(11,2),
importe NUMBER(11,2),
CONSTRAINT importe_maximo
CHECK (importe<importe_max)
);
añadir restricciones
Es posible querer añadir restricciones tras haber creado la tabla. En ese caso se utiliza
la siguiente sintaxis:
ALTER TABLE tabla
ADD [CONSTRAINT nombre] tipoDeRestricción(columnas);
tipoRestricción es el texto CHECK, PRIMARY KEY o FOREIGN KEY. Las restricciones NOT
NULL deben indicarse mediante ALTER TABLE .. MODIFY colocando NOT NULL en el
campo que se modifica.](https://d2z384uprhdr6y.cloudfront.net/OH7BdIQ7hFC85C0MxMQVvFVwFQN86j2iX-hpfgg_id0/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfODctbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[87]
borrar restricciones
Sintaxis:
ALTER TABLE tabla
DROP PRIMARY KEY | UNIQUE(campos) |
CONSTRAINT nombreRestricción [CASCADE]
La opción PRIMARY KEY elimina una clave principal (también quitará el índice UNIQUE
sobre las campos que formaban la clave. UNIQUE elimina índices únicos. La opción
CONSTRAINT elimina la restricción indicada.
La opción CASCADE hace que se eliminen en cascada las restricciones de integridad
que dependen de la restricción eliminada.
Por ejemplo en:
CREATE TABLE curso(
cod_curso CHAR(7) PRIMARY KEY,
fecha_inicio DATE,
fecha_fin DATE,
tItulo VARCHAR2(60),
cod_siguientecurso CHAR(7),
CONSTRAINT fecha_ck CHECK(fecha_fin>fecha_inicio),
CONSTRAINT cod_ste_fk FOREIGN KEY(cod_siguientecurso)
REFERENCES curso ON DELETE SET NULL);
Tras esa definición de tabla, esta instrucción:
ALTER TABLE curso DROP PRIMARY KEY;
Produce este error (en la base de datos Oracle):
ORA-02273: a esta clave única/primaria hacen referencia
algunas claves ajenas
Para ello habría que utilizar esta instrucción:
ALTER TABLE curso DROP PRIMARY KEY CASCADE;
Esa instrucción elimina la restricción de clave secundaria antes de eliminar la principal.
También produce error esta instrucción:
ALTER TABLE curso DROP(fecha_inicio);
ERROR en línea 1:
ORA-12991: se hace referencia a la columna en una restricción
de multicolumna](https://d2z384uprhdr6y.cloudfront.net/fBDQMuhYaJKvuE69Kleth-JhEp95YY3aMe_oQvXJUTU/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfODgtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[88]
El error se debe a que no es posible borrar una columna que forma parte de la
definición de una instrucción. La solución es utilizar CASCADE CONSTRAINT elimina las
restricciones en las que la columna a borrar estaba implicada:
ALTER TABLE curso DROP(fecha_inicio) CASCADE CONSTRAINTS;
Esta instrucción elimina la restricción de tipo CHECK en la que aparecía la fecha_inicio
y así se puede eliminar la columna.
desactivar restricciones
A veces conviene temporalmente desactivar una restricción para saltarse las reglas que
impone. La sintaxis es:
ALTER TABLE tabla DISABLE CONSTRAINT nombre [CASCADE]
La opción CASCADE hace que se desactiven también las restricciones dependientes de la
que se desactivó.
activar restricciones
Anula la desactivación. Formato:
ALTER TABLE tabla ENABLE CONSTRAINT nombre [CASCADE]
Sólo se permite volver a activar si los valores de la tabla cumplen la restricción que se
activa. Si hubo desactivado en cascada, habrá que activar cada restricción
individualmente.
cambiar de nombre a las restricciones
Para hacerlo se utiliza este comando:
ALTER TABLE table RENAME CONSTRAINT
nombreViejo TO nombreNuevo;
mostrar restricciones
El trabajo con restricciones ya se ha visto que es complejo. Por eso todas las bases de
datos suelen proporcionar una vista (o más) del diccionario de datos que permite
consultar las restricciones. En el caso de Oracle, se puede utilizar la vista del
diccionario de datos USER_CONSTRAINTS.
Esta vista permite identificar las restricciones colocadas por el usuario
(ALL_CONSTRAINTS permite mostrar las restricciones de todos los usuarios, pero sólo
está permitida a los administradores). En esa vista aparece toda la información que el
diccionario de datos posee sobre las restricciones. En ella tenemos las siguientes
columnas interesantes:
Columna Tipo de datos Descripción
OWNER VARCHAR2(20) Indica el nombre del usuario propietario de la
tabla
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/Z3QYLhNClj6AYisJ0kTnYxTLwxZ4lGbfBEG3s0BtmhY/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfODktbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[89]
Columna Tipo de datos Descripción
CONSTRAINT_NAME VARCHAR2(30) Nombre de la restricción
CONSTRAINT_TYPE VARCHAR2(1) Tipo de restricción:
Å C. De tipo CHECK o NOT NULL
Å P. PRIMARY KEY
Å R. FOREIGN KEY
Å U. UNIQUE
TABLE_NAME VARCHAR2(30) Nombre de la tabla en la que se encuentra la
restricción
En el diccionario de datos hay otra vista que proporciona información sobre
restricciones, se trata de USER_CONS_COLUMNS, en dicha tabla se muestra
información sobre las columnas que participan en una restricción. Así si hemos definido
una clave primaria formada por los campos uno y dos, en la tabla USER_CONS_COLUMNS
aparecerán dos entradas, una para el primer campo del índice y otra para el segundo.
Se indicará además el orden de aparición en la restricción. Ejemplo (resultado de la
instrucción SELECT * FROM USER_CONS_COLUMNS):
OWNER CONSTRAINT_NAME TABLE_NAME COLUMN_NAME POSITION
JORGE EXIS_PK EXISTENCIAS TIPO 1
JORGE EXIS_PK EXISTENCIAS MODELO 2
JORGE EXIS_PK EXISTENCIAS N_ALMACEN 3
JORGE PIEZA_FK EXISTENCIAS TIPO 1
JORGE PIEZA_FK EXISTENCIAS MODELO 2
JORGE PIEZA_PK PIEZA TIPO 1
JORGE PIEZA_PK PIEZA MODELO 2
En esta tabla USER_CONS_COLUMNS aparece una restricción de clave primaria sobre la
tabla existencias, esta clave está formada por las columnas (tipo, modelo y
n_almacen) y en ese orden. Una segunda restricción llamada pieza_fk está compuesta
por tipo y modelo de la tabla existencias. Finalmente la restricción pieza_pk está
formada por tipo y modelo, columnas de la tabla pieza.
Para saber de qué tipo son esas restricciones, habría que acudir a la vista
USER_CONSTRAINTS.](https://d2z384uprhdr6y.cloudfront.net/WZXGA2kSLBCuWztMCED8uATFmmhUWWV6eB1X9jrQQhs/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfOTAtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[90]
[5.5]
DQL
[5.5.1] capacidades
DQL es la abreviatura del Data Query Language (lenguaje de consulta de datos) de
SQL. El único comando que pertenece a este lenguaje es el versátil comando SELECT
Este comando permite:
Å Obtener datos de ciertas columnas de una tabla (proyección)
Å Obtener registros (filas) de una tabla de acuerdo con ciertos criterios (selección)
Å Mezclar datos de tablas diferentes (asociación, join)
Å Realizar cálculos sobre los datos
Å Agrupar datos
[5.5.2] sintaxis sencilla del comando SELECT
SELECT * | {[DISTINCT] columna | expresión [[AS] alias], ...}
FROM tabla;
Donde:
Å *. El asterisco significa que se seleccionan todas las columnas
Å DISTINCT. Hace que no se muestren los valores duplicados.
Å columna. Es el nombre de una columna de la tabla que se desea mostrar
Å expresión. Una expresión válida SQL
Å alias. Es un nombre que se le da a la cabecera de la columna en el resultado de
esta instrucción.
Ejemplos:
/* Selección de todos los registros de la tabla clientes */
SELECT * FROM Clientes;
/* Selección de algunos campos*/
SELECT nombre, apellido1, apellido2 FROM Clientes;
relación con el álgebra relacional
El comando SELECT permite implementar de forma exacta todas las consultas del
álgebra relación. En concreto la proyección se implementa así. Ejemplo:
Πnombre, apellidos(Cliente)](https://d2z384uprhdr6y.cloudfront.net/atMUjl89oxyW5G89oLjRvQMuasBnT3MRhMMFtMm74m8/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfOTEtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[91]
La proyección anterior en SQL se escribe como:
SELECT nombre, apellidos FROM Cliente;
El renombrado es lo que permite realizar la cláusula AS, sólo que en SQL se utiliza
exclusivamente para abreviar las referencias a una tabla. Ejemplo:
SELECT c.nombre, c.apellidos, a.fecha
FROM Clientes AS c, ALQUILERES AS a
WHERE c.dni=a.dni;
La palabra AS se puede obviar:
SELECT c.nombre, c.apellidos, a.fecha
FROM Clientes c, ALQUILERES a
WHERE c.dni=a.dni;
[5.5.3] cálculos
aritméticos
Los operadores + (suma), - (resta), * (multiplicación) y / (división), se pueden utilizar
para hacer cálculos en las consultas. Cuando se utilizan como expresión en una consulta
SELECT, no modifican los datos originales sino que como resultado de la vista generada
por SELECT, aparece un nueva columna. Ejemplo:
SELECT nombre, precio,precio*1.16 FROM articulos
Esa consulta obtiene tres columnas. La tercera tendrá como nombre la expresión
utilizada, para poner un alias basta utilizar dicho alias tras la expresión:
SELECT nombre, precio, precio*1.16 AS precio_con_iva
FROM articulos;
La prioridad de esos operadores es la normal: tienen más prioridad la multiplicación y
división, después la suma y la resta. En caso de igualdad de prioridad, se realiza primero
la operación que esté más a la izquierda. Como es lógico se puede evitar cumplir esa
prioridad usando paréntesis; el interior de los paréntesis es lo que se ejecuta primero.
Cuando una expresión aritmética se calcula sobre valores NULL, el resultado de la
expresión es siempre NULL.
concatenación de textos
Todas las bases de datos incluyen algún operador para encadenar textos. En SQLSERVER
es el signo & en Oracle son los signos || Ejemplo (Oracle):
SELECT tipo, modelo, tipo || '-' || modelo "Clave Pieza"
FROM piezas;
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/y_D4-GsQXrZQt_xr3akn8iUp827q5p0BoQYqlaDes0k/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfOTItbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[92]
El resultado puede ser:
TIPO MODELO Clave Pieza
AR 6 AR-6
AR 7 AR-7
AR 8 AR-8
AR 9 AR-9
AR 12 AR-12
AR 15 AR-15
AR 20 AR-20
AR 21 AR-21
BI 10 BI-10
BI 20 BI-20
BI 38 BI-38
BI 57 BI-57
[5.5.4] condiciones
Se pueden realizar consultas que restrinjan los datos de salida de las tablas. Para ello se
utiliza la cláusula WHERE. Esta cláusula permite colocar una condición que han de
cumplir todos los registros, los que no la cumplan no aparecen en el resultado.
Ejemplo:
SELECT Tipo, Modelo FROM Pieza WHERE Precio>3;
relación con el álgebra relacional
La cláusula WHERE es la encargada de implementar la operación de selección del
álgebra relacional. Ejemplo:
σnombre=”Pepe” ∧edad>25 (Cliente)
Se corresponde con el SQL:
SELECT * FROM Clientes WHERE nombre=’Pepe’ AND edad>25
operadores de comparación
Se pueden utilizar en la cláusula WHERE, son:
Operador Significado
> Mayor que
< Menor que
>= Mayor o igual que
<= Menor o igual que
= Igual
<> Distinto](https://d2z384uprhdr6y.cloudfront.net/CT1MfrgT92mF6FwOKnQcK9MyWGkCzD_4hDQKR-XBRLs/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfOTMtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[93]
Operador Significado
!= Distinto
Se pueden utilizar tanto para comparar números como para comparar textos y fechas.
En el caso de los textos, las comparaciones se hacen en orden alfabético. Sólo que es un
orden alfabético estricto. Es decir el orden de los caracteres en la tabla de códigos.
En muchas bases de datos hay problemas con la Ñ y otros símbolos nacionales. No
obstante es un problema que tiende a arreglarse en la mayoría de aplicaciones.
valores lógicos
Son:
Operador Significado
AND Devuelve verdadero si las expresiones
a su izquierda y derecha son ambas
verdaderas
OR Devuelve verdadero si cualquiera de
las dos expresiones a izquierda y
derecha del OR, son verdaderas
NOT Invierte la lógica de la expresión que
está a su derecha. Si era verdadera,
mediante NOT pasa a ser falso.
Ejemplos:
/* Obtiene a las personas de entre 25 y 50 años*/
SELECT nombre,apellidos FROM personas
WHERE edad>=25 AND edad<=50;
/*Obtiene a la gente de más de 60 años o de menos de 20*/
SELECT nombre,apellidos FROM personas
WHERE edad>60 OR edad<20;
BETWEEN
El operador BETWEEN nos permite obtener datos que se encuentren en un rango. Uso:
SELECT tipo,modelo,precio FROM piezas
WHERE precio BETWEEN 3 AND 8;
Saca piezas cuyos precios estén entre 3 y 8 (ambos incluidos).
IN
Permite obtener registros cuyos valores estén en una lista:
SELECT tipo,modelo,precio FROM piezas
WHERE precio IN (3,5, 8);
Obtiene piezas cuyos precios sea 3, 5 u 8, sólo uno de esos tres.](https://d2z384uprhdr6y.cloudfront.net/RRDs4OMsv9J7ZQ3wor245Afv2VP6CZbX2hd7TSN2xro/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfOTQtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[94]
LIKE
Se usa sobre todo con textos, permite obtener registros cuyo valor en un campo cumpla
una condición textual. LIKE utiliza una cadena que puede contener estos símbolos:
Símbolo Significado
% Una serie cualquiera de caracteres
_ Un carácter cualquiera
Ejemplos:
/* Selecciona nombres que empiecen por S */
SELECT nombre FROM personas WHERE nombre LIKE 'A%';
/*Selecciona las personas cuyo apellido sea Sanchez, Senchez,
Stnchez,...*/
SELECT apellido1 FROM Personas WHERE apellido1 LIKE 'S_nchez';
IS NULL
Devuelve verdadero si una expresión contiene un nulo:
SELECT nombre,apellidos FROM personas
WHERE telefono IS NULL
Esa instrucción selecciona a la gente que no tiene teléfono. Se puede usar la expresión
IS NOT NULL que devuelve verdadero cuando una determinada columna no es nula
Precedencia de operadores
A veces las expresiones que se producen en los SELECT son muy extensas y es difícil
saber que parte de la expresión se evalúa primero, por ello se indica la siguiente tabla
de precedencia (tomada de Oracle):
Orden de precedencia Operador
1 *(Multiplicar) / (dividir)
2 + (Suma) - (Resta)
3 || (Concatenación)
4 Comparaciones (>, <, !=, ...)
5 IS [NOT] NULL, [NOT ]LIKE, IN
6 NOT
7 AND
8 OR
[5.5.5] ordenación
El orden inicial de los registros obtenidos por un SELECT no guarda más que una relación
respecto al orden en el que fueron introducidos. Para ordenar en base a criterios más
interesantes, se utiliza la cláusula ORDER BY.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/JlMg2G0ZzMEv4CyzSzshSPW3N_VZboiU1SYC8VVrOYQ/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfOTUtbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[95]
En esa cláusula se coloca una lista de campos que indica la forma de ordenar. Se
ordena primero por el primer campo de la lista, si hay coincidencias por el segundo, si
ahí también las hay por el tercero, y así sucesivamente.
Se puede colocar las palabras ASC O DESC (por defecto se toma ASC). Esas palabras
significan en ascendente (de la A a la Z, de los números pequeños a los grandes) o en
descendente (de la Z a la a, de los números grandes a los pequeños) respectivamente.
Sintaxis completa de SELECT:
SELECT expresiones
FROM tabla
[WHERE condición]
ORDER BY listaDeCamposOAlias;
[5.5.6] funciones
Todos los SGBD implementan funciones para facilitar la creación de consultas
complejas. Esas funciones dependen del SGBD que utilicemos, las que aquí se comentan
son algunas de las que se utilizan con Oracle.
Todas las funciones reciben datos para poder operar (parámetros) y devuelven un
resultado (que depende de los parámetros enviados a la función. Los argumentos se
pasan entre paréntesis:
nombreFunción[(parámetro1[, parámetro2,...])]
Si una función no precisa parámetros (como SYSDATE) no hace falta colocar los
paréntesis.
En realidad hay dos tipos de funciones:
Å Funciones que operan con datos de la misma fila
Å Funciones que operan con datos de varias filas diferentes (funciones de
agrupación).
Sólo veremos las de primeras (más adelante se comentan las de varias filas).
Nota: tabla DUAL (Oracle)
Oracle proporciona una tabla llamada dual con la que se permiten hacer pruebas. Esa
tabla tiene un solo campo (llamado DUMMY) y una sola fila de modo que es posible
hacer pruebas. Por ejemplo la consulta:
SELECT SQRT(5) FROM DUAL;
Muestra una tabla con el contenido de ese cálculo (la raíz cuadrada de 5). DUAL es una
tabla interesante para hacer pruebas.](https://d2z384uprhdr6y.cloudfront.net/EHuPEGEhmoxcS5AtY2VXf9lqbG_i-7xy5ysQfKFrJ-w/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfOTYtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[96]
funciones de caracteres
conversión del texto a mayúsculas y minúsculas
Son:
Función Descripción
LOWER(texto) Convierte el texto a minúsculas (funciona con
los caracteres españoles)
UPPER(texto) Convierte el texto a mayúsculas
INITCAP(texto) Coloca la primera letra de cada palabra en
mayúsculas
funciones de transformación
Función Descripción
RTRIM(texti) Elimina los espaciosa la derecha del texto
LTRIM(texto) Elimina los espacios a la izquierda que posea el
texto
TRIM(texto) Elimina los espacios en blanco a la izquierda y
la derecha del texto y los espacios dobles del
interior.
TRIM(caracteres FROM texto) Elimina del texto los caracteres indicados. Por
ejemplo TRIM('h' FROM nombre) elimina las
haches de la columna nombre que estén a la
izquierda y a la derecha
SUBSTR(texto,n[,m]) Obtiene los m siguientes caracteres del texto a
partir de la posición n (si m no se indica se
cogen desde n hasta el final).
LENGTH(texto) Obtiene el tamaño del texto
INSTR(texto, textoBuscado
[,posInicial [, nAparición]])
Obtiene la posición en la que se encuentra el
texto buscado en el texto inicial. Se puede
empezar a buscar a partir de una posición
inicial concreta e incluso indicar el número de
aparición del texto buscado.
Ejemplo, si buscamos la letra a y ponemos 2 en
nAparición, devuelve la posición de la segunda
letra a del texto).
Si no lo encuentra devuelve 0
REPLACE(texto, textoABuscar,
textoReemplazo)
Buscar el texto a buscar en un determinado
texto y lo cambia por el indicado como texto
de reemplazo](https://d2z384uprhdr6y.cloudfront.net/FY_WJD_ExZ68ph6WcvO5HA4TgPc0RWgDI7jEHwZk9J8/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfOTctbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[97]
funciones numéricas
redondeos
Función Descripción
ROUND(n,decimales) Redondea el número al siguiente número con
el número de decimales indicado más cercano.
ROUND(8.239,2) devuelve 8.3
TRUNC(n,decimales) Los decimales del número se cortan para que
sólo aparezca el número de decimales indicado
matemáticas
Función Descripción
MOD(n1,n2) Devuelve el resto resultado de dividir n1 entre
n2
POWER(valor,exponente) Eleva el valor al exponente indicado
SQRT(n) Calcula la raíz cuadrada de n
SIGN(n) Devuelve 1 si n es positivo, cero si vale cero y
-1 si es negativo
ABS(n) Calcula el valor absoluto de n
EXP(n) Calcula en, es decir el exponente en base e del
número n
LN(n) Logaritmo neperiano de n
LOG(n) Logaritmo en base 10 de n
SIN(n) Calcula el seno de n (n tiene que estar en
radianes)
COS(n) Calcula el coseno de n (n tiene que estar en
radianes)
TAN(n) Calcula la tangente de n (n tiene que estar en
radianes)
ACOS(n) Devuelve en radianes el arcocoseno de n
ASIN(n) Devuelve en radianes el arcoseno de n
ATAN(n) Devuelve en radianes el arcotangente de n
SINH(n) Devuelve el seno hiperbólico de n
COSH(n) Devuelve el coseno hiperbólico de n
TANH(n) Devuelve la tangente hiperbólica de n
funciones de trabajo con nulos
Permiten definir valores a utilizar en el caso de que las expresiones tomen el valor nulo.
Función Descripción
NVL(valor,sustituto) Si el valor es NULL, devuelve el valor sustituto;
de otro modo, devuelve valor
NVL2(valor,sustituto1,
sustituto2)
Variante de la anterior, devuelve el valor
sustituto1 si valor no es nulo. Si valor es nulo
devuelve el sustituto2
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/dZaH0S9IrOPt019Ob6tlU0VIBTs52QUW2HzKx27cSIY/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfOTgtbC53ZWJw.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[98]
funciones de fecha y manejo de fechas
Las fechas se utilizan muchísimo en todas las bases de datos. Oracle proporciona dos
tipos de datos para manejar fechas, los tipos DATE y TIMESTAMP. En el primer caso se
almacena una fecha concreta (que incluso puede contener la hora), en el segundo caso
se almacena un instante de tiempo más concreto que puede incluir incluso fracciones de
segundo.
Hay que tener en cuenta que a los valores de tipo fecha se les pueden sumar
números y se entendería que esta suma es de días. Si tiene decimales entonces se
suman días, horas, minutos y segundos. La diferencia entre dos fechas también obtiene
un número de días.
intervalos
Los intervalos son datos relacionados con las fechas en sí, pero que no son fechas. Hay
dos tipos de intervalos el INTERVAL DAY TO SECOND que sirve para representar días,
horas, minutos y segundos; y el INTERVAL YEAR TO MONTH que representa años y
meses.
Para los intervalos de año a mes los valores se pueden indicar de estas formas:
/* 123 años y seis meses */
INTERVAL '123-6' YEAR(4) TO MONTH
/* 123 años */
INTERVAL '123' YEAR(4) TO MONTH
/* 6 meses */
INTERVAL '6' MONTH(3) TO MONTH
La precisión en el caso de indicar tanto años como meses, se indica sólo en el año. En
intervalos de días a segundos los intervalos se pueden indicar como:
/* 4 días 10 horas 12 minutos y 7 con 352 segundos */
INTERVAL '4 10:12:7,352' DAY TO SECOND(3)
/* 4 días 10 horas 12 minutos */
INTERVAL '4 10:12' DAY TO MINUTE
/* 4 días 10 horas */
INTERVAL '4 10' DAY TO HOUR
/* 4 días*/
INTERVAL '4' DAY
/*10 horas*/
INTERVAL '10' HOUR
/*25 horas*/
INTERVAL '253' HOUR
/*12 minutos*/
INTERVAL '12' MINUTE
/*30 segundos */
INTERVAL '30' SECOND
/*8 horas y 50 minutos */
INTERVAL ('8:50') HOUR TO MINUTE;](https://d2z384uprhdr6y.cloudfront.net/DAhcgEyJ6YTsy5xTOpufiswvAWkKyuI1g4Omh2cai3A/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfOTktbC53ZWJw.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[99]
/*7 minutos 6 segundos*/
INTERVAL ('7:06') MINUTE TO SECOND;
/*8 horas 7 minutos 6 segundos*/
INTERVAL ('8:07:06') HOUR TO SECOND;
Esos intervalos se pueden sumar a valores de tipo DATE o TIMESTAMP
obtener la fecha y hora actual
Función Descripción
SYSDATE Obtiene la fecha y hora actuales
SYSTIMESTAMP Obtiene la fecha y hora actuales en formato
TIMESTAMP
calcular fechas
Función Descripción
ADDMONTHS(fecha,n) Añade a la fecha el número de meses indicado
por n
MONTHS_BETWEEN(fecha1,
fecha2)
Obtiene la diferencia en meses entre las dos
fechas (puede ser decimal)
NEXT_DAY(fecha,día) Indica cual es el día que corresponde a añadir
a la fecha el día indicado. El día puede ser el
texto 'Lunes', 'Martes', 'Miércoles',... (si la
configuración está en español) o el número de
día de la semana (1=lunes, 2=martes,...)
LAST_DAY(fecha) Obtiene el último día del mes al que pertenece
la fecha. Devuelve un valor DATE
EXTRACT(valor FROM fecha) Extrae un valor de una fecha concreta. El valor
puede ser day (día), month (mes), year (año),
etc.
GREATEST(fecha1, fecha2,..) Devuelve la fecha más moderna la lista
LEAST(fecha1, fecha2,..) Devuelve la fecha más antigua la lista
ROUND(fecha [,'formato'] Redondea la fecha al valor de aplicar el
formato a la fecha. El formato puede ser:
'YEAR' Hace que la fecha refleje el año
completo
'MONTH' Hace que la fecha refleje el mes
completo más cercano a la fecha
'HH24' Redondea la hora a las 00:00 más
cercanas
'DAY’ Redondea al día más cercano
TRUNC(fecha [formato]) Igual que el anterior pero trunca la fecha en
lugar de redondearla.](https://d2z384uprhdr6y.cloudfront.net/mgsXsLdty_sR6pdVDcENb_4I-OMiAETeRGk8YZV0HcI/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTAwLWwud2VicA==.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[100]
funciones de conversión
Oracle es capaz de convertir datos automáticamente a fin de que la expresión final
tenga sentido. En ese sentido son fáciles las conversiones de texto a número y
viceversa. Ejemplo:
SELECT 5+'3' FROM DUAL /*El resultado es 8 */
SELECT 5 || '3' FROM DUAL /* El resultado es 53 */
También ocurre eso con la conversión de textos a fechas. De hecho es forma habitual de
asignar fechas.
Pero en diversas ocasiones querremos realizar conversiones explícitas.
TO_CHAR
Obtiene un texto a partir de un número o una fecha. En especial se utiliza con fechas
(ya que de número a texto se suele utilizar de forma implícita.
fechas
En el caso de las fechas se indica el formato de conversión, que es una cadena que
puede incluir estos símbolos (en una cadena de texto):
Símbolo Significado
YY Año en formato de dos cifras
YYYY Año en formato de cuatro cifras
MM Mes en formato de dos cifras
MON Las tres primeras letras del mes
MONTH Nombre completo del mes
DY Día de la semana en tres letras
DAY Día completo de la semana
DD Día en formato de dos cifras
D Día de la semana (del 1 al 7)
Q Semestre
WW Semana del año
D Día de la semana (del 1 al 7)
DDD Día del año
AM Indicador AM
PM Indicador PM
HH12 Hora de 1 a 12
HH24 Hora de 0 a 23
MI Minutos (0 a 59)
SS Segundos (0 a 59)
SSSS Segundos desde medianoche
/ . ,:;’ Posición de los separadores, donde se pongan
estos símbolos aparecerán en el resultado
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/8TFqUSoqO31n0Hbrtt-SdrgVsbLGORSBDhpvIsmuKAY/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTAxLWwud2VicA==.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[101]
Ejemplos:
SELECT TO_CHAR(SYSDATE, 'DD/MONTH/YYYY, DAY HH:MI:SS')
FROM DUAL
/* Sale : 16/AGOSTO /2004, LUNES 08:35:15, por ejemplo
números
Para convertir números a textos se usa está función cuando se desean características
especiales. En ese caso en el formato se pueden utilizar estos símbolos:
Símbolo Significado
9 Posición del número
0 Posición del número (muestra ceros)
$ Formato dólar
L Símbolo local de la moneda
S Hace que aparezca el símbolo del signo
D Posición del símbolo decimal (en español, la
coma)
G Posición del separador de grupo (en español el
punto)
TO_NUMBER
Convierte textos en números. Se indica el formato de la conversión (utilizando los
mismos símbolos que los comentados anteriormente).
TO_DATE
Convierte textos en fechas. Como segundo parámetro se utilizan los códigos de formato
de fechas comentados anteriormente.
[5.5.7] obtener datos de múltiples tablas
Es más que habitual necesitar en una consulta datos que se encuentran distribuidos en
varias tablas. Las bases de datos relacionales se basan en que los datos se distribuyen
en tablas que se pueden relacionar mediante un campo. Ese campo es el que permite
integrar los datos de las tablas.
Por ejemplo si disponemos de una tabla de empleados cuya clave es el dni y otra
tabla de tareas que se refiere a tareas realizadas por los empleados, es seguro (si el
diseño está bien hecho) que en la tabla de tareas aparecerá el dni del empleado para
saber qué empleado realizó la tarea.
producto cruzado o cartesiano de tablas
En el ejemplo anterior si quiere obtener una lista de los datos de las tareas y los
empleados, se podría hacer de esta forma:
SELECT cod_tarea, descripcion_tarea, dni_empleado,
nombre_empleado
FROM tareas,empleados;](https://d2z384uprhdr6y.cloudfront.net/U_nMOsw5gLiQvQ0hsHLkTvoASfSq3WDBNFDtxg0eGBA/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTAyLWwud2VicA==.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[102]
La sintaxis es correcta ya que, efectivamente, en el apartado FROM se pueden indicar
varias tareas separadas por comas. Pero eso produce un producto cruzado, aparecerán
todos los registros de las tareas relacionados con todos los registros de empleados.
El producto cartesiano a veces es útil para realizar consultas complejas, pero en el
caso normal no lo es. necesitamos discriminar ese producto para que sólo aparezcan los
registros de las tareas relacionadas con sus empleados correspondientes. A eso se le
llama asociar (join) tablas
asociando tablas
La forma de realizar correctamente la consulta anterior (asociado las tareas con los
empleados que la realizaron sería:
SELECT cod_tarea, descripcion_tarea, dni_empleado,
nombre_empleado
FROM tareas,empleados
WHERE tareas.dni_empleado = empleados.dni;
Nótese que se utiliza la notación tabla.columna para evitar la ambigüedad, ya que el
mismo nombre de campo se puede repetir en ambas tablas. Para evitar repetir
continuamente el nombre de la tabla, se puede utilizar un alias de tabla:
SELECT a.cod_tarea, a.descripcion_tarea, b.dni_empleado,
b.nombre_empleado
FROM tareas a,empleados b
WHERE a.dni_empleado = b.dni;
Al apartado WHERE se le pueden añadir condiciones encadenándolas con el operador
AND. Ejemplo:
SELECT a.cod_tarea, a.descripcion_tarea
FROM tareas a,empleados b
WHERE a.dni_empleado = b.dni AND b.nombre_empleado='Javier';
Finalmente indicar que se pueden enlazar más de dos tablas a través de sus campos
relacionados. Ejemplo:
SELECT a.cod_tarea, a.descripcion_tarea, b.nombre_empleado,
c.nombre_utensilio
FROM tareas a,empleados b, utensilios_utilizados c
WHERE a.dni_empleado = b.dni AND a.cod_tarea=c.cod_tarea;
relaciones sin igualdad
A las relaciones descritas anteriormente se las llama relaciones en igualdad (equijoins),
ya que las tablas se relacionan a través de campos que contienen valores iguales en dos
tablas.](https://d2z384uprhdr6y.cloudfront.net/-p3ta5HEjJRAY56WNrLssardCo30havzRdunAD6NDZ0/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTAzLWwud2VicA==.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[103]
Sin embargo no siempre las tablas tienen ese tipo de relación, por ejemplo:
EMPLEADOS
Empleado Sueldo
Antonio 18000
Marta 21000
Sonia 15000
CATEGORIAS
categoría Sueldo mínimo Sueldo máximo
D 6000 11999
C 12000 17999
B 18000 20999
A 20999 80000
En el ejemplo anterior podríamos averiguar la categoría a la que pertenece cada
empleado, pero estas tablas poseen una relación que ya no es de igualdad.
La forma sería:
SELECT a.empleado, a.sueldo, b.categoria
FROM empleados a, categorias b
WHERE a.sueldo between b.sueldo_minimo and b.sueldo_maximo;
sintaxis SQL 1999
En la versión SQL de 1999 se ideó una nueva sintaxis para consultar varias tablas. La
razón fue separar las condiciones de asociación respecto de las condiciones de selección
de registros. Oracle incorpora totalmente esta normativa.
La sintaxis completa es:
SELECT tabla1.columna1, tabl1.columna2,...
tabla2.columna1, tabla2.columna2,... FROM tabla1
[CROSS JOIN tabla2]|
[NATURAL JOIN tabla2]|
[JOIN tabla2 USING(columna)]|
[JOIN tabla2 ON (tabla1.columa=tabla2.columna)]|
[LEFT|RIGHT|FULL OUTER JOIN tabla2 ON
(tabla1.columa=tabla2.columna)]
Se describen sus posibilidades en los siguientes apartados.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/TkzrTZgblUcamGNBvmxLthKxKyUCOoafFYoK65quz3Y/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTA0LWwud2VicA==.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[104]
CROSS JOIN
Utilizando la opción CROSS JOIN se realiza un producto cruzado entre las tablas
indicadas. Esta orden es equivalente al producto del álgebra relacional. Ejemplo:
Å álgebra relacional: R × S
Å SQL. SELECT * FROM R CROSS JOIN S;
NATURAL JOIN
Establece una relación de igualdad entre las tablas a través de los campos que tengan el
mismo nombre en ambas tablas:
SELECT * FROM piezas
NATURAL JOIN existencias;
En ese ejemplo se obtienen los registros de piezas relacionados en existencias a través
de los campos que tengan el mismo nombre en ambas tablas.
Equivalencia con el álgebra relacional:
Å álgebra relacional: R∞S
Å SQL: SELECT * FROM R NATURAL JOIN S;
JOIN USING
Permite establecer relaciones indicando qué campo (o campos) común a las dos tablas
hay que utilizar:
SELECT * FROM piezas
JOIN existencias USING(tipo,modelo);
Equivalencia con el álgebra relacional:
Å álgebra relacional:
cliente ∞ alquiler
dni
Å SQL. SELECT * FROM clientes JOIN alquiler USING(dni);
JOIN ON
Permite establecer relaciones cuya condición se establece manualmente, lo que
permite realizar asociaciones más complejas o bien asociaciones cuyos campos en las
tablas no tienen el mismo nombre:
SELECT * FROM piezas
JOIN existencias ON(piezas.tipo=existencias.tipo AND
piezas.modelo=existencias.modelo);
Equivalencia con el álgebra relacional:
Å álgebra relacional:](https://d2z384uprhdr6y.cloudfront.net/swz-tXF1_Ykdlostgp_ha2Uk4XOTFHbu5dX8050TyqM/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTA1LWwud2VicA==.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[105]
localidades ∞ provincias
provincias.id_capital=localidades.id_localidad
Å SQL. SELECT * FROM localidades JOIN provincias
USING(provincias.id_capital=localidades.id_capital);
relaciones externas
La última posibilidad es obtener relaciones laterales o externas (outer join). Para ello
se utiliza la sintaxis:
SELECT * FROM piezas
LEFT OUTER JOIN existencias
ON(piezas.tipo=existencias.tipo AND
piezas.modelo=existencias.modelo);
En este consulta además de las relacionadas, aparecen los datos de los registros de la
tabla piezas que no están en existencias. Si el LEFT lo cambiamos por un RIGHT,
aparecerán las existencias no presentes en la tabla piezas (además de las relacionadas
en ambas tablas).
La condición FULL OUTER JOIN produciría un resultado en el que aparecen los
registros no relacionados de ambas tablas.
[5.5.8] agrupaciones
Es muy común utilizar consultas en las que se desee agrupar los datos a fin de realizar
cálculos en vertical, es decir calculados a partir de datos de distintos registros.
Para ello se utiliza la cláusula GROUP BY que permite indicar en base a qué registros
se realiza la agrupación. Con GROUP BY la instrucción SELECT queda de esta forma:
SELECT listaDeExpresiones
FROM listaDeTablas
[JOIN tablasRelacionadasYCondicionesDeRelación]
[WHERE condiciones]
[GROUP BY grupos]
[HAVING condiciones de grupo]
[ORDER BY columnas];
En el apartado GROUP BY, se indican las columnas por las que se agrupa. La función de
este apartado es crear un único registro por cada valor distinto en las columnas del
grupo. Si por ejemplo agrupamos en base a las columnas tipo y modelo en una tabla de
existencias, se creará un único registro por cada tipo y modelo distintos:
SELECT tipo,modelo
FROM existencias
GROUP BY tipo,modelo;
Si la tabla de existencias sin agrupar es:](https://d2z384uprhdr6y.cloudfront.net/mBe7HY_LjDtFSF1kSAf2GibyWBMAo7jrrm2uqoIuohw/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTA2LWwud2VicA==.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[106]
TI MODELO N_ALMACEN CANTIDAD
AR 6 1 2500
AR 6 2 5600
AR 6 3 2430
AR 9 1 250
AR 9 2 4000
AR 9 3 678
AR 15 1 5667
AR 20 3 43
BI 10 2 340
BI 10 3 23
BI 38 1 1100
BI 38 2 540
BI 38 3
La consulta anterior creará esta salida:
TI MODELO
AR 6
AR 9
AR 15
AR 20
BI 10
BI 38
Es decir es un resumen de los datos anteriores. Los datos n_almacen y cantidad no
están disponibles directamente ya que son distintos en los registros del mismo grupo.
Sólo se pueden utilizar desde funciones (como se verá ahora). Es decir esta consulta es
errónea:
SELECT tipo,modelo, cantidad
FROM existencias
GROUP BY tipo,modelo;
SELECT tipo,modelo, cantidad
*
ERROR en línea 1:
ORA-00979: no es una expresión GROUP BY
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/5I4roMREfl5LZdCzUYbsL1kQRlYa9j-8GO3oOMymBTQ/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTA3LWwud2VicA==.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[107]
funciones de cálculo con grupos
Lo interesante de la creación de grupos es las posibilidades de cálculo que ofrece. Para
ello se utilizan funciones que permiten trabajar con los registros de un grupo son:
Función Significado
COUNT(*) Cuenta los elementos de un grupo. Se utiliza el
asterisco para no tener que indicar un nombre
de columna concreto, el resultado es el mismo
para cualquier columna
SUM(expresión) Suma los valores de la expresión
AVG(expresión) Calcula la media aritmética sobre la expresión
indicada
MIN(expresión) Mínimo valor que toma la expresión indicada
MAX(expresión) Máximo valor que toma la expresión indicada
STDDEV(expresión) Calcula la desviación estándar
VARIANCE(expresión) Calcula la varianza
Todos esos valores se calculan para cada elemento del grupo, así la expresión:
SELECT tipo,modelo, cantidad, SUM(Cantidad)
FROM existencias
GROUP BY tipo,modelo;
Obtiene este resultado:
TI MODELO SUM(CANTIDAD)
AR 6 10530
AR 9 4928
AR 15 5667
AR 20 43
BI 10 363
BI 38 1740
Se suman las cantidades para cada grupo
condiciones HAVING
A veces se desea restringir el resultado de una expresión agrupada, por ejemplo con:
SELECT tipo,modelo, cantidad, SUM(Cantidad)
FROM existencias
WHERE SUM(Cantidad)>500
GROUP BY tipo,modelo;](https://d2z384uprhdr6y.cloudfront.net/6P_Ks_cAOLO5Lznj2T9eKBvwxRJO75oNJuR1XoRfSyk/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTA4LWwud2VicA==.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[108]
Pero Oracle devolvería este error:
WHERE SUM(Cantidad)>500
*
ERROR en línea 3:
ORA-00934: función de grupo no permitida aquí
La razón es que Oracle calcula primero el WHERE y luego los grupos; por lo que esa
condición no la puede realizar al no estar establecidos los grupos.
Por ello se utiliza la cláusula HAVING, que se ejecuta una vez realizados los grupos.
Se usaría de esta forma:
SELECT tipo,modelo, cantidad, SUM(Cantidad)
FROM existencias
GROUP BY tipo,modelo
HAVING SUM(Cantidad)>500;
Eso no implica que no se pueda usar WHERE. Esta expresión sí es válida:
SELECT tipo,modelo, cantidad, SUM(Cantidad)
FROM existencias
WHERE tipo!='AR'
GROUP BY tipo,modelo
HAVING SUM(Cantidad)>500;
En definitiva, el orden de ejecución de la consulta marca lo que se puede utilizar con
WHERE y lo que se puede utilizar con HAVING:
Para evitar problemas estos podrían ser los pasos en la ejecución de una instrucción
de agrupación por parte del gestor de bases de datos:
[1] Seleccionar las filas deseadas utilizando WHERE. Esta cláusula eliminará
columnas en base a la condición indicada
[2] Se establecen los grupos indicados en la cláusula GROUP BY
[3] Se calculan los valores de las funciones de totales (COUNT, SUM, AVG,...)
[4] Se filtran los registros que cumplen la cláusula HAVING
[5] El resultado se ordena en base al apartado ORDER BY.](https://d2z384uprhdr6y.cloudfront.net/r1iDZOe1Bwcogf6NcGW17UtxG1qLy6vod34DZb9YYVw/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTA5LWwud2VicA==.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[109]
[5.5.9] subconsultas
Se trata de una técnica que permite utilizar el resultado de una tabla SELECT en otra
consulta SELECT. Permite solucionar problemas en los que el mismo dato aparece dos
veces.
La sintaxis es:
SELECT listaExpresiones
FROM tabla
WHERE expresión operador
(SELECT listaExpresiones
FROM tabla);
Se puede colocar el SELECT dentro de las cláusulas WHERE, HAVING o FROM. El operador
puede ser >,<,>=,<=,!=, = o IN.
Ejemplo:
SELECT nombre_empleado, paga
FROM empleados
WHERE paga <
(SELECT paga FROM empleados
WHERE nombre_empleado='Martina')
;
Lógicamente el resultado de la subconsulta debe incluir el campo que estamos
analizando. Se pueden realizar esas subconsultas las veces que haga falta:
SELECT nombre_empleado, paga
FROM empleados
WHERE paga <
(SELECT paga FROM empleados
WHERE nombre_empleado='Martina')
AND paga >
(SELECT paga FROM empleados WHERE nombre_empleado='Luis');
La última consulta obtiene los empleados cuyas pagas estén entre lo que gana Luis y lo
que gana Martina.
Una subconsulta que utilice los valores >,<,>=,... tiene que devolver un único valor,
de otro modo ocurre un error. Pero a veces se utilizan consultas del tipo: mostrar el
sueldo y nombre de los empleados cuyo sueldo supera al de cualquier empleado del
departamento de ventas.
La subconsulta necesaria para ese resultado mostraría los sueldos del departamento
de ventas. Pero no podremos utilizar un operador de comparación directamente ya que
compararíamos un valor con muchos valores. La solución a esto es utilizar instrucciones
especiales entre el operador y la consulta.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/9mE5AX6AvtxCAbP2DquT8F8ICBqYJXBTijy7kPzZbi0/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTEwLWwud2VicA==.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[110]
Esas instrucciones son:
Instrucción Significado
ANY Compara con cualquier registro de la consulta.
La instrucción es válida si hay un registro en la
subconsulta que permite que la comparación
sea cierta
ALL Compara con todos los registros de la consulta.
La instrucción resulta cierta si es cierta toda
comparación con los registros de la
subconsulta
IN No usa comparador, ya que sirve para
comprobar si un valor se encuentra en el
resultado de la subconsulta
NOT IN Comprueba si un valor no se encuentra en una
subconsulta
Ejemplo:
SELECT nombre, sueldo
FROM empleados
WHERE sueldo >= ALL (SELECT sueldo FROM empleados)
Esa consulta obtiene el empleado que más cobra. Otro ejemplo:
SELECT nombre FROM empleados
WHERE dni IN (SELECT dni FROM directivos)
En ese caso se obtienen los nombres de los empleados cuyos dni están en la tabla de
directivos.
[5.5.10] combinaciones especiales
uniones
La palabra UNION permite añadir el resultado de un SELECT a otro SELECT. Para ello
ambas instrucciones tienen que utilizar el mismo número y tipo de columnas. Ejemplo:
SELECT nombre FROM provincias
UNION
SELECT nombre FROM comunidades
El resultado es una tabla que contendrá nombres de provincia y de comunidades. Es
decir, UNION crea una sola tabla con registros que estén presentes en cualquiera de las
consultas. Si están repetidas sólo aparecen una vez, para mostrar los duplicados se
utiliza UNION ALL en lugar de la palabra UNION.](https://d2z384uprhdr6y.cloudfront.net/wehJDRAVncNjkUCvdHsdkIkIZe5Fdb3tuX7Oo58pV1E/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTExLWwud2VicA==.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[111]
intersecciones
De la misma forma, la palabra INTERSECT permite unir dos consultas SELECT de modo
que el resultado serán las filas que estén presentes en ambas consultas.
diferencia
Con MINUS también se combinan dos consultas SELECT de forma que aparecerán los
registros del primer SELECT que no estén presentes en el segundo.
Se podrían hacer varias combinaciones anidadas (una unión cuyo resultado se
intersectara con otro SELECT por ejemplo), en ese caso es conveniente utilizar
paréntesis para indicar qué combinación se hace primero:
(SELECT....
....
UNION
SELECT....
...
)
MINUS
SELECT.... /* Primero se hace la unión y luego la diferencia*/
[5.6]
DML
[5.6.1] introducción
Es una de las partes fundamentales del lenguaje SQL. El DML (Data Manipulation
Language) lo forman las instrucciones capaces de modificar los datos de las tablas. Al
conjunto de instrucciones DML que se ejecutan consecutivamente, se las llama
transacciones y se pueden anular todas ellas o aceptar, ya que una instrucción DML no
es realmente efectuada hasta que no se acepta (commit).
En todas estas consultas, el único dato devuelto por Oracle es el número de registros
que se han modificado.
[5.6.2] inserción de datos
La adición de datos a una tabla se realiza mediante la instrucción INSERT. Su sintaxis
fundamental es:
INSERT INTO tabla [(listaDeCampos)]
VALUES (valor1 [,valor2 ...])
La tabla representa la tabla a la que queremos añadir el registro y los valores que
siguen a VALUES son los valores que damos a los distintos campos del registro. Si no se](https://d2z384uprhdr6y.cloudfront.net/n1jO0Pj3xloQf857UCVyZWBv9qnZopDpMC8hIyh8A3c/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTEyLWwud2VicA==.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[112]
especifica la lista de campos, la lista de valores debe seguir el orden de las columnas
según fueron creados (es el orden de columnas según las devuelve el comando
DESCRIBE).
La lista de campos a rellenar se indica si no queremos rellenar todos los campos. Los
campos no rellenados explícitamente con la orden INSERT, se rellenan con su valor por
defecto (DEFAULT) o bien con NULL si no se indicó valor alguno. Si algún campo tiene
restricción de tipo NOT NULL, ocurrirá un error si no rellenamos el campo con algún
valor.
Por ejemplo, supongamos que tenemos una tabla de clientes cuyos campos son: dni,
nombre, apellido1, apellido2, localidad y dirección; supongamos que ese es el orden de
creación de los campos de esa tabla y que la localidad tiene como valor por defecto
Palencia y la dirección no tiene valor por defecto. En ese caso estas dos instrucciones
son equivalentes:
INSERT INTO clientes
VALUES('11111111','Pedro','Gutiérrez', 'Crespo',DEFAULT,NULL);
INSERT INTO clientes(dni,nombre,apellido1,apellido2)
VALUES('11111111','Pedro','Gutiérrez', 'Crespo')
Son equivalentes puesto que en la segunda instrucción los campos no indicados se
rellenan con su valor por defecto y la dirección no tiene valor por defecto. La palabra
DEFAULT fuerza a utilizar ese valor por defecto.
El uso de los distintos tipos de datos debe de cumplir los requisitos ya comentados
en temas anteriores (véase tipos de datos, página 77).
relleno de registros a partir de filas de una consulta
Hay un tipo de consulta, llamada de adición de datos, que permite rellenar datos de una
tabla copiando el resultado de una consulta.
Ese relleno se basa en una consulta SELECT que poseerá los datos a añadir.
Lógicamente el orden de esos campos debe de coincidir con la lista de campos indicada
en la instrucción INDEX. Sintaxis:
INSERT INTO tabla (campo1, campo2,...)
SELECT campoCompatibleCampo1, campoCompatibleCampo2,...
FROM tabla(s)
[...otras cláusulas del SELECT...]
Ejemplo:
INSERT INTO clientes2004 (dni, nombre, localidad, direccion)
SELECT dni, nombre, localidad, direccion
FROM clientes
WHERE problemas=0;
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/TK2G7dUSzij-yUrWR9wHOIYqfmbp8E2rH_ujpDmX9v8/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTEzLWwud2VicA==.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[113]
[5.6.3] actualización de registros
La modificación de los datos de los registros lo implementa la instrucción UPDATE.
Sintaxis:
UPDATE tabla
SET columna1=valor1 [,columna2=valor2...]
[WHERE condición]
Se modifican las columnas indicadas en el apartado SET con los valores indicados. La
cláusula WHERE permite especificar qué registros serán modificados.
Ejemplos:
UPDATE clientes SET provincia='Ourense'
WHERE provincia='Orense';
UPDATE productos SET precio=precio*1.16;
El primer dato actualiza la provincia de los clientes de Orense para que aparezca como
Ourense. El segundo UPDATE incrementa los precios en un 16%. La expresión para el
valor puede ser todo lo compleja que se desee:
UPDATE partidos SET fecha= NEXT_DAY(SYSDATE,'Martes')
WHERE fecha=SYSDATE;
Incluso se pueden utilizar subconsultas:
UPDATE empleados
SET puesto_trabajo=(SELECT puesto_trabajo
FROM empleados
WHERE id_empleado=12)
WHERE seccion=23;
Esta consulta coloca a todos los empleados de la sección 23 el mismo puesto de trabajo
que el empleado número 12. Este tipo de actualizaciones sólo son válidas si el subselect
devuelve un único valor, que además debe de ser compatible con la columna que se
actualiza.
Hay que tener en cuenta que las actualizaciones no pueden saltarse las reglas de
integridad que posean las tablas.
[5.6.4] borrado de registros
Se realiza mediante la instrucción DELETE:
DELETE [FROM] tabla
[WHERE condición]](https://d2z384uprhdr6y.cloudfront.net/zc3yBtu11fG0tHy_NngYW31yIz8XsikopoGHtsMI6o8/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTE0LWwud2VicA==.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[114]
Es más sencilla que las anteriores, elimina los registros de la tabla que cumplan la
condición indicada. Ejemplos:
DELETE FROM empleados
WHERE seccion=23;
DELETE FROM empleados
WHERE id_empleado IN (SELECT id_empleado FROM errores_graves);
Hay que tener en cuenta que el borrado de un registro no puede provocar fallos de
integridad y que la opción de integridad ON DELETE CASCADE (véase página 83, clave
secundaria o foránea) hace que no sólo se borren los registros indicados en el SELECT,
sino todos los relacionados.
[5.6.5] transacciones
Como se ha comentado anteriormente, una transacción está formada por una serie de
instrucciones DML. Una transacción comienza con la primera instrucción DML que se
ejecute y finaliza con alguna de estas circunstancias:
Å Una operación COMMIT o ROLLBACK
Å Una instrucción DDL (como ALTER TABLE por ejemplo)
Å Una instrucción DCL (como GRANT)
Å El usuario abandona la sesión
Å Caída del sistema
Hay que tener en cuenta que cualquier instrucción DDL o DCL da lugar a un COMMIT
implícito, es decir todas las instrucciones DML ejecutadas hasta ese instante pasan a ser
definitivas.
COMMIT
La instrucción COMMIT hace que los cambios realizados por la transacción sean
definitivos, irrevocables. Sólo se debe utilizar si estamos de acuerdo con los cambios,
conviene asegurarse mucho antes de realizar el COMMIT ya que las instrucciones
ejecutadas pueden afectar a miles de registros.
Además el cierre correcto de la sesión da lugar a un COMMIT, aunque siempre
conviene ejecutar explícitamente esta instrucción a fin de asegurarnos de lo que
hacemos.
ROLLBACK
Esta instrucción regresa a la instrucción anterior al inicio de la transacción,
normalmente el último COMMIT, la última instrucción DDL o DCL o al inicio de sesión.
Anula definitivamente los cambios, por lo que conviene también asegurarse de esta
operación.
Un abandono de sesión incorrecto o un problema de comunicación o de caída del
sistema dan lugar a un ROLLBACK implícito.](https://d2z384uprhdr6y.cloudfront.net/d74aHeDHmcFAmBoBxZB7KlB6Vpj-wVD0iCA3yJdbW4o/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTE1LWwud2VicA==.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[115]
estado de los datos durante la transacción
Si se inicia una transacción usando comandos DML hay que tener en cuenta que:
Å Se puede volver a la instrucción anterior a la transacción cuando se desee
Å Las instrucciones de consulta SELECT realizadas por el usuario que inició la
transacción muestran los datos ya modificados por las instrucciones DML
Å El resto de usuarios ven los datos tal cual estaban antes de la transacción, de hecho
los registros afectados por la transacción aparecen bloqueados hasta que la
transacción finalice. Esos usuarios no podrán modificar los valores de dichos
registros.
Å Tras la transacción todos los usuarios ven los datos tal cual quedan tras el fin de
transacción. Los bloqueos son liberados y los puntos de ruptura borrados.
[5.7]
creación de otros objetos de base de datos
[5.7.1] vistas
introducción
Una vista no es más que una consulta almacenada a fin de utilizarla tantas veces como
se desee. Una vista no contiene datos sino la instrucción SELECT necesaria para crear la
vista, eso asegura que los datos sean coherentes al utilizar los datos almacenados en las
tablas. Por todo ello, las vistas gastan muy poco espacio de disco.
Las vistas se emplean para:
Å Realizar consultas complejas más fácilmente, ya que permiten dividir la consulta en
varias partes
Å Proporcionar tablas con datos completos
Å Utilizar visiones especiales de los datos
Å Ser utilizadas como tablas que resumen todos los datos
Å Ser utilizadas como cursores de datos en los lenguajes procedimentales (como
PL/SQL)
Hay dos tipos de vistas:
Å Simples. Las forman una sola tabla y no contienen funciones de agrupación. Su
ventaja es que permiten siempre realizar operaciones DML sobre ellas.
Å Complejas. Obtienen datos de varias tablas, pueden utilizar funciones de
agrupación. No siempre permiten operaciones DML.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/jVB-0Ll0hDuYk8H4OkF_9Fbnln2_zRlA4pQzCCVAEdc/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTE2LWwud2VicA==.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[116]
creación de vistas
Sintaxis:
CREATE [OR REPLACE] [FORCE|NOFORCE] VIEW vista
[(alias[, alias2...]]
AS consultaSELECT
[WITH CHECK OPTION [CONSTRAINT restricción]]
[WITH READ ONLY [CONSTRAINT restricción]]
Å OR REPLACE. Si la vista ya existía, la cambia por la actual
Å FORCE. Crea la vista aunque los datos de la consulta SELECT no existan
Å vista. Nombre que se le da a la vista
Å alias. Lista de alias que se establecen para las columnas devueltas por la consulta
SELECT en la que se basa esta vista. El número de alias debe coincidir con el
número de columnas devueltas por SELECT.
Å WITH CHECK OPTION. Hace que sólo las filas que se muestran en la vista puedan
ser añadidas (INSERT) o modificadas (UPDATE). La restricción que sigue a esta
sección es el nombre que se le da a esta restricción de tipo CHECK OPTION.
Å WITH READ ONLY. Hace que la vista sea de sólo lectura. Permite grabar un nombre
para esta restricción.
Lo bueno de las vistas es que tras su creación se utilizan como si fueran una tabla.
Ejemplo:
CREATE VIEW resumen
/* alias */
(id_localidad, localidad, poblacion, n_provincia, provincia,
superficie, capital_provincia,
id_comunidad, comunidad, capital_comunidad)
AS
( SELECT l.id_localidad, l.nombre, l.poblacion,
n_provincia, p.nombre, p.superficie, l2.nombre,
id_comunidad, c.nombre, l3.nombre
FROM localidades l
JOIN provincias p USING (n_provincia)
JOIN comunidades c USING (id_comunidad)
JOIN localidades l2 ON (p.id_capital=l2.id_localidad)
JOIN localidades l3 ON (c.id_capital=l3.id_localidad)
)
SELECT DISTINCT (comunidad, capital_comunidad) FROM resumen;](https://d2z384uprhdr6y.cloudfront.net/1MCxeOaFFmSujLRcEI18UpYDZUY9HMc5P-MD1jaL8gc/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTE3LWwud2VicA==.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[117]
La creación de la vista del ejemplo es compleja ya que hay relaciones complicadas,
pero una vez creada la vista, se le pueden hacer consultas como si se tratara de una
tabla normal. Incluso se puede utilizar el comando DESCRIBE sobre la vista para mostrar
la estructura de los campos que forman la vista.
ejecución de comandos DML sobre vistas
Las instrucciones DML ejecutadas sobre las vistas permiten añadir o modificar los datos
de las tablas relacionados con las filas de la vista. Ahora bien, no es posible ejecutar
instrucciones DML sobre vistas que:
Å Utilicen funciones de grupo (SUM, AVG,...)
Å Usen GROUP BY o DISTINCT
Å Posean columnas con cálculos (PRECIO * 1.16)
Además no se pueden añadir datos a una vista si en las tablas referencias en la consulta
SELECT hay campos NOT NULL que no aparecen en la consulta (es lógico ya que al
añadir el dato se tendría que añadir el registro colocando el valor NULL en el campo).
Ejemplo (sobre la vista anterior):
INSERT INTO resumen(id_localidad, localidad, poblacion)
VALUES (10000, 'Sevilla', 750000)
mostrar la lista de vistas
La vista del diccionario de datos de Oracle USER_VIEWS permite mostrar una lista de
todas las vistas que posee el usuario actual. Es decir, para saber qué vistas hay
disponibles se usa:
SELECT * FROM USER_VIEWS;
La columna TEXT de esa vista contiene la sentencia SQL que se utilizó para crear la
vista (sentencia que es ejecutada cada vez que se invoca a la vista).
borrar vistas
Se utiliza el comando DROP VIEW:
DROP VIEW nombreDeVista;
[5.7.2] secuencias
Una secuencia sirve para generar automáticamente números distintos. Se utilizan para
generar valores para campos que se utilizan como clave forzada (claves cuyo valor no
interesa, sólo sirven para identificar los registros de una tabla). Es decir se utilizan en
los identificadores de las tablas (campos que comienzan con la palabra id), siempre y
cuando no importe qué número se asigna a cada fila.
Es una rutina interna de la base de datos la que realiza la función de generar un
número distinto cada vez. Las secuencias se almacenan independientemente de la
tabla, por lo que la misma secuencia se puede utilizar para diversas tablas.](https://d2z384uprhdr6y.cloudfront.net/6qFwiT4EZLrT40cTHDDb1gBC5iJ_Hr9IUWSAn_gcBBU/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTE4LWwud2VicA==.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[118]
creación de secuencias
Sintaxis:
CREATE SEQUENCE secuencia
[INCREMENT BY n]
[START WITH n]
[{MAXVALUE n|NOMAXVALUE}]
[{MINVALUE n|NOMINVALUE}]
[{CYCLE|NOCYCLE}]
Donde:
Å secuencia. Es el nombre que se le da al objeto de secuencia
Å INCREMENT BY. Indica cuánto se incrementa la secuencia cada vez que se usa.
Por defecto se incrementa de uno en uno
Å START WITH. Indica el valor inicial de la secuencia (por defecto 1)
Å MAXVALUE. Máximo valor que puede tomar la secuencia. Si no se toma
NOMAXVALUE que permite llegar hasta el 1027
Å MINVALUE. Mínimo valor que puede tomar la secuencia. Por defecto -1026
Å CYCLE. Hace que la secuencia vuelva a empezar si se ha llegado al máximo valor.
Ejemplo:
CREATE SEQUENCE numeroPlanta
INCREMENT 100
STARTS WITH 100
MAXVALUE 2000
ver lista de secuencias
La vista del diccionario de datos de Oracle USER_SEQUENCES muestra la lista de
secuencias actuales. La columna LAST_NUMBER muestra cual será el siguiente número
de secuencia disponible
uso de la secuencia
Los métodos NEXTVAL y CURRVAL se utilizan para obtener el siguiente número y el
valor actual de la secuencia respectivamente. Ejemplo de uso:
SELECT numeroPlanta.NEXTVAL FROM DUAL;
Eso muestra en pantalla el siguiente valor de la secuencia. Realmente NEXTVAL
incrementa la secuencia y devuelve el valor actual. CURRVAL devuelve el valor de la
secuencia, pero sin incrementar la misma.
Ambas funciones pueden ser utilizadas en:
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/G1K8-dMVxGeaG_l_TozjOKX416UkG0EwwysmYG9G6Bo/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTE5LWwud2VicA==.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[119]
Å Una consulta SELECT que no lleve DISTINCT, ni grupos, ni sea parte de una vista,
ni sea subconsulta de otro SELECT, UPDATE o DELETE
Å Una subconsulta SELECT en una instrucción INSERT
Å La cláusula VALUES de la instrucción INSERT
Å La cláusula SET de la instrucción UPDATE
No se puede utilizar (y siempre hay tentaciones para ello) como valor para la cláusula
DEFAULT de un campo de tabla.
Su uso más habitual es como apoyo al comando INSERT:
INSERT INTO plantas(num, uso)
VALUES(numeroPlanta.NEXTVAL, 'Suites');
modificar secuencias
Se pueden modificar las secuencias, pero la modificación sólo puede afectar a los
futuros valores de la secuencia, no a los ya utilizados. Sintaxis:
ALTER SEQUENCE secuencia
[INCREMENT BY n]
[START WITH n]
[{MAXVALUE n|NOMAXVALUE}]
[{MINVALUE n|NOMINVALUE}]
[{CYCLE|NOCYCLE}]
borrar secuencias
Lo hace el comando DROP SEQUENCE seguido del nombre de la secuencia a borrar.
[5.7.3] índices
Los índices son esquemas que hacen que una base de datos acelere las operaciones de
consulta y ordenación sobre los campos a los que el índice hace referencia.
Se almacenan aparte de la tabla a la que hace referencia, lo que permite crearles y
borrarles en cualquier momento.
Lo que realizan es una lista ordenada por la que Oracle puede acceder para facilitar
la búsqueda de los datos. cada vez que se añade un nuevo registro, los índices
involucrados se actualizan a fin de que su información esté al día. De ahí que cuantos
más índices haya, más le cuesta a Oracle añadir registros, pero más rápidas se realizan
las instrucciones de consulta.
La mayoría de los índices se crean de manera implícita, como consecuencia de las
restricciones PRIMARY KEY (que obliga a crear un índice único sobre los campos clave) ,
UNIQUE (crea también un índice único) y FOREIGN KEY (crea un índice con posibilidad
de repetir valores, índice con duplicados). Estos son índices obligatorios, por los que les
crea la propia base de datos. El nombre que se les da a esos índices suele ser el mismo
que el nombre de la restricción que los genera](https://d2z384uprhdr6y.cloudfront.net/zcetLGvjU4hzTrmcfAz_BrxeyljxHdeW_vqkC11xBP4/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTIwLWwud2VicA==.webp)
![Sistemas Gestores de Bases de Datos
el lenguaje SQL
[120]
creación de índices
Aparte de los índices obligatorios comentados anteriormente, se pueden crear índices
de forma explícita. Éstos se crean para aquellos campos sobre los cuales se realizarán
búsquedas e instrucciones de ordenación frecuente.
Sintaxis:
CREATE INDEX nombre
ON tabla (columna1 [,columna2...])
Ejemplo:
CREATE INDEX nombre_completo
ON clientes (apellido1, apellido2, nombre);
El ejemplo crea un índice para los campos apellido1, apellido2 y nombre. Esto no es lo
mismo que crear un índice para cada campo, este índice es efectivo cuando se buscan u
ordenan clientes usando los tres campos (apellido1, apellido2, nombre) a la vez.
Se aconseja crear índices en campos que:
Å Contengan una gran cantidad de valores
Å Contengan una gran cantidad de nulos
Å Son parte habitual de cláusulas WHERE, GROUP BY u ORDER BY
Å Son parte de listados de consultas de grandes tablas sobre las que casi siempre se
muestran como mucho un 4% de su contenido.
No se aconseja en campos que:
Å Pertenezcan a tablas pequeñas
Å No se usan a menudo en las consultas
Å Pertenecen a tablas cuyas consultas muestran más de un 6% del total de registros
Å Pertenecen a tablas que se actualizan frecuentemente
Å Se utilizan en expresiones
Los índices se pueden crear utilizando expresiones complejas:
CREATE INDEX nombre_complejo
ON clientes (UPPER(nombre));
Esos índices tienen sentido si en las consultas se utilizan exactamente esas expresiones.
lista de índices
Para ver la lista de índices se utiliza la vista USER_INDEXES . Mientras que la vista
USER_IND_COLUMNS Muestra la lista de columnas que son utilizadas por índices.](https://d2z384uprhdr6y.cloudfront.net/7b0P_xl8YfvJvHGdoOpdg-hGrZi8fjA_l2yIbbFhLKY/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTIxLWwud2VicA==.webp)
![2º de Administración de Sistemas Informáticos
Copyleft - Jorge Sánchez – www.jorgesanchez.net
[121]
borrar índices
La instrucción DROP INDEX seguida del nombre del índice permite eliminar el índice en
cuestión.
[5.7.4] sinónimos
Un sinónimo es un nombre que se asigna a un objeto cualquiera. Normalmente es un
nombre menos descriptivo que el original a fin de facilitar la escritura del nombre del
objeto en diversas expresiones.
creación
Sintaxis:
CREATE [PUBLIC] SYNONYM nombre FOR objeto;
objeto es el objeto al que se referirá el sinónimo. La cláusula PUBLIC hace que el
sinónimo esté disponible para cualquier usuario (sólo se permite utilizar si disponemos
de privilegios administrativos).
borrado
DROP SYNONYM nombre
lista de sinónimos
La vista USER_SYNONYMS permite observar la lista de sinónimos del usuario, la vista
ALL_SYNONYMS permite mostrar la lista completa de sinónimos.
www.elsolucionario.org](https://d2z384uprhdr6y.cloudfront.net/y6L4T4a8ud8OZAKBDcDdMmfK9joO0TIVKkfplidq40I/rt:fill/q:100/w:1280/h:0/gravity:sm/czM6Ly9qYXVudC1wcm9kdWN0aW9uLXVwbG9hZHMvMjAyNS8wMi8yNC83MWVjMThkMS01NDA3LTQ3ODAtYjhiYy0zMzljMGU4OGI1NDcvc2xpZGVfMTIyLWwud2VicA==.webp)
Database Systems & SQL Fundamentals
- 2. [1] [Unidad 1] gestión de datos [1.1] sistemas de información [1.1.1] introducción la necesidad de gestionar datos En el mundo actual existe una cada vez mayor demanda de datos. Esta demanda siempre ha sido patente en empresas y sociedades, pero en estos años la demanda todavía de ha disparado más debido al acceso multitudinario a las redes integradas en Internet y a la aparición de pequeños dispositivos (móviles y PDA) que también requieren esa información. En informática se conoce como dato a cualquier elemento informativo que tenga relevancia para un usuario. Desde su nacimiento, la informática se ha encargado de proporcionar herramientas que faciliten la gestión de los datos. Antes de la aparición de las aplicaciones informáticas, las empresas tenían como únicas herramientas de gestión de datos a los cajones, carpetas y fichas en las que se almacenaban los datos. En este proceso manual, el tipo requerido para manipular estos datos era enorme. Sin embargo el proceso de aprendizaje era relativamente sencillo ya que se usaban elementos que el usuario reconocía perfectamente. Por esa razón, la informática ha adaptado sus herramientas para que los elementos que el usuario maneja en el ordenador se parezcan a los que utilizaba manualmente. Por eso en informática se sigue hablado de ficheros, formularios, carpetas, directorios,.... www.elsolucionario.org
- 3. Sistemas Gestores de Bases de Datos La gestión de los datos [2] la empresa como sistema Según la RAE, la definición de sistema es “Conjunto de cosas que ordenadamente relacionadas entre sí contribuyen a un determinado objeto” . La clientela fundamental del profesional de la informática es la empresa. La empresa se puede entender como un sistema formado por diversos objetos: el capital, los recursos humanos, los inmuebles, los servicios que prestas, etc. El sistema completo que forma la empresa, por otra parte, se suele dividir en los siguientes subsistemas: Å Subsistema productivo. También llamado subsistema real o físico. Representa la parte de la empresa encargada de gestionar la producción de la misma. Å Subsistema financiero. Encargado de la gestión de los bienes económicos de la empresa Å Subsistema directivo. Encargado de la gestión organizativa de la empresa Hay que hacer notar que cada subsistema se asocia a un departamento concreto de la empresa. sistemas de información Los sistemas que aglutinan los elementos que intervienen para gestionar la información que manejan los subsistemas empresariales es lo que se conoce como Sistemas de Información. Se suele utilizar las siglas SI o IS (de Information Server) para referirse a ello). Realmente un sistema de información sólo incluye la información que nos interesa de la empresa y los elementos necesarios para gestionar esa información. Un sistema de información genérico está formado por los siguientes elementos: Å Recursos físicos. Carpetas, documentos, equipamiento, discos,... Å Recursos humanos. Personal que maneja la información Å Protocolo. Normas que debe cumplir la información para que sea manejada (formato de la información, modelo para los documentos,...). Aunque es el elemento en el que menos se repara, es uno de los más importantes, no tener un protocolo garantiza un desastre. Las empresas necesitan implantar estos sistemas de información debido a la necesidad de gestionar las diferentes acciones que realiza una empresa. En cada proceso empresarial se genera una serie de datos de interés para la misma que deben ser manipulados adecuadamente por el sistema de información. el software y la crisis del software Con la aparición de la informática, se empezó a implantar sistemas de información donde la mayor parte de la carga de esos sistemas se la llevaba el ordenador. Empezó a crearse software específico para la manipulación de los sistemas de información. Inicialmente ese software no constaba de demasiadas instrucciones, pero al aumentar las necesidades de gestión de datos, los programadores tuvieron que empezar a codificar miles y miles de instrucciones.
- 4. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [3] Tras esos primeros años, ocurrió un problema que se conoció como la crisis del software. El problema es que el código creció espectacularmente de tamaño de modo que nuevas necesidades por parte de la empresa desembocaban en una cantidad interminable de correcciones en el software, lo que le hacía poco productivo (se gastaba demasiado en él). La solución a esta crisis (todavía no del todo resuelta por culpa de una mala concienciación profesional en el sector) es la aportación de personal más cualificado y de metodologías profesionales. A este punto es al que se dedica la ingeniería del software. componentes de un sistema de información electrónico En el caso de una gestión electrónica de la información (lo que actualmente se considera un sistema de información), los componentes son: Å Datos. Se trata de la información relevante que almacena y gestiona el sistema de información Å Hardware. Equipamiento físico que se utiliza para gestionar los datos Å Software. Aplicaciones que permiten el funcionamiento adecuado del sistema Å Recursos humanos. Personal que maneja el sistema de información [1.1.2] tipos de sistemas de información En la evolución de los sistemas de información ha habido dos puntos determinantes, que han formado los dos tipos fundamentales de sistemas de información. sistemas de información orientados al proceso En estos sistemas de información se crean diversas aplicaciones (software) para gestionar diferentes aspectos del sistema. Cada aplicación realiza unas determinadas operaciones. Los datos de dichas aplicaciones se almacenan en archivos digitales dentro de las unidades de almacenamiento del ordenador (a veces en archivos binarios, o en hojas de cálculo, ...). Cada programa almacena y utiliza sus propios datos de forma un tanto caótica. La ventaja de este sistema (la única ventaja), es que los procesos eran independientes por lo que la modificación de uno no afectaba al resto. Pero tiene grandes inconvenientes: Å Coste de almacenamiento elevado. Al almacenarse varias veces el mismo dato, se requiere más espacio en los discos. Luego se agotarán antes. Å Datos redundantes. Ya que se repiten continuamente Å Probabilidad alta de inconsistencia en los datos. Ya que un proceso cambia sus datos y no el resto. Por lo que el mismo dato puede tener valores distintos según qué aplicación acceda a él. Å Difícil modificación en los datos Debido a la probabilidad de inconsistencia. Para que ésta no exista, cada modificación se debe repetir en todas las copias del dato (algo que normalmente es imposible). Å Tiempos de procesamiento elevados. Al no poder optimizar el espacio de almacenamiento.
- 5. Sistemas Gestores de Bases de Datos La gestión de los datos [4] A estos sistemas se les llama sistemas de ficheros. Se consideran también así a los sistemas que utilizan programas ofimáticos (como Word y Excel) para gestionar sus datos. De hecho estos sistemas producen los mismos (si no más) problemas. sistemas de información orientados a los datos. bases de datos En este tipo de sistemas los datos se centralizan en una base de datos común a todas las aplicaciones. Estos serán los sistemas que estudiaremos en este curso. En esos sistemas los datos se almacenan en una única estructura lógica que es utilizable por las aplicaciones. A través de esa estructura se accede a los datos que son comunes a todas las aplicaciones. ventajas Å Independencia de los datos y los programas y procesos. Esto permite modificar los datos sin modificar el código de las aplicaciones. Å Menor redundancia. No hace falta tanta repetición de datos. Sólo se indica la forma en la que se relacionan los datos. Å Integridad de los datos. Mayor dificultad de perder los datos o de realizar incoherencias con ellos. Å Mayor seguridad en los datos. Al permitir limitar el acceso a los usuarios. Cada tipo de usuario podrá acceder a unas cosas.. Å Datos más documentados. Gracias a los metadatos que permiten describir la información de la base de datos. Å Acceso a los datos más eficiente. La organización de los datos produce un resultado más óptimo en rendimiento. Å Menor espacio de almacenamiento. Gracias a una mejor estructuración de los datos. desventajas Å Instalación costosa. El control y administración de bases de datos requiere de un software y hardware poderoso Å Requiere personal cualificado. Debido a la dificultad de manejo de este tipo de sistemas. Å Implantación larga y difícil. Debido a los puntos anteriores. La adaptación del personal es mucho más complicada y lleva bastante tiempo. Å Ausencia de estándares reales. Lo cual significa una excesiva dependencia hacia los sistemas comerciales del mercado. Aunque, hoy en día, una buena parte de esta tecnología está aceptada como estándar de hecho. www.elsolucionario.org
- 6. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [5] [1.2] Sistemas de base de datos [1.2.1] concepto y objetivos Como se ha comentado anteriormente, cuando los datos de un sistema de información se almacenan en una única estructura, se llama base de datos. Una base de datos es una colección de datos almacenados en un soporte informático permanente de forma que sea posible obtener la relación entre los datos a través de un esquema conceptual que oculte la física real de los datos. El objetivo es que las aplicaciones puedan acceder a los datos sin necesidad de conocer exactamente cómo están almacenados los datos. Esto se consigue con un esquema conocido como esquema conceptual. Cualquier desarrollador que conozca ese esquema puede acceder a los datos desde cualquier aplicación. [1.2.2] elementos de un sistema de base de datos Los elementos de un sistema de base de datos son los mismos que los de un sistema de información. Se comentan a continuación para concretar un poco más la información que ya poseíamos: Å Hardware. Máquinas en las que se almacenan las bases de datos. Incorporan unidades de almacenamiento masivo para este fin. Å Software. Es el sistema gestor de bases de datos. La aplicación que permite el manejo de la base de datos. Å Datos. Incluyen los datos que se necesitan almacenar y los metadatos que son datos que sirven para describir lo que se almacena en la base de datos. Å Usuarios. Personas que manipulan los datos del sistema. Hay tres categorías: ² Usuarios finales. Aquellos que utilizan datos de la base de datos para su trabajo cotidiano que no tiene por qué tener que ver con la informática. Normalmente no utilizan la base de datos directamente, si no que utilizan aplicaciones creadas para ellos a fin de facilitar la manipulación de los datos. Estos usuarios sólo acceden a ciertos datos. ² Desarrolladores. Analistas y programadores encargados de generar aplicaciones para los usuarios finales. ² Administradores. También llamados DBA (Data Base Administrator), se encargan de gestionar las bases de datos. Hay que tener en cuenta que las necesidades de los usuarios son muy diferentes en función del tipo de usuario que sean: a los finales les interesa la facilidad de uso, a los desarrolladores la potencia y flexibilidad de los lenguajes incorporados del sistema de bases de datos, a los administradores herramientas de gestión avanzada para la base de datos.
- 7. Sistemas Gestores de Bases de Datos La gestión de los datos [6] [1.2.3] estructura de una base de datos Las bases de datos están compuestas (como ya se han comentado), de datos y de metadatos. Los metadatos son datos (valga la redundancia) que sirven para especificar la estructura de la base de datos; por ejemplo qué tipo de datos se almacenan (si son texto o números o fechas ...), qué nombre se le da a cada dato (nombre, apellidos,...), cómo están agrupados, cómo se relacionan,.... De este modo se producen dos visiones de la base de datos: Å Estructura lógica o conceptual. Indica la composición y distribución teórica de la base de datos. La estructura lógica sirve para que las aplicaciones puedan utilizar los elementos de la base de datos sin saber realmente cómo se están almacenando. Å Estructura física. Es la estructura de los datos tan cual se almacenan en las unidades de disco. La correspondencia entre la estructura lógica y la física se almacena en la base de datos (en los metadatos).
- 8. [7] [Unidad 2] sistemas gestores de bases de datos [2.1] objetivo de los SGBD Un sistema gestor de bases de datos o SGBD (aunque se suele utilizar más a menudo las siglas DBMS procedentes del inglés, Data Base Management System) es el software que permite a los usuarios procesar, describir, administrar y recuperar los datos almacenados en una base de datos. En estos Sistemas se proporciona un conjunto coordinado de programas, procedimientos y lenguajes que permiten a los distintos usuarios realizar sus tareas habituales con los datos, garantizando además la seguridad de los mismos. www.elsolucionario.org
- 9. Sistemas Gestores de Bases de Datos sistemas gestores de bases de datos [8] DBMS Ilustración 1, Esquema del funcionamiento y utilidad de un sistema gestor de bases de datos El éxito del SGBD reside en mantener la seguridad e integridad de los datos. Lógicamente tiene que proporcionar herramientas a los distintos usuarios. Entre las herramientas que proporciona están: Å Herramientas para la creación y especificación de los datos. Así como la estructura de la base de datos. Å Herramientas para administrar y crear la estructura física requerida en las unidades de almacenamiento. Å Herramientas para la manipulación de los datos de las bases de datos, para añadir, modificar, suprimir o consultar datos. Å Herramientas de recuperación en caso de desastre Å Herramientas para la creación de copias de seguridad Å Herramientas para la gestión de la comunicación de la base de datos Å Herramientas para la creación de aplicaciones que utilicen esquemas externos de los datos Å Herramientas de instalación de la base de datos Å Herramientas para la exportación e importación de datos [2.2] niveles de abstracción de una base de datos [2.2.1] introducción En cualquier sistema de información se considera que se pueden observar los datos desde dos puntos vista:
- 10. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [9] Å Vista externa. Esta es la visión de los datos que poseen los usuarios del Sistema de Información. Å Vista física. Esta es la forma en la que realmente están almacenados los datos. En un Sistema de ficheros, los usuarios ven los datos desde las aplicaciones creadas por los programadores. Esa vista pueden ser formularios, informes visuales o en papel,... Pero la realidad física de esos datos, tal cual se almacenan en los discos, no la ven. Esa visión está reservada a los administrados. En el caso de los Sistemas de Base de datos, se añade una tercera vista, que es la vista conceptual. Esa vista se sitúa entre la física y la externa. Se habla pues en Bases de datos de la utilización de tres esquemas para representar los datos. [2.2.2] esquema físico Representa la forma en la que están almacenados los datos. Esta visión sólo la requiere el administrador. El administrador la necesita para poder gestionar más eficientemente la base de datos. En este esquema es donde aparecen las unidades de disco, archivos y carpetas del sistema. [2.2.3] esquema conceptual Se trata de un esquema teórico de los datos en la que figuran organizados en estructuras reconocibles del mundo real y en el que también aparece la forma de relacionarse los datos. Esta estructura es utilizada por el desarrollador, que necesita conocerla para al crear aplicaciones saber como acceder. Todas las aplicaciones que se crean sobre la base de datos utilizan este esquema. Realmente cuando se habla del diseño de la base de datos, se suele referir a este esquema. El esquema conceptual lo realiza el diseñador de la base de datos. [2.2.4] esquema externo Se trata de la visión de los datos que poseen los usuarios finales. Esa visión es la que obtienen a través de las aplicaciones. Las aplicaciones creadas por los desarrolladores abstraen la realidad conceptual de modo que el usuario no conoce las relaciones entre los datos, como tampoco conoce todos los datos que realmente se almacenan. Realmente cada aplicación produce un esquema externo diferente (aunque algunos pueden coincidir) o vistas de usuario. El conjunto de todas las vistas de usuario es lo que se denomina esquema externo global. [2.2.5] independencia en los esquemas Lo interesante de estos esquemas es que trabajan independientemente. Cada usuario utiliza el esquema que necesita sin saber nada del resto. Esa independencia se traduce en: Å Independencia física de los datos. Aunque el esquema físico cambie, el esquema conceptual no debe verse afectado. En la práctica esto significa que aunque la base de datos se almacene en otro disco duro, la parte conceptual de la base de datos no debe verse afectada. No habrá que modificar dicho esquema.
- 11. Sistemas Gestores de Bases de Datos sistemas gestores de bases de datos [10] Å Independencia lógica de los datos. Significa que aunque se modifique los datos del esquema conceptual, las vistas que poseen las aplicaciones (los esquemas externos) no se verán afectados. [2.3] funciones Los SGBD tienen que realizar tres tipos de funciones para ser considerados válidos. [2.3.1] función de descripción o definición Permite al diseñador de la base de datos crear las estructuras apropiadas para integrar adecuadamente los datos. Este función es la que permite definir las tres estructuras de la base de datos (relacionadas con sus tres esquemas). Å Estructura interna Å Estructura conceptual Å Estructura externa Esta función se realiza mediante el lenguaje de descripción de datos o DDL. Mediante ese lenguaje: Å Se definen las estructuras de datos Å Se definen las relaciones entre los datos Å Se definen las reglas que han de cumplir los datos www.elsolucionario.org
- 12. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [11] [2.3.2] función de manipulación Permite modificar y utilizar los datos de la base de datos. Se realiza mediante el lenguaje de modificación de datos o DML. Mediante ese lenguaje se puede: Å Añadir datos Å Eliminar datos Å Modificar datos Å Buscar datos Actualmente se suele distinguir la función de buscar datos respecto del resto. Para lo cual se proporciona un lenguaje de consulta de datos o DQL. [2.3.3] función de control Mediante esta función los administradores poseen mecanismos para determinar las visiones de los datos permitidas a cada usuario, además de proporcionar elementos de creación y modificación de esos usuarios. Se suelen incluir aquí las tareas de copia de seguridad, carga de ficheros, auditoria, protección ante ataques externos, configuración del sistema,... El lenguaje que implementa esta función es el lenguaje de control de datos o DCL. [2.4] estandarización Es uno de los aspectos que todavía sigue pendiente. Desde la aparición de los primeros gestores de base de datos se intentó llegar a un acuerdo para que hubiera una estructura común para todos ellos, a fin de que el aprendizaje y manejo de este software fuera más provechoso y eficiente. El acuerdo nunca se ha conseguido del todo, no hay estándares aceptados del todo. Aunque sí hay unas cuentas propuestas de estándares que sí funcionan como tales. [2.4.1] organismos de estandarización Los intentos por conseguir una estandarización han estado promovidos por organismos de todo tipo. Algunos son estatales, otros privados y otros promovidos por los propios usuarios. Los tres que han tenido gran relevancia en el campo de las bases de datos son ANSI/SPARC/X3, CODASYL y ODMG. Los organismos grandes (que recogen grandes responsabilidades) dividen sus tareas en comités, y éstos en grupos de trabajo que se encargan de temas concretos. [2.4.2] SC21 Å ISO (International Organization for Standardization). Es un organismo internacional de definición de estándares de gran prestigio.
- 13. Sistemas Gestores de Bases de Datos sistemas gestores de bases de datos [12] Å IEC (International Electrotechnical Commission). Organismo de definición de normas en ambientes electrónicos Å JTC1 (Joint Technical Committee). Comité formado por los dos organismos anteriores encargado de diversos proyectos. En el campo de las bases de datos, el subcomité SC21 (en el que participan otros organismos nacionales, como el español AENOR) posee un grupo de trabajo llamado WG 3 que se dedica a las bases de datos. Este grupo de trabajo es el que define la estandarización del lenguaje SQL entre otras cuestiones. [2.4.3] DBTG Codasyl Codasyl (Conference on Data System Languages) es el nombre de una conferencia de finales de los años 60 en la que participaron organismos privados y públicos del gobierno de Estados Unidos con la finalidad de definir estándares (Codasyl definió el lenguaje COBOL) para la informática de gestión. De ahí salió DBTG (Data Base Task Group, grupo de tareas para bases de datos) grupo que definió el modelo en red de bases de datos que desde entonces se llama Codasyl o DBTG y que fue aceptado por la ANSI [2.4.4] ANSI/X3/SPARC ANSI (American National Science Institute) es un organismo científico de Estados Unidos que ha definido diversos estándares en el campo de las bases de datos. X3 es la parte de ANSI encargada de los estándares en el mundo de la electrónica. Finalmente SPARC System Planning and Repairments Committee, comité de planificación de sistemas y reparaciones es una subsección de X3 encargada de los estándares en Sistemas Informáticos en especial del campo de las bases de datos. Su logro fundamental ha sido definir un modelo de referencia para las bases de datos (que se estudiará posteriormente). ANSI Estados Unidos X3 (Otras secciones) SPARC ISO Internacional España AENOR Francia AFNOR BSI Reino Unido Otros JTC1 (Otras secciones) (Otras secciones) Ilustración 2, Relación entre los organismos de estandarización
- 14. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [13] En la actualidad ANSI para Estados Unidos e ISO para todo el mundo son nombres equivalentes en cuanto a estandarización de bases de datos, puesto que se habla ya de un único modelo de sistema de bases de datos. [2.4.5] Modelo ANSI/X3/SPARC El grupo ANSI ha marcado la referencia para la construcción de SGBD. Se basa en los estudios anteriores en los que se indicaban tres niveles de abstracción de la base de datos. ANSI profundiza más en esta idea y define cómo debe ser el proceso de creación y utilización de estos niveles. En el modelo ANSI se indica que hay tres modelos (externo, conceptual e interno) entendiendo por modelo las normas que permiten crear esquemas (diseños de la base de datos). Los esquemas externos reflejan la información preparada para el usuario final, el esquema conceptual refleja los datos y relaciones de la base de datos y el esquema interno la preparación de los datos para ser almacenados. Ilustración 3, Niveles en el modelo ANSI www.elsolucionario.org
- 15. Sistemas Gestores de Bases de Datos sistemas gestores de bases de datos [14] Ilustración 4, Arquitectura ANSI El paso de un esquema a otro se realiza utilizando un interfaz o función de traducción. En su modelo, la ANSI no indica cómo se debe realizar esta función, sólo que debe existir. La arquitectura completa (Ilustración 4) esta dividida en dos secciones, la zona de definición de datos y la de manipulación. Esa arquitectura muestra las funciones realizadas por humanos y las realizadas por programas. En la fase de definición, una serie de interfaces permiten la creación de los metadatos que se convierten en el eje de esta arquitectura. La creación de la base de datos comienza con la elaboración del esquema conceptual realizándola el administrador de la empresa (actualmente es el diseñador, pero ANSI no lo llamó así). Ese esquema se procesa utilizando un procesador del esquema conceptual (normalmente una herramienta CASE, interfaz 1 del dibujo anterior) que lo convierte en los metadatos (interfaz 2). La interfaz 3 permite mostrar los datos del esquema conceptual a los otros dos administradores: el administrador de la base de datos y el de aplicaciones (el desarrollador). Mediante esta información construyen los esquemas internos y externos
- 16. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [15] mediante las interfaces 4 y 5 respectivamente, los procesadores de estos esquemas almacenan la información correspondiente a estos esquemas en los metadatos (interfaces 6 y 7). En la fase de manipulación el usuario puede realizar operaciones sobre la base de datos usando la interfaz 8 (normalmente una aplicación) esta petición es transformada por el transformador externo/conceptual que obtiene el esquema correspondiente ayudándose también de los metadatos (interfaz 9). El resultado lo convierte otro transformador en el esquema interno (interfaz 10) usando también la información de los metadatos (interfaz 11). Finalmente del esquema interno se pasa a los datos usando el último transformador (interfaz 12) que también accede a los metadatos (interfaz 13) y de ahí se accede a los datos (interfaz 14). Para que los datos se devuelvan al usuario en formato adecuado para él se tiene que hacer el proceso contrario (observar dibujo). [2.4.6] Estructuras operacionales Actualmente casi todos los sistemas gestores de base de datos poseen también la misma idea operacional en la que se entiende que la base de datos se almacena en un servidor y hay una serie de clientes que pueden acceder a los datos del mismo. Las posibilidades son: Å Estructura Cliente-Servidor. Estructura clásica, la base de datos y su SGBD están en un servidor al cual acceden los clientes. El cliente posee software que permite al usuario enviar instrucciones al SGBD en el servidor y recibir los resultados de estas instrucciones. Para ello el software cliente y el servidor deben utilizar software de comunicaciones en red. Å Cliente multi-servidor. Ocurre cuando los clientes acceden a datos situados en más de un servidor. También se conoce esta estructura como base de datos distribuida. El cliente no sabe si los datos están en uno o más servidores, ya que el resultado es el mismo independientemente de dónde se almacenan los datos. En esta estructura hay un servidor de aplicaciones que es el que recibe las peticiones y el encargado de traducirlas a los distintos servidores de datos para obtener los resultados. Una posibilidad muy extendida hoy en día es la posibilidad Cliente/Servidor Web/Servidor de datos, el cliente se conecta a un servidor mediante un navegador web y desde las páginas de este ejecuta las consultas. El servidor web traduce esta consulta al servidor (o servidores) de datos. [2.5] recursos humanos de las bases de datos Intervienen (como ya se ha comentado) muchas personas en el desarrollo y manipulación de una base de datos. Habíamos seleccionado cuatro tipos de usuarios (administradores/as, desarrolladores, diseñadores/as y usuarios/as). Ahora vamos a desglosar aún más esta clasificación.
- 17. Sistemas Gestores de Bases de Datos sistemas gestores de bases de datos [16] [2.5.1] informáticos Lógicamente son los profesionales que definen y preparan la base de datos. Pueden ser: Å Directivos/as. Son los organizadores y coordinadores del proyecto a desarrollar. Esto significa que son los encargados de decidir los recursos que se pueden utilizar, planificar el tiempo y las tareas, la atención al usuario y de dirigir las entrevistas y reuniones pertinentes. Å Analistas. Son los encargados de controlar el desarrollo de la base de datos aprobada por la dirección. Son además los diseñadores de la base de datos (especialmente de los esquemas interno y conceptual) y los coordinadores de la programación de la misma. Å Administradores/as de las bases de datos. Definen la seguridad de la base de datos y gestionan las copias de seguridad y la gestión física de la base de datos. Los analistas suelen tener esta funcionalidad cuando la base de datos está creada. Å Desarrolladores/as o programadores/as. Encargados de la realización de las aplicaciones de usuario de la base de datos. Å Equipo de mantenimiento. Encargados de dar soporte a los usuarios en el trabajo diario (suelen incorporar además tareas administrativas). [2.5.2] usuarios Å Expertos/as. Utilizan el lenguaje de manipulación de datos (DML) para acceder a la base de datos. Son usuarios que utilizan la base de datos para gestión avanzada de decisiones. Å Habituales. Utilizan las aplicaciones creadas por los desarrolladores para consultar y actualizar los datos. Son los que trabajan en la empresa a diario con estas herramientas y el objetivo fundamental de todo el desarrollo de la base de datos. Å Ocasionales. Son usuarios que utilizan un acceso mínimo a la base de datos a través de una aplicación que permite consultar ciertos datos. Serían por ejemplo los usuarios que consultan el horario de trenes a través de Internet. [2.6] componentes del SGBD [2.6.1] estructura multicapa Un SGBD está en realidad formado por varias capas que actúan como interfaces entre el usuario y los datos. El propio ANSI/X3/SPARC introdujo una mejora de su modelo en 1988 a través de un grupo de trabajo llamado UFTG (User Facilities Task Group, grupo de trabajo para las facilidades de usuario). Este modelo toma como objeto principal, al usuario habitual de la base de datos y orienta el funcionamiento de la base de datos de modo que este usuario ignora el funcionamiento externo. www.elsolucionario.org
- 18. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [17] Desde esta óptica para llegar a los datos hay que pasar una serie de capas que poco a poco van entrando más en la realidad física de la base de datos. Esa estructura se muestra en la siguiente figura: Ilustración 5, Modelo de referencia de las facilidades de usuario [2.6.2] núcleo El núcleo de la base de datos es el encargado de traducir las operaciones que le llegan a instrucciones ejecutables por el sistema operativo en el lenguaje que éste último requiera. [2.6.3] diccionario de datos Se trata del elemento que posee todos los metadatos. Gracias a esta capa las solicitudes de los clientes se traducen en instrucciones que hacen referencia al esquema interno de la base de datos. La capa de acceso a datos es la que permite comunicar a las aplicaciones de usuario con el diccionario de datos a través de las herramientas de gestión de datos que incorpore el SGBD. [2.6.4] facilidades de usuario Son las herramientas que proporciona el SGBD a los usuarios para permitir un acceso más sencillo a los datos. Actúan de interfaz entre el usuario y la base de datos, y son el único elemento que maneja el usuario.
- 19. Sistemas Gestores de Bases de Datos sistemas gestores de bases de datos [18] [2.6.5] funcionamiento del SGBD El esquema siguiente presenta el funcionamiento típico de un SGBD: Ilustración 6, Esquema del funcionamiento de un SGBD El esquema anterior reproduce la comunicación entre un proceso de usuario que desea acceder a los datos y el SGBD: [1] El proceso lanzado por el usuario llama al SGBD indicando la porción de la base de datos que se desea tratar [2] El SGBD traduce la llamada a términos del esquema lógico de la base de datos. Accede al esquema lógico comprobando derechos de acceso y la traducción física [3] El SGBD obtiene el esquema físico [4] El SGBD traduce la llamada a los métodos de acceso del Sistema Operativo que permiten acceder a los datos requeridos [5] El Sistema Operativo accede a los datos tras traducir las órdenes dadas por el SGBD [6] Los datos pasan del disco a una memoria intermedia o buffer. En ese buffer se almacenarán los datos según se vayan recibiendo [7] Los datos pasan del buffer al área de trabajo del usuario (ATU) del proceso del usuario.
- 20. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [19] [8] El SGBD devuelve indicadores en los que manifiesta si ha habido errores o advertencias a tener en cuenta. Esto se indica al área de comunicaciones del proceso de usuario. Si las indicaciones son satisfactorias, los datos de la ATU serán utilizables por el proceso de usuario. [2.7] tipos de SGBD [2.7.1] introducción Como se ha visto en los apartados anteriores, resulta que cada SGBD puede utilizar un modelo diferente para los datos. Por lo que hay modelos conceptuales diferentes según que SGBD utilicemos. No obstante existen modelos lógicos comunes, ya que hay SGBD de diferentes tipos. En la realidad el modelo ANSI se modifica para que existan dos modelos internos: el modelo lógico (referido a cualquier SGBD de ese tipo) y el modelo propiamente interno (aplicable sólo a un SGBD en particular). De hecho en la práctica al definir las bases de datos desde el mundo real hasta llegar a los datos físicos se pasa por los siguientes esquemas: Ilustración 7, Modelos de datos utilizados en el desarrollo de una BD Por lo tanto la diferencia entre los distintos SGBD está en que proporcionan diferentes modelos lógicos. diferencias entre el modelo lógico y el conceptual Å El modelo conceptual es independiente del DBMS que se vaya a utilizar. El lógico depende de un tipo de SGBD en particular Å El modelo lógico es más cercano al ordenador Å El modelo conceptual es más cercano al usuario, el lógico es el encargado de establecer el paso entre el modelo informático y el modelo físico del sistema. Algunos ejemplos de modelos conceptuales son: www.elsolucionario.org
- 21. Sistemas Gestores de Bases de Datos sistemas gestores de bases de datos [20] Å Modelo E/R Å Modelo RM/T Å Modelos semánticos Ejemplos de modelos lógicos son: Å Modelo relacional Å Modelo Codasyl Å Modelo Jerárquico A continuación se comentarán los modelos lógicos más importantes. [2.7.2] modelo jerárquico Era utilizado por los primeros SGBD, desde que IBM lo definió para su IMS (Information Management System, Sistema Administrador de Información) en 1970. Se le llama también modelo en árbol debido a que utiliza una estructura en árbol para organizar los datos. La información se organiza con un jerarquía en la que la relación entre las entidades de este modelo siempre es del tipo padre / hijo. De esta forma hay una serie de nodos que contendrán atributos y que se relacionarán con nodos hijos de forma que puede haber más de un hijo para el mismo padre (pero un hijo sólo tiene un padre). Los datos de este modelo se almacenan en estructuras lógicas llamadas segmentos. Los segmentos se relacionan entre sí utilizando arcos. La forma visual de este modelo es de árbol invertido, en la parte superior están los padres y en la inferior los hijos. Departamento Documentos Personal Tareas Ilustración 8, Ejemplo de esquema jerárquico Este esquema está en absoluto desuso ya que no es válido para modelar la mayoría de problemas de bases de datos. [2.7.3] modelo en red (Codasyl) Es un modelo que ha tenido una gran aceptación (aunque apenas se utiliza actualmente). En especial se hizo popular la forma definida por Codasyl a principios de los 70 que se ha convertido en el modelo en red más utilizado.
- 22. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [21] El modelo en red organiza la información en registros (también llamados nodos) y enlaces. En los registros se almacenan los datos, mientras que los enlaces permiten relacionar estos datos. Las bases de datos en red son parecidas a las jerárquicas sólo que en ellas puede haber más de un padre. En este modelo se pueden representar perfectamente cualquier tipo de relación entre los datos (aunque el Codasyl restringía un poco las relaciones posibles), pero hace muy complicado su manejo. Ilustración 9, ejemplo de diagrama de estructura de datos Codasyl [2.7.4] modelo relacional En este modelo los datos se organizan en tablas cuyos datos se relacionan. Es el modelo más popular y se describe con más detalle en los temas siguientes. [2.7.5] modelo de bases de datos orientadas a objetos Desde la aparición de la programación orientada a objetos (POO u OOP) se empezó a pensar en bases de datos adaptadas a estos lenguajes. La programación orientada a objetos permite cohesionar datos y procedimientos, haciendo que se diseñen estructuras que poseen datos (atributos) en las que se definen los procedimientos (operaciones) que pueden realizar con los datos. En las bases orientadas a objetos se utiliza esta misma idea. A través de este concepto se intenta que estas bases de datos consigan arreglar las limitaciones de las relacionales. Por ejemplo el problema de la herencia (el hecho de que no se puedan realizar relaciones de herencia entre las tablas), tipos definidos por el usuario, disparadores (triggers) almacenables en la base de datos, soporte multimedia... Se supone que son las bases de datos de tercera generación (la primera fue las bases de datos en red y la segunda las relacionales), lo que significa que el futuro parece estar a favor de estas bases de datos. Pero siguen sin reemplazar a las relacionales, aunque son el tipo de base de datos que más está creciendo en los últimos años. Su modelo conceptual se suele diseñar en UML y el lógico actualmente en ODMG (Object Data Management Group, grupo de administración de objetos de datos, organismo que intenta crear estándares para este modelo). [2.7.6] bases de datos objeto relacionales Tratan de ser un híbrido entre el modelo relacional y el orientado a objetos. El problema de las bases de datos orientadas a objetos es que requieren reinvertir capital y esfuerzos de nuevo para convertir las bases de datos relacionales en bases de datos orientadas a objetos. En las bases de datos objeto relacionales se intenta conseguir una
- 23. Sistemas Gestores de Bases de Datos sistemas gestores de bases de datos [22] compatibilidad relacional dando la posibilidad de integrar mejoras de la orientación a objetos. Estas bases de datos se basan en el estándar SQL 99. En ese estándar se añade a las bases relacionales la posibilidad de almacenar procedimientos de usuario, triggers, tipos definidos por el usuario, consultas recursivas, bases de datos OLAP, tipos LOB,... Las últimas versiones de la mayoría de las clásicas grandes bases de datos relacionales (Oracle, SQL Server, Informix, ...) son objeto relacionales. www.elsolucionario.org
- 24. [23] [Unidad 3] bases de datos relacionales [3.1] el modelo relacional [3.1.1] introducción Edgar Frank Codd a finales definió las bases del modelo relacional a finales de los 60. En 1970 publica el documento “A Relational Model of data for Large Shared Data Banks” (“Un modelo relacional de datos para grandes bancos de datos compartidos”). Actualmente se considera que ese es uno de los documentos más influyentes de toda la historia de la informática. Anteriormente el único modelo teórico estandarizado era el Codasyl que se utilizó masivamente en los años 70. Codd introduce el término relación (en inglés relationship, a veces traducido como interrelación) que es el que aglutina los datos de forma independiente a lo que será su almacenamiento físico. Lo que Codd intenta precisamente es que este modelo oculte completamente conceptos y términos de la computadora en sí, es decir se abstrae más que los modelos anteriores. Trabajaba para IBM, empresa que tardó un poco en implementar sus bases. De hecho fueron otras empresas (en especial Oracle) las que implementaron sus teorías. Pocos años después el modelo se empezó a utilizar cada vez más, hasta finalmente ser el
- 25. Sistemas Gestores de Bases de Datos bases de datos relacionales [24] modelo de bases de datos más popular. Hoy en día casi todas las bases de datos siguen este modelo. [3.1.2] objetivos Codd perseguía estos objetivos con su modelo: Å Independencia física. La forma de almacenar los datos, no debe influir en su manipulación lógica. Si el almacenamiento físico cambia, los usuarios no tienen ni siquiera porque enterarse, seguirán funcionando sus aplicaciones. Å Independencia lógica. Las aplicaciones que utilizan la base de datos no deben ser modificadas por que se modifiquen elementos de la base de datos. Es decir, añadir, borrar y suprimir datos, no influye en las vistas de los usuarios. Å Flexibilidad. La base de datos ofrece fácilmente distintas vistas en función de los usuarios y aplicaciones. Å Uniformidad. Las estructuras lógicas siempre tienen una única forma conceptual (las tablas) Å Sencillez. [3.1.3] historia del modelo relacional Año Hecho 1970 Codd publica las bases del modelo relacional 1971-72 Primeros desarrollos teóricos 1973-78 Primeros prototipos (System R de IBM) 1978 Aparece el lenguaje QBE (Query By Example) lenguaje de acceso relacional a los archivos VSAM de IBM 1979 Aparece Oracle, el primer SGBD relacional. Codd revisa su modelo relacional y lanza el modelo RM/T como un intento de subsanar sus deficiencias. 1980 Aparece Ingres, SGBD relacional basado en cálculo relacional. Utilizaba el lenguaje Quel que era el favorito para las universidades. 1981 Aparece SQL que se convertirá en el estándar en la creación de bases de datos relacionales 1982 Aparece DB2, el sistema gestor de bases de datos relacionales de IBM 1986 ANSI normaliza el SQL (SQL/ANSI) 1987 ISO también normaliza SQL. Es el SQL ISO(9075) 1989 ISO revisa el estándar y publica el estándar SQL Addendum 1990 Versión dos del modelo relacional (RM/V2) realizada por Codd. Propuesta de Stonebraker para añadir al modelo relacional capacidades de orientación a objetos. 1992 ISO publica el estándar SQL 92 (todavía el más utilizado) 1995 Manifiesto de Darwen y Date en el que animan a reinterpretar el modelo relacional desde una perspectiva de objetos.
- 26. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [25] Año Hecho 1999 ISO publica un nuevo estándar que incluye características más avanzadas. Se llama SQL 99 [3.2] estructura de las bases de datos relacionales [3.2.1] relación o tabla Según el modelo relacional (desde que Codd lo enunció) el elemento fundamental es lo que se conoce como relación, aunque más habitualmente se le llama tabla (o también array o matriz). Codd definió las relaciones utilizando un lenguaje matemático, pero se pueden asociar a la idea de tabla (de filas y columnas) ya que es más fácil de entender. Las relaciones constan de: Å Atributos. Referido a cada dato que se almacena en la relación (nombre, dni,...). Å Tuplas. Referido a cada elemento de la relación. Por ejemplo si una relación almacena personas, una tupla representaría a una persona en concreto. Puesto que una relación se representa como una tabla; podemos entender que las columnas de la tabla son los atributos; y las filas, las tuplas. atributo 1 atributo 2 atributo 3 .... atributo n valor 1,1 valor 1,2 valor 1,3 .... valor 1,n Å tupla 1 valor 2,1 valor 2,2 valor 2,3 .... valor 2,n Å tupla 2 ..... ..... ...... .... ..... .... valor m,1 valor m,2 valor m,3 .... valor m,n Å tupla m La tabla superior representa la estructura de una relación según el modelo de Codd. [3.2.2] tupla Cada una de las filas de la tabla. Se corresponde con la idea de registro. Representa por tanto cada elemento individual de esa relación. Tiene que cumplir que: Å Cada tupla se debe corresponder con un elemento del mundo real. Å No puede haber dos tuplas iguales (con todos los valores iguales). [3.2.3] dominio Un dominio contiene todos los posibles valores que puede tomar un determinado atributo. Dos atributos distintos pueden tener el mismo dominio. www.elsolucionario.org
- 27. Sistemas Gestores de Bases de Datos bases de datos relacionales [26] Un dominio en realidad es un conjunto finito de valores del mismo tipo. A los dominios se les asigna un nombre y así podemos referirnos a ese nombre en más de un atributo. La forma de indicar el contenido de un dominio se puede hacer utilizando dos posibles técnicas: Å Intensión. Se define el nomino indicando la definición exacta de sus posibles valores. Por intensión se puede definir el dominio de edades de los trabajadores como: números enteros entre el 16 y el 65 (un trabajador sólo podría tener una edad entre 16 y 65 años). Å Extensión. Se indican algunos valores y se sobreentiende el resto gracias a que se autodefinen con los anteriores. Por ejemplo el dominio localidad se podría definir por extensión así: Palencia, Valladolid, Villamuriel de Cerrato,... [3.2.4] grado Indica el tamaño de una relación en base al número de columnas (atributos) de la misma. Lógicamente cuanto mayor es el grado de una relación, mayor es su complejidad al manejarla. [3.2.5] cardinalidad Número de tuplas de una relación, o número de filas de una tabla. [3.2.6] sinónimos Los términos vistos anteriormente tienen distintos sinónimos según la nomenclatura utilizada. A ese respecto se utilizan tres nomenclaturas: Términos 1 (nomenclatura relacional) Términos 2 (nomenclatura tabla) Términos 3 (nomenclatura ficheros) relación = tabla = fichero tupla = fila = registro atributo = columna = campo grado = nº de columnas = nº de campos cardinalidad = nº de filas = nº de registros [3.2.7] definición formal de relación Una relación está formada por estos elementos: Å Nombre. Identifica la relación. Å Cabecera de relación. Conjunto de todos los pares atributo-domino de la relación: { } ( ) Ai Di n i : =1 donde n es el grado. Å Cuerpo de la relación. Representa el conjunto de m tuplas {t1, t2,... tn} que forman la relación. Cada tupla es un conjunto de n pares atributo-valor {(Ai:Vij)}, donde Vij es el valor j del dominio Di asociado al atributo Ai.
- 28. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [27] Å Esquema de la relación. Se forma con el nombre R y la cabecera. Es decir: R{ } ( ) Ai Di n i : =1 Å Estado de la relación. Lo forman el esquema y el cuerpo. Ejemplo: Cliente DNI Nombre Edad 12333944C Ana 52 12374678G Eva 27 28238232H Martín 33 Esquema: Cliente(DNI:DNI, Nombre:Nombre, Edad:Edad) Cuerpo: {(DNI: “12333944C”, Nombre:”Ana”, Edad:52), (DNI: “12374678G”, Nombre:”Eva”, Edad;52), (DNI: “28238232H”, Nombre:”Martín”,Edad:33)} [3.2.8] tipos de tablas (o relaciones) Å Persistentes. Sólo pueden ser borradas por los usuarios: ² Base. Independientes, se crean indicando su estructura y sus ejemplares. ² Vistas. Son tablas que sólo almacenan una definición de consulta, resultado de la cual se produce una tabla cuyos datos proceden de las bases o de otras vistas e instantáneas. Si los datos de las tablas base cambian, los de la vista que utiliza esos datos también cambia. ² Instantáneas. Son vistas (creadas de la misma forma) que sí que almacenan los datos que muestra, además de la consulta que dio lugar a esa vista. Sólo modifican su resultado (actualizan los datos) siendo refrescadas por el sistema cada cierto tiempo. Å Temporales. Son tablas que se eliminan automáticamente por el sistema. Pueden ser de cualquiera de los tipos anteriores. Las utiliza el SGBD como almacén intermedio de datos. [3.2.9] claves clave candidata Conjunto de atributos que identifican unívocamente cada tupla de la relación. Es decir columnas cuyos valores no se repiten en ninguna otra tupla de esa tabla. clave primaria Clave candidata que se escoge como identificador de las tuplas. Se elige como primaria la candidata que identifique mejor a cada tupla en el contexto de la base de datos. Por ejemplo un campo con el DNI sería clave candidata de una tabla de clientes, si esa relación tiene un campo de código de cliente, éste sería mejor candidato (y por lo tanto clave principal) porque es mejor identificador para ese contexto.
- 29. Sistemas Gestores de Bases de Datos bases de datos relacionales [28] clave alternativa Cualquier clave candidata que no sea primaria. clave externa, ajena o secundaria Son los datos de atributos de una tabla cuyos valores están relacionados con atributos de otra tabla. Por ejemplo en la tabla equipos tenemos estos datos: Equipo Nº Equipo Real Madrid 1 F.C. Barcelona 2 Athletic Bilbao 3 En la tabla anterior la clave principal es el atributo nº equipo. En otra tabla tenemos: Nº Jugador Jugador Nº Equipo 1 Karanka 3 2 Ronaldinho 2 3 Raul 1 4 Beckham 1 El atributo Nº Equipo sirve para relacionar el Jugador con el equipo al que pertenece. Ese campo en la tabla de jugadores es una clave secundaria. [3.2.10] nulos En los lenguajes de programación se utiliza el valor nulo para reflejar que un identificador no tiene ningún contenido. Al programar en esos lenguajes se trata de un valor que no permite utilizarse en operaciones aritméticas o lógicas. En las bases de datos relacionales se utiliza con más posibilidades, aunque su significado no cambia: valor vacío, se utiliza para diversos fines. En claves secundarias indican que el registro actual no está relacionado con ninguno. En otros atributos indica que no se puede rellenar ese valor por la razón que sea. Es importante indicar que el texto vacío “”, no es lo mismo que el nulo. Como tampoco el valor cero significa nulo. Puesto que ese valor se utiliza continuamente, resulta imprescindible saber como actúa cuando se emplean operaciones lógicas sobre ese valor. Eso significa definir un tercer valor en la lógica booleana, además de los clásicos verdadero y falso. Un valor nulo no es ni verdadero ni falso (se suele interpretar como un quizás). El uso de operadores lógicos con el nulo da lugar a que: Å verdadero Y (AND) nulo da como resultado, nulo Å falso Y (AND) nulo da como resultado, falso Å verdadero O (OR) nulo da como resultado, verdadero Å falso O nulo da como resultado nulo www.elsolucionario.org
- 30. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [29] Å la negación de nulo, da como resultado nulo Se utiliza un operador en todas las bases relacionales llamado es_nulo (is null) que devuelve verdadero si el valor con el que se compara es nulo. [3.3] restricciones Se trata de unas condiciones de obligado cumplimiento por los datos de la base de datos. Las hay de varios tipos. [3.3.1] inherentes Son aquellas que no son determinadas por los usuarios, sino que son definidas por el hecho de que la base de datos sea relacional. Las más importantes son: Å No puede haber dos tuplas iguales Å El orden de las tuplas no es significativo Å El orden de los atributos no es significativo Å Cada atributo sólo puede tomar un valor en el dominio en el que está inscrito [3.3.2] semánticas El modelo relacional permite a los usuario incorporar restricciones personales a los datos. Se comentan las diferentes reglas semánticas a continuación: clave primaria (primary key) Hace que los atributos marcados como clave primaria no puedan repetir valores. Además obliga a que esos atributos no puedan estar vacíos (nulos); es más si la clave primaria la forman varios atributos, ninguno de ellos podrá estar vacío. unicidad (unique) Impide que los valores de los atributos marcados de esa forma, puedan repetirse. Esta restricción debe indicarse en todas las claves alternativas. Al marcar una clave primaria se añade automáticamente sobre los atributos que forman la clave un criterio de unicidad. obligatoriedad (not null) Prohíbe que el atributo marcado de esta forma no tenga ningún valor (es decir impide que pueda contener el valor nulo, null). integridad referencial (foreign key) Sirve para indicar una clave externa. Cuando esa clave se marca con integridad referencial, no se podrán introducir valores que no estén incluidos en los campos relaciones con esa clave.
- 31. Sistemas Gestores de Bases de Datos bases de datos relacionales [30] Es decir si hay una tabla de alquileres en la que cada fila es un alquiler, existirá un atributo cod_cliente que indicará el código del cliente y que estará relacionado con una tabla de clientes, en la que dicho atributo es la clave principal. De hecho no se podrá incluir un código que no esté en la tabla clientes; eso es lo que prohíbe la integridad referencial. Eso causa problemas en las operaciones de borrado y modificación de registros; ya que si se ejecutan esas operaciones sobre la tabla principal (si se modifica o borra un cliente) quedarán filas en la tabla secundaria con la clave externa haciendo referencia a un valor que ya no existe. Esto último se puede manipular de estas formas: Å Prohibiendo la operación (no action). Å Transmitiendo la operación en cascada (cascade). Es decir si se modifica o borra un cliente; también se modificarán o barrarán los alquileres relacionados con él. Å Colocando nulos (set null) Las referencias al cliente en la tabla de alquileres se colocan como nulos (es decir, alquileres sin cliente). Å Usando el valor por defecto (default). Se colocan un valor por defecto en las claves externas relacionadas. regla de validación (check) Condición que debe de cumplir un dato concreto para que sea actualizado. Puede afectar a una tabla o a varias. Por ejemplo restringir el campo sueldo para que siempre sea mayor de 1000, sería una regla de validación. [3.4] las 12 reglas de Codd Preocupado por los productos que decían ser sistemas gestores de bases de datos relacionales (RDBMS) sin serlo, Codd publica las 12 reglas que debe cumplir todo DBMS para ser considerado relacional. Estas reglas en la práctica las cumplen pocos sistemas relacionales. Las reglas son: [1] Información. Toda la información de la base de datos debe estar representada explícitamente en el esquema lógico. Es decir, todos los datos están en las tablas. [2] Acceso garantizado. Todo dato es accesible sabiendo el valor de su clave y el nombre de la columna o atributo que contiene el dato. [3] Tratamiento sistemático de los valores nulos. El DBMS debe permitir el tratamiento adecuado de estos valores [4] Catálogo en línea basado en el modelo relacional. Los metadatos deben de ser accesibles usando un esquema relacional.
- 32. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [31] [5] Sublenguaje de datos completo. Al menos debe de existir un lenguaje que permita el manejo completo de la base de datos. Este lenguaje, por lo tanto, debe permitir realizar cualquier operación. [6] Actualización de vistas. El DBMS debe encargarse de que las vistas muestren la última información [7] Inserciones, modificaciones y eliminaciones de dato nivel. Cualquier operación de modificación debe actuar sobre conjuntos de filas, nunca deben actuar registro a registro. [8] Independencia física. Los datos deben de ser accesibles desde la lógica de la base de datos aún cuando se modifique el almacenamiento. [9] Independencia lógica. Los programas no deben verse afectados por cambios en las tablas [10] Independencia de integridad. Las reglas de integridad deben almacenarse en la base de datos (en el diccionario de datos), no en los programas de aplicación. [11] Independencia de la distribución. El sublenguaje de datos debe permitir que sus instrucciones funciones igualmente en una base de datos distribuida que en una que no lo es. [12] No subversión. Si el DBMS posee un lenguaje que permite el recorrido registro a registro, éste no puede utilizarse para incumplir las reglas relacionales. [3.5] álgebra relacional [3.5.1] dinámica del modelo relacional Lo visto anteriormente pertenece al campo de la estática de las bases de datos relacionales. La dinámica en cambio dicta las transformaciones que se pueden realizar sobre la base de datos. La estática se refiere a las tablas base, la dinámica a las vistas. [3.5.2] lenguajes formales Las bases de datos relacionales sólo contienen tablas, por lo que la dinámica manipula esas tablas. Para indicar la transformación se emplean lenguajes formales, estos lenguajes manipulan los datos sin tener en cuenta cómo se almacenan Codd definió dos lenguajes formales Å Álgebra relacional. Operaciones que combinan tablas y que dan como resultado otra tabla. Å Cálculo relacional. Operaciones que a partir de una fórmula obtienen un conjunto de tuplas. Se supone que ambos son equivalentes. www.elsolucionario.org
- 33. Sistemas Gestores de Bases de Datos bases de datos relacionales [32] En este apartado se explica el álgebra relacional. [3.5.3] operaciones básicas unitarias renombrado La operación de renombrado se utiliza exclusivamente para cambiar el nombre de una relación. Se utiliza de esta forma: RÆR’ La relación R pasa a llamarse R’ selección (σ) Es una operación que aplicada a una tabla obtiene un subconjunto de filas de esa tabla en la que sólo aparecen las filas que cumplan un determinado criterio. Formalmente se define de esta forma: Dado una relación R de cardinalidad C y grado G, una operación consiste en la creación de una relación R’, cuyos elementos son las tuplas de R que cumplen una fórmula F. Esto se expresa de esta forma: σF(R)=R’ F es una fórmula que puede contener diversos operadores: Å Operadores de comparación. <, >, ≤, ≥, ≠, = Å Operadores booleanos. ∧ (AND), ∨ (OR) y NO Ejemplo: σnombre=”Pepe”(Cliente) Eso obtiene una tabla cuyo contenido son las filas de la tabla Cliente cuya columna nombre valga “Pepe” σnombre=”Pepe” ∧edad>25 (Cliente) Eso obtiene una tabla cuyo contenido son las filas de la tabla Cliente cuya columna nombre valga “Pepe” y la columna edad valga más que 25. Las operaciones se pueden mezclar (ejemplo de selección y renombrado): (σnombre=”Pepe” ∧edad>25 (Cliente)) ÆPepes
- 34. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [33] proyección Se trata de una operación que obtiene un subconjunto de una tabla basado sólo en algunas columnas de la tabla original. Su definición formal es: Πi,j,k,.. (R) Si R es una relación de grado G, entonces la proyección Πi,j,k,... de R es un relación de grado G’ con G’<G, formada por los atributos de nombre i, j, k,... Ejemplo Πnombre, apellidos(Cliente) Obtiene una tabla con las columnas nombre y apellidos de la tabla Cliente [3.5.4] operaciones básicas binarias unión Si R y S son dos relaciones del mismo grado y definidas sobre el mismo conjunto de atributos; R ∪ S es una relación del mismo grado que R y S y definida sobre el mismo conjunto de atributos, donde las tuplas de esa nueva relación son todas las de R y todas las de S. Hay que tener en cuenta que las tuplas exactas no aparecen repetidas en la relación resultante. Ejemplo: R A B S A B a 1 a 1 a 3 b 2 b 2 b 4 c 1 R ∪ S A B a 1 a 3 b 2 b 4 c 1
- 35. Sistemas Gestores de Bases de Datos bases de datos relacionales [34] diferencia Si R y S son dos relaciones del mismo grado y definidas sobre el mismo conjunto de atributos; R - S es una relación del mismo grado y atributos formada por todas las tuplas de R que no están presentes en S. Ejemplo (basado en las tablas anteriores): R - S A B a 3 c 1 intersección Si R y S son dos relaciones del mismo grado y definidas sobre el mismo conjunto de atributos; R ∩ S es una relación del mismo grado y atributos formada por todas las tuplas de R que están también presentes en S. Ejemplo (basado en las tablas anteriores): R ∩ S A B a 1 b 2 producto cartesiano Si R es una relación de grado G1 y S es una relación de grado G2; R × S es una relación de grado G1+G2 cuyos G1 primeros componentes forman una tupla de R y los siguientes G2 forman una tupla de S. Es decir el producto cartesiano es una relación que contiene todas las tuplas que resultan de combinar cada tupla de R con cada tupla de S. Ejemplo: R A B S D E F a 1 a 3 1 a 3 b 4 2 c 5 4 R × S A B D E F a 1 a 3 1 a 1 b 4 2 a 1 c 5 4 a 3 a 3 1 a 3 b 4 2 a 3 c 5 4 combinación (join) Se trata de un producto cartesiano en el que las tuplas resultantes cumplen una determinada condición. R ∞ S a Θ b Donde Θ simboliza a cualquier operador de relación y a y b son atributos de R o de S. www.elsolucionario.org
- 36. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [35] Ejemplo: cliente ∞ alquiler cliente.dni = alquiler.dni Esto combinaría todos los clientes con todos los alquileres mostrando sólo las filas cuyo número de dni de la tabla de clientes coincida con el dni de la tabla de alquileres. Es decir: cliente ∞ alquiler cliente.dni = alquiler.dni = σcliente.dni = alquiler.dni(cliente×alquiler) combinación natural (natural join) Es una combinación que no indica condición alguna y que automáticamente obtiene las tuplas combinadas cuyos atributos comunes a ambas tablas sean del mismo valor. Es decir si la tabla cliente y la tabla alquiler tienen en común el atributo dni, entonces: cliente ∞ alquiler Obtiene los datos combinados de cliente y alquiler cuyos dnis coincidan. La definición de R∞S es: R∞S=σR.A1=S.A1∧R.A2=S.A2∧...∧R.An=S.An (R×S) En ese esquema los atributos A1, A2,...An son atributos comunes a ambas relaciones. división Si R y S son relaciones de grado G1 y G2 respectivamente y A es el conjunto de atributos comunes a ambas relaciones; R : S obtiene una relación de de grado G1-G2 en la que las tuplas resultantes son las tuplas formadas por los atributos distintos de A que poseen todos los valores posibles de A en la tabla S. Es decir se obtienen las tuplas cuyos contenidos en los atributos comunes poseen todas las combinaciones almacenadas en S. Ejemplo: R D E F S F a 34 uno uno a 34 dos dos c 23 uno d 11 dos R : S D E a 34
- 37. Sistemas Gestores de Bases de Datos bases de datos relacionales [36] [3.6] cálculo relacional Utiliza expresiones matemáticas para generar fórmulas que han de cumplir los elementos de la relación; de modo que se obtiene una relación formada por las tuplas que cumplen esa fórmula. La dificultad está en saber escribir la fórmula. [3.6.1] cálculo relacional orientado a tuplas Se basa en responder a la pregunta ¿Qué tuplas se encuentran en el resultado? Å Esta pregunta se resuelve con una fórmula cuyo formato es {t|P(t)} Se lee: el conjunto de las tuplas t tales que cumplen el predicado P. Ese predicado es una expresión que puede contener una o más variables de tupla (variables que representan tuplas arbitrarias de una relación) Hay dos tipos de variable de tupla: Å ligadas. Se cuantifican mediante los operadores ∀ y ∃ . Ejemplo: {t|∃ s(s ∈ cliente ∧ t[dni]=s[dni] ∧ t[edad]>25)} Obtiene clientes con más de 25 años. Å libres. Son las que no utilizan los operadores anteriores (∀ y ∃ .) Las fórmulas pueden contener: Å Valores constantes Å Variables de tupla. Se denotan con una letra minúscula (normalmente t, u, v,...) Å Expresiones como t[i], que significan la i-ésima componente de t. Å Expresiones como t[N], donde N es el nombre de un atributo de t. La construcción sigue estas reglas: [2] Se llaman átomos de fórmula a: ª R(s), donde R es el nombre de una relación y s una variable de tupla. Significa que la variable de tupla s, pertenece a R ª S[i]Θu[j], donde Θrepresenta un operador de relación (>,<,>=,<=,..). El atributo i-ésimo de S estará relacionad con el j-ésimo componente de u [3] Las expresiones de la fórmula se construyen: ª Sabiendo que los átomos de fórmula son expresiones válidads
- 38. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [37] ª Si F1 y F2 son fórmulas, las expresiones F1∧F2, F1 ∨F2, F1⇐F2 y ¬ F1 , son válidas ª Si F es una fórmula se puede indicar ∀ s F(s), que significa para todas las tuplas de s se cumple F. ª Si F es una fórmula se puede indicar ∃ s F(s), que significa que existe una tupla de s que cumple la fórmula F ª Se admiten paréntesis en las fórmulas [3.6.2] cálculo relacional orientado a dominios Utilizan una sintaxis semejante, en esta forma: {V1, V2, V3,....Vn|P(V1,V2,V3,...Vn)} Donde V1, V2,.. son variables de dominio de cada atributo y P(V1,V2,....) es una fórmula sobre esas variables. Con esas variables se pueden utilizar los mismos operadores indicados anteriormente. De hecho la diferencia está en la aplicación a dominios y no a tuplas, lo que varía las expresiones. Gracias este cálculo se generan expresiones en cálculo relacional semejantes a las del álgebra relacional. www.elsolucionario.org
- 40. [39] [Unidad 4] diseño de bases de datos relacionales [4.1] el modelo entidad - relación [4.1.1] introducción Se ha visto en temas anteriores (unidades 2, Sistemas Gestores de Base de Datos y 3, Bases de Datos Relacionales) que existen varios esquemas a realizar para poder representar en forma de base de datos informática un problema procedente del ordenador. El primero de esos esquemas es el llamado esquema conceptual, que representa la información de forma absolutamente independiente al Sistema Gestor de Base de Datos. Los esquemas internos de las diferentes bases de datos no captan suficientemente bien la semántica del mundo real, de ahí que primero haya que pasar por uno o dos esquemas previos más cercanos al mundo real.
- 41. Sistemas Gestores de Bases de Datos diseño de bases de datos relacionales [40] El hecho de saltarse el esquema conceptual conlleva un problema de pérdida con el problema real. El esquema conceptual debe reflejar todos los aspectos relevantes del mundo a real a modelar. Peter P. Chen y el modelo entidad/relación En 1976 y 1977 dos artículos de Peter P. Chen presentan un modelo para realizar esquemas que posean una visión unificada de los datos. Este modelo es el modelo entidad/interrelación (entity/relationship en inglés) que actualmente se conoce más con el nombre de entidad/relación (Modelo E/R o ME/R, en inglés E/RM). Posteriormente otros autores han añadido mejoras a este modelo lo que ha producido una familia de modelos. La más aceptada actualmente es el modelo entidad/relación extendido (ERE) que complemente algunas carencias del modelo original. No obstante las diversas variantes del modelo hacen que la representación de este modelo no sea muy estándar, aunque hay ideas muy comunes a todas las variantes. Hay que insistir en que este modelo no tiene nada que ver con las bases de datos relacionales, los esquemas entidad/relación se pueden utilizar con cualquier SGBD ya que son conceptuales. Confunde el uso de la palabra relación, pero el concepto de relación en este esquema no tiene nada que ver con la idea de relación expuesta por Codd en su modelo relacional. [4.1.2] componentes del modelo entidad Se trata de cualquier objeto u elemento (real o abstracto) acerca del cual se pueda almacenar información en la base de datos. Es decir cualquier elemento informativo que tenga importancia para una base de datos. Ejemplos de entidades son Pedro, la factura número 32456, el coche matrícula 3452BCW, etc. Una entidad no es un propiedad concreta sino un objeto que puede poseer múltiples propiedades (atributos). Es decir “Sánchez” es el contenido del atributo Primer Apellido de la entidad que representa a la persona Pedro Sánchez Crespo con DNI 12766374,... Una entidad es un objeto concreto, no un simple dato: el coche que tenemos en el garaje es una entidad, “Mercedes” sin embargo es la marca de ese coche, es decir es un atributo de esa entidad. conjuntos de entidades Las entidades que poseen las mismas propiedades forman conjuntos de entidades. Ejemplos de conjuntos de entidades son los conjuntos: personas, facturas, coches,... www.elsolucionario.org
- 42. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [41] Ana Pedro José María Consuelo Jaime Lourdes PERSONAS Conjunto de entidades Entidades Ilustración 10, Ejemplos de entidad y conjunto de entidad En la actualidad se suele llamar entidad a lo que anteriormente se ha definido como conjunto de entidades. De este modo hablaríamos de la entidad PERSONAS. Mientras que cada persona en concreto sería una ocurrencia o un ejemplar de la entidad persona. Esa terminología es la que actualmente vamos a utilizar en representación gráfica de las entidades En el modelo entidad relación los conjuntos de entidades se representan con un rectángulo dentro del cual se escribe el nombre de la entidad: PERSONAS Ilustración 11, Representación de la entidad persona tipos de entidades Å Regulares. Son las entidades normales que tienen existencia por sí mismas sin depender de otras. Su representación gráfica es la indicada arriba Å Débiles. Su existencia depende de otras. Por ejemplo la entidad tarea laboral sólo podrá tener existencia si existe la entidad trabajo. Las entidades débiles se presentan de esta forma: TAREAS LABORALES Ilustración 12, Entidad débil
- 43. Sistemas Gestores de Bases de Datos diseño de bases de datos relacionales [42] [4.1.3] relaciones qué es una relación Representan asociaciones entre entidades. Es el elemento del modelo que permite relacionar en sí los datos del mismo. Por ejemplo, en el caso de que tengamos una entidad personas y otra entidad trabajos. Ambas se realizan ya que las personas trabajan y los trabajos son realizados por personas: Ana Pedro José María Consuelo Jaime Lourdes PERSONAS Fontanero Electricista Peluquero Administrativo TRABAJOS Ilustración 13, ejemplo de relación En una relación (Chen llamaba conjunto de relaciones a lo que ahora se llama relación a secas) cada ejemplar (relación en la terminología de Chen) asocia un elemento de una entidad con otro de la otra entidad. En una relación no pueden aparecer dos veces relacionados los mismos ejemplares. Es decir en el ejemplo anterior, en la relación no puede aparecer dos veces el mismo trabajador asociado al mismo trabajo. representación gráfica La representación gráfica de las entidades se realiza con un rombo al que se le unen líneas que se dirigen a las entidades, las relaciones tienen nombre (se suele usar un verbo). En el ejemplo anterior podría usarse como nombre de relación, trabajar: PERSONAS TRABAJAR TRABAJOS
- 44. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [43] ejemplos de relaciones CURSO IMPARTIR AULA DIA Relación ternaria PERSONA ES PAREJA Relación reflexiva LOCALIDAD PROVINCIA PERTENECE ES CAPITAL Relación doble CURSO IMPARTIR AULA Relación binaria Å Relaciones Binarias. Son las relaciones típicas. Se trata de relaciones que asocian dos entidades. Å Relaciones Ternarias. Relacionan tres entidades. A veces se pueden simplificar en relaciones binarias, pero no siempre es posible. Å Relaciones n-arias. Relacionan n entidades Å Relaciones dobles. Se llaman así a dos relaciones distintas que sirven para relacionar a las mismas relaciones. Son las más difíciles de manejar ya que al manipular las entidades hay que elegir muy bien la relacionan a utilizar para relacionar los datos. Å Relación reflexiva. Es una relación que sirve para relacionar ejemplares de la misma entidad (personas con personas, piezas con piezas, etc.) cardinalidad Indica el número de relaciones en las que una entidad puede aparecer. Se anota en términos de: Å cardinalidad mínima. Indica el número mínimo de asociaciones en las que aparecerá cada ejemplar de la entidad (el valor que se anota es de cero o uno, aunque tenga una cardinalidad mínima de más de uno, se indica sólo un uno) Å cardinalidad máxima. Indica el número máximo de relaciones en las que puede aparecer cada ejemplar de la entidad. Puede ser uno, otro valor concreto mayor que uno (tres por ejemplo) o muchos (se representa con n) En los esquemas entidad / relación la cardinalidad se puede indicar de muchas formas. Quizá la más completa (y la que se utiliza en este documento es ésta) consiste en anotar en los extremos la cardinalidad máxima y mínima de cada entidad en la relación. www.elsolucionario.org
- 45. Sistemas Gestores de Bases de Datos diseño de bases de datos relacionales [44] Ejemplo de uso de cardinalidad: Ilustración 14, Cardinalidades. En el ejemplo un jugador tiene una cardinalidad mínima de 0 (puede no estar en ningún equipo) y una máxima de 1 (como mucho está en un equipo, no puede estar en dos a la vez). Cada equipo tiene una cardinalidad mínima de uno (en realidad sería una cardinalidad mínima más alta, pero se anota un uno) y una máxima de n (en cada equipo hay muchos jugadores) En la página siguiente se indican otras notaciones para las cardinalidades. Muchos De cero a muchos Uno De uno a muchos De cero a uno Ejemplo: JUGADOR JUEGA EQUIPO ENTRENADOR ENTRENA En el ejemplo, cada equipo cuenta con varios jugadores. Un jugador juega como mucho en un equipo y podría no jugar en ninguno. Cada entrenador entrena a un equipo (podría no entrenar a ninguno), el cual tiene un solo entrenador como mucho y como poco.
- 46. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [45] Otra notación es: Y aún habría más pero nos quedaremos con la primera ya que es la más completa. roles A veces en las líneas de la relación se indican roles. Los roles representan el papel que juega una entidad en una determinada relación. Ejemplo: Ilustración 15, Ejemplo de rol. Un trabajador puede ser visto como jefe o como empleado según a qué lado de la relación esté [4.1.4] atributos Describen propiedades de las entidades y las relaciones. En este modelo se representan con un círculo, dentro del cual se coloca el nombre del atributo. Ejemplo: Ilustración 16, Atributos
- 47. Sistemas Gestores de Bases de Datos diseño de bases de datos relacionales [46] tipos de atributos compuesto múltiples Pueden tomar varios valores (varios teléfonos para el mismo cliente): opcionales Lo son si pueden tener valor nulo: identificador o clave Se trata de uno o más campos cuyos valores son únicos en cada ejemplar de una entidad. Se indican subrayando el nombre del identificador. Para que un atributo sea considerado un buen identificador tiene que cumplir con los siguientes requisitos: [1] Deben distinguir a cada ejemplar teniendo en cuenta las entidades que utiliza el modelo. No tiene que ser un identificador absoluto. [2] Todos los ejemplares de una entidad deben tener el mismo identificador. [3] Cuando un atributo es importante aun cuando no tenga una entidad concreta asociada, entonces se trata de una entidad y no de un atributo identificador alternativo Se trata de uno o más campos cuyos valores son únicos para cada ejemplar de una entidad, pero que no son identificadores ya que existen identificadores mejores en la www.elsolucionario.org
- 48. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [47] entidad. En este caso los candidatos es aconsejable marcarlos con un subrayado discontinuo (ejemplo de subrayado discontinuo) [4.1.5] modelo entidad relación extendido En el modelo entidad relación extendido aparecen nuevos tipos de relaciones. Son las relaciones ISA (es un) y las entidades débiles relaciones is a o relaciones de herencia Se utilizan para unificar entidades agrupándolas en una entidad más general (generalización) o bien para dividir una entidad general en entidades más específicas (especificación). Se habla de generalización si inicialmente partimos de una serie de entidades que al estudiarlas en detalle descubrimos que todas ellas pertenecen al mismo conjunto. En la generalización las entidades son totalmente heterogéneas, es decir, los atributos son diferentes. La entidad general se llama superentidad las otras se denominan subentidades. La superentidad normalmente tiene una clave principal distinta de las subentidades. La especialización ocurre cuando partimos de una entidad que podemos dividir en subentidades para detallar atributos que varían en las mismas. Comparten clave con la superentidad y los atributos de la superclase se heredan en las subclases. En la práctica se manejan casi igual ambas; de hecho la representación es la misma: Ilustración 17, Relación ISA La entidad general personal se ha dividido en tres pequeñas entidades. La cuestión de si es generalización o especialización no suele ser excesivamente importante salvo por el tema de la herencia de los atributos; hay que recordar que en la especialización, las subentidades heredan los atributos de la superentidad. En el diseño la herencia de los atributos queda reflejado por las cardinalidades, si en la superentidad se indica una cardinalidad mínima de uno, se entiende entonces que se trata de de una especialización en las que las subentidades heredan los atributos de la superclase. Si la cardinalidad mínima es cero se entiende que las subclases no heredan los atributos. Como se comentó antes la cuestión de si es una especialización o generalización se suele distinguir por las claves; si se comparte clave entre la superentidad y sus descendientes, se habla de especialización; de otro modo se habla de generalización (aunque esto es muy rebatible, en la práctica suele ser la única forma de distinguir ambos conceptos en el esquema). De cualquier modo, la cuestión de si tenemos una generalización o una especialización no es tan importante como el hecho de no fallar con las cardinalidades, ya que al pasar el esquema al modelo relacional es lo que importa más.
- 49. Sistemas Gestores de Bases de Datos diseño de bases de datos relacionales [48] La representación de relaciones ISA (independientemente de si es generalización o especialización) es esta: Ilustración 18, Relación ISA con cardinalidades Con atributos el esquema sería: PERSONAL PROFESORES ISA BEDELES TÉCNICOS (0,1) (0,1) (0,1) (1,1) Id personal Nombre Departamento Categoría Meses Trienios Ilustración 19, Especialización En la especialización anterior (lo es porque la clave la tiene la superentidad) los profesores, bedeles y técnicos heredan el atributo id personal y el nombre, el resto son atributos propios sólo de cada entidad (trienios pertenece sólo a los profesores, en este ejemplo)
- 50. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [49] ARTÍCULOS DISCOS ISA LIBROS MERCHANDISING (0,1) (0,1) (0,1) (0,1) Id artículo Precio Titulo Id Libro Id Merc Id Disco Páginas Título Tipo Ilustración 20, Generalización En la ilustración anterior artículo es una generalización de los discos, libros y artículos de merchandising, se utiliza una clave distinta para esta entidad. Incluso en este caso podría haber discos o libros o merchandising que no están relacionados con los artículos (la cardinalidad de artículos es 0,1). obligatoriariedad En las relaciones ISA (y también en otros tipos de relaciones) se puede indicar el hecho de que cada ejemplar obligatoriamente tiene que participar en una de entre varias ramas de una relación. Este hecho se marca con un arco entre las distintas relaciones. En las relaciones ISA se usa mucho, por ejemplo: PERSONAL PROFESORES ISA BEDELES TÉCNICOS (0,1) (0,1) (0,1) (1,1) Ilustración 21, Relación ISA con obligatoriedad En el ejemplo, el personal tiene que ser obligatoriamente un bedel, o un profesor o un técnico; una de las tres cosas (no puede haber personal que no sea una de estas tres cosas). entidades débiles Ya se ha comentado antes que una entidad débil es aquella cuya existencia depende de otra. Ahora vamos a clarificar más estas entidades. Efectivamente ocurren cuando hay una entidad más fuerte de la que dependen. Lógicamente tienen relación con esa entidad. En la forma clásica se representaría de esta forma: www.elsolucionario.org
- 51. Sistemas Gestores de Bases de Datos diseño de bases de datos relacionales [50] TRABAJOS TAREAS ES PARTE DE (1,1) (1,n) Id Trabajo Descripción Id Trabajo Id Tarea Nombre Tipo Ilustración 22, Relación candidata a entidad débil En el diagrama la relación entre las tareas y los trabajos es 1 a n (cada trabajo se compone de n tareas). Una tarea obligatoriamente está asignada a un trabajo, es más no tiene sentido hablar de tareas sin hablar del trabajo del que forma parte. Hay incluso (aunque no siempre) una dependencia de identificación ya que las tareas se identifican por un número de tarea y el número de trabajo al que se asignan. Esto es un síntoma definitivo de que se trata de una entidad débil. Todas las entidades débiles tienen este tipo de relación 1 a n con respecto a la entidad fuerte de la que depende su existencia, por eso se representan de esta otra forma: Id Trabajo TRABAJOS Descripción Id Tarea Nombre Tipo Id Trabajo TAREAS Ilustración 23, Entidad débil relacionada con su entidad fuerte No hace falta dibujar el rombo de la relación ni la cardinalidad, se sobreentiende el tipo y cardinalidad (1 a n) que posee.
- 52. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [51] [4.2] el modelo entidad/relación y el modelo relacional El modelo entidad/relación es un modelo conceptual que sirve para cualquier tipo de sistema gestor de base de datos. El modelo relacional (visto en el tema 3) es un modelo lógico sólo sirve para sistemas gestores de bases de datos relacionales (y no para jerárquicas, o codasyl, por ejemplo). Esto significa que el esquema entidad/relación que hayamos obtenido en el modelado conceptual, habrá que convertirle al esquema relacional correspondiente. Todos los diseñadores y administradores de bases de datos relacionales usan (al menos deberían usar) esquemas conceptuales entidad/relación (hay que recordar que hay otros modelos conceptuales) porque se adaptan muy bien a este modelo. Pero para realizar este cambio hay que conocer las reglas que permiten este cambio. Hay que insistir en la diferencia de la palabra relación en ambos modelos. En el modelo relacional una relación es una tabla mientras que en el entidad/relación es la asociación que se produce entre dos entidades. A partir de este momento tomaremos el significado de relación que da el modelo entidad/relación. A las relaciones del modelo relacional las llamaremos simplemente tablas para evitar confusiones. [4.3] paso de entidad/relación al modelo relacional [4.3.1] transformación de las entidades fuertes En principio las entidades fuertes del modelo Entidad Relación son transformados al modelo relacional siguiendo estas instrucciones: Å Entidades. Las entidades pasan a ser tablas Å Atributos. Los atributos pasan a ser columnas o atributos de la tabla. Å Identificadores principales. Pasan a ser claves primarias Å Identificadores candidatos. Pasan a ser claves candidatas.
- 53. Sistemas Gestores de Bases de Datos diseño de bases de datos relacionales [52] Esto hace que la transformación se produzca según este ejemplo: Nombre Identificador Atributo1 Atributo2 Atributo2 Nombre( , Atributo 1, Atributo 2, Atributo 3) Identificador Ilustración 24,Transformación de una entidad fuerte al esquema relacional [4.3.2] transformación de relaciones La idea inicial es transformar a cada relación en una tabla en el modelo relacional. Pero hay que distinguir según el tipo de relación. relaciones varios a varios En las relaciones varios a varios (n a n en la cardinalidad mayor, la cardinalidad menor no importa salvo para determinar los índices), la relación se transforma en una tabla cuyos atributos son: los atributos de la relación y las claves de las entidades relacionadas (que pasarán a ser claves externas). La clave de la tabla la forman todas las claves externas: Ilustración 25, Transformación de una relación varios a varios relaciones de orden n Las relaciones ternarias, cuaternarias y n-arias que unen más de dos relaciones se transforman en una tabla que contiene los atributos de la relación más los identificadores de las entidades relacionadas. La clave la forman todas las claves externas: www.elsolucionario.org
- 54. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [53] Ilustración 26, Transformación en el modelo relacional de una entidad n-aria relaciones uno a varios y uno a uno Las relaciones binarios de tipo uno a varios no requieren ser transformadas en una tabla en el modelo relacional. En su lugar la tabla del lado varios (tabla relacionada) incluye como clave externa1 el identificador de la entidad del lado uno (tabla principal): Ilustración 27, Transformación de una relación uno a varios Así en el dibujo, el identificador2 en la tabla Entidad1 pasa a ser una clave externa. En el caso de que el número mínimo de la relación sea de cero (puede haber ejemplares de la entidad uno sin relacionar), se deberá permitir valores nulos en la clave externa identificador2. En otro caso no se podrán permitir (ya que siempre habrá un valor relacionado). En el caso de las relaciones uno a uno, ocurre lo mismo: la relación no se convierte en tabla, sino que se coloca en una de las tablas (en principio daría igual cuál) el identificador de la entidad relacionada como clave externa. 1 Clave externa, clave ajena, clave foránea, clave secundaria y foreign key son sinónimos
- 55. Sistemas Gestores de Bases de Datos diseño de bases de datos relacionales [54] En el caso de que una entidad participe opcionalmente en la relación, entonces es el identificador de ésta el que se colocará como clave externa en la tabla que representa a la otra entidad. Entidad Relación (1,n) (1,1) Rol2 Rol1 Entidad( ,Atributo1, Identificador Rol1, Atributo2) Identificador Identificador Atributo1 Atributo2 Entidad Relación (1,n) (1,n) Rol2 Rol1 Entidad( ,Atributo1) Identificador Identificador Atributo1 Atributo2 Relación( , Atributo2) Identificador Rol1, Identificador Rol2 Ilustración 28, Transformación de relaciones recursivas en el modelo relacional relaciones recursivas Las relaciones recursivas se tratan de la misma forma que las otras, sólo que un mismo atributo puede figurar dos veces en una tabla como resultado de la transformación (véase ilustración anterior) [4.3.3] entidades débiles Toda entidad débil incorpora una relación implícita con una entidad fuerte. Esta relación no necesita incorporarse como tabla en el modelo relacional. Sí se necesita incorporar la clave de la entidad fuerte como clave externa en la entidad débil. Es más, en muchos casos esa clave externa, forma parte de la clave principal de la tabla que representa a la entidad débil. El proceso es: Id Fuerte Entidad Fuerte Atributo1 Id Débil Entidad Débil Atributo2 Entidad1( , Atributo2) Id Débil Id Fuerte, Entidad Fuerte( , Atributo 1) Id Fuerte Ilustración 29, transformación de una entidad débil en el modelo relacional En ocasiones el identificador de la entidad débil es suficiente para identificar los ejemplares de dicha entidad, entonces ese identificador quedaría como clave principal,
- 56. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [55] pero el identificador de la entidad fuerte seguiría figurando como clave externa en la entidad débil. [4.3.4] generalizaciones y especificaciones Las generalizaciones y/o especificaciones se convierten al modelo relacional de esta forma (superentidad es la entidad más general, subentidades son las entidades más específicas): [1] Las subentidades pasan a ser tablas. [2] Si la clave de la superentidad es distinta de las subentidades, entonces se coloca el identificador de la superentidad en cada subentidad como clave externa o secundaria. Si la clave es la misma, entonces no es necesario. Superentidad Subentidad1 Subentidad2 Id1 Atributo1 Id2 Atributo2 Id3 Atributo3 Subentidad1( , Atributo 2, Id1) Id2 Subentidad2( , Atributo 3, Id1) Id3 Superentidad( , Atributo 1) Id1 Ilustración 30, Proceso de transformación de relaciones ISA con clave propia [3] Si la clave es la misma, entonces todas las entidades tendrán el mismo atributo como clave principal: www.elsolucionario.org
- 57. Sistemas Gestores de Bases de Datos diseño de bases de datos relacionales [56] Superentidad Subentidad1 Subentidad2 Id Atributo1 Id Atributo2 Id Atributo3 Subentidad1( Atributo 2) Id, Subentidad2( , Atributo 3) Id Superentidad( , Atributo 1) Id Ilustración 31, Proceso de transformación de relaciones ISA en el modelo relacional si tienen la misma clave [4] La superentidad debe generar una tabla sólo en el caso de que haya posibilidad de que exista un ejemplar de dicha entidad que no sea ejemplar de las subentidades (un trabajador que no sea ni bedel, ni administrativo, ni ninguna categoría). Esto se detecta en el caso de que no haya obligatoriedad. De otro modo basta con generar las tablas de las subentidades e incluir los atributos de la entidad superior: Superentidad Subentidad1 Subentidad2 Id Atributo1 Id Atributo2 Id Atributo3 Subentidad1( Atributo 2, Atributo1) Id, Subentidad2( , Atributo 3, Atributo1) Id Ilustración 32, Paso de relaciones ISA al modelo relacional cuando toda superentidad figura como subentidad. En ese caso se heredan los atributos de la superentidad También se suele evitar este hecho de heredar los atributos en el caso de que haya subentidades que no están asociadas a ninguna superentidad. En este caso se generaría
- 58. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [57] una tabla para la superentidad y no se heredan los atributos, sólo se copia la clave de la superentidad en las subentidades. [4.3.5] notas finales El modelo conceptual entidad/relación es el verdadero mapa de la base de datos. Hay aspectos que no se reflejan al instante, por ejemplo el hecho de si la cardinalidad mínima es 0 o uno, o la obligatoriedad en una relación,.... Son aspectos a tener en cuenta en el siguiente modelo (en el interno) al crear por ejemplo índices y restricciones. Por ello ese modelo es la referencia obligada de los profesionales de la base de datos (en especial de los administradores) y su contenido no se debe ignorar al convertirle a la forma relacional. [4.4] representación de esquemas de bases de datos relacionales En el tema 3, ya vimos como eran los esquemas relacionales. Ejemplo: PIEZA(Tipo, Modelo, Nombre, Apellido1, Apellido2) EMPRESA(CIF, Cod_Empresa, Nombre, Dirección) SUMINISTROS(Tipo,Modelo, Cod_Empresa, Precio) EXISTENCIAS(Tipo, Modelo, N_Almacen, Cantidad) En ese tipo de esquemas es difícil ver las relaciones en los datos, algo que sí se ve muy bien en los esquemas entidad relación. Por ello se suelen complementar los esquemas clásicos con líneas y diagramas que representan esa información. [4.4.1] Grafos relacionales Es un esquema relacional en el que hay líneas que enlazan las claves principales con las claves secundarias para representar mejor las relaciones. A veces se representa en forma de nodos de grafos y otras se complementa el clásico. Ejemplo:
- 59. Sistemas Gestores de Bases de Datos diseño de bases de datos relacionales [58] [4.4.2] Esquemas relacionales derivados del modelo entidad/relación Hay quien los llama esquemas entidad/relación relacionales. De hecho es una mezcla entre los esquemas relacionales y los entidad/relación. Hoy en día se utiliza mucho, en especial por las herramientas CASE de creación de diseños de bases de datos. Las tablas se representan en forma de rectángulo que contiene una fila por cada atributo y una fila inicial para la cabecera en la que aparece el nombre de la tabla. Después aparecen líneas que muestran la relación entre las claves y su cardinalidad. Uno de los más utilizados actualmente es éste: cif asistir telefono direccion localidad provincia nmr o be empresas tipo modelo precio venta _ piezas cif tipo modelo precio compra _ suministros cantidad modelo n_almacen tipo existencias Las cardinalidades se pueden mostrar en otros formatos, pero siempre se mostrarán en este tipo de esquemas. Se ha hecho muy popular la forma de presentar esquemas relacionales del programa Microsoft Access. Ejemplo: www.elsolucionario.org
- 60. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [59] Es una forma muy clara de representar relaciones y cardinalidades. [4.5] normalización [4.5.1] problemas del esquema relacional Una vez obtenido el esquema relacional resultante del esquema entidad/relación que representa la base de datos, normalmente tendremos una buena base de datos. Pero otras veces, debido a fallos en el diseño o a problemas indetectables, tendremos un esquema que puede producir una base de datos que incorpore estos problemas: Å Redundancia. Se llama así a los datos que se repiten continua e innecesariamente por las tablas de las bases de datos. Cuando es excesiva es evidente que el diseño hay que revisarlo, es el primer síntoma de problemas y se detecta fácilmente. Å Ambigüedades. Datos que no clarifican suficientemente el registro al que representan. Los datos de cada registro podrían referirse a más de un registro o incluso puede ser imposible saber a qué ejemplar exactamente se están refiriendo. Es un problema muy grave y difícil de detectar. Å Pérdida de restricciones de integridad. Normalmente debido a dependencias funcionales. Más adelante se explica este problema. Se arreglan fácilmente siguiendo una serie de pasos concretos. Å Anomalías en operaciones de modificación de datos. El hecho de que al insertar un solo elemento haya que repetir tuplas en una tabla para variar unos pocos datos. O que eliminar un elemento suponga eliminar varias tuplas necesariamente (por ejemplo que eliminar un cliente suponga borrar seis o siete filas de la tabla de clientes, sería un error muy grave y por lo tanto un diseño terrible). El principio fundamental reside en que las tablas deben referirse a objetos o situaciones muy concretas, relacionados exactamente con elementos reconocibles por el sistema de información de forma inequívoca. Cada fila de una tabla representa inequívocamente un elemento reconocible en el sistema. Lo que ocurre es que conceptualmente es difícil agrupar esos elementos correctamente.
- 61. Sistemas Gestores de Bases de Datos diseño de bases de datos relacionales [60] En cualquier caso la mayor parte de problemas se agravan si no se sigue un modelo conceptual y se decide crear directamente el esquema relacional. En ese caso el diseño tiene una garantía casi asegurada de funcionar mal. Cuando aparecen los problemas enumerados entonces se les puede resolver usando reglas de normalización. Estas reglas suelen forzar la división de una tabla en dos o más tablas para arreglar ese problema. [4.5.2] formas normales Las formas normales se corresponde a una teoría de normalización iniciada por el propio Codd y continuada por otros autores (entre los que destacan Boyce y Fagin). Codd definió en 1970 la primera forma normal, desde ese momento aparecieron la segunda, tercera, la Boyce-Codd, la cuarta y la quinta forma normal. Una tabla puede encontrarse en primera forma normal y no en segunda forma normal, pero no al contrario. Es decir los números altos de formas normales son más restrictivos (la quinta forma normal cumple todas las anteriores). La teoría de formas normales es una teoría absolutamente matemática, pero en el presente manual se describen de forma más intuitiva. Hay que tener en cuenta que muchos diseñadores opinan que basta con llegar a la forma Boyce-Codd, ya que la cuarta, y sobre todo la quinta, forma normal es polémica. Hay quien opina que hay bases de datos peores en quinta forma normal que en tercera. En cualquier caso debería ser obligatorio para cualquier diseñador llegar hasta la forma normal de Boyce-Codd. [4.5.3] primera forma normal (1FN) Es una forma normal inherente al esquema relacional. Es decir toda tabla realmente relacional la cumple. Se dice que una tabla se encuentra en primera forma normal si impide que un atributo de una tupla pueda tomar más de un valor. La tabla: TRABAJADOR DNI Nombre Departamento 12121212A Andrés Mantenimiento 12345345G Andrea Dirección Gestión Visualmente es un tabla, pero no una tabla relacional (lo que en terminología de bases de datos relacionales se llama relación). No cumple la primera forma normal. Lo cumpliría si: TRABAJADOR DNI Nombre Departamento 12121212A Andrés Mantenimiento 12345345G Andrea Dirección 12345345G Andrea Gestión Esa tabla sí esta en primera forma normal.
- 62. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [61] [4.5.4] dependencias funcionales Se dice que un conjunto de atributos (Y) depende funcionalmente de otro conjunto de atributos (X) si para cada valor de X hay un único valor posible para Y. Simbólicamente se denota por X→Y. Por ejemplo el nombre de una persona depende funcionalmente del DNI, para un DNI concreto sólo hay un nombre posible. En la tabla ejemplo anterior, el departamento no tiene dependencia funcional, ya que para un mismo DNI puede haber más de un departamento posible. Pero el nombre sí que depende del DNI. Al conjunto X del que depende funcionalmente el conjunto Y se le llama determinante. Al conjunto Y se le llama implicado. dependencia funcional completa Un conjunto de atributos (Y) tiene una dependencia funcional completa sobre otro conjunto de atributos (X) si Y tiene dependencia funcional de X y además no se puede obtener de X un conjunto de atributos más pequeño que consiga una dependencia funcional de Y (es decir, no hay en X un determinante formado por atributos más pequeños). Por ejemplo en una tabla de clientes, el conjunto de atributos formado por el nombre y el dni producen una dependencia funcional sobre el atributo apellidos. Pero no es plena ya que el dni sólo también produce una dependencia funcional sobre apellidos. El dni sí produce una dependencia funcional completa sobre el campo apellidos. Una dependencia funcional completa se denota como X⇒Y dependencia funcional elemental Se produce cuando X e Y forman una dependencia funcional completa y además Y es un único atributo. dependencia funcional transitiva Es más compleja de explicar, pero tiene también utilidad. Se produce cuando tenemos tres conjuntos de atributos X, Y y Z. Y depende funcionalmente de X (X→Y), Z depende funcionalmente de Y (Y→Z). Además X no depende funcionalmente de Y (Y-/→X). Entonces ocurre que X produce una dependencia funcional transitiva sobre Z. Esto se denota como: (X⎯ →Z) Por ejemplo si X es el atributo Número de Clase de un instituto, e Y es el atributo Código Tutor. Entonces X→Y (el tutor depende funcionalmente del número de clase). Si Z representa el Código del departamento, entonces Y→Z (el código del departamento depende funcionalmente del código tutor, cada tutor sólo puede estar en un departamento). Como ocurre que Y-/→X (el código de la clase no depende funcionalmente del código tutor, un código tutor se puede corresponder con varios códigos de clase). Entonces X⎯ →Z (el código del departamento depende transitivamente del código de la clase). [4.5.5] segunda forma normal (2FN) Ocurre si una tabla está en primera forma normal y además cada atributo que no sea clave, depende de forma funcional completa respecto de cualquiera de las claves. Toda www.elsolucionario.org
- 63. Sistemas Gestores de Bases de Datos diseño de bases de datos relacionales [62] la clave principal debe hacer dependientes al resto de atributos, si hay atributos que depende sólo de parte de la clave, entonces esa parte de la clave y esos atributos formarán otra tabla. Ejemplo: ALUMNOS DNI Cod Curso Nombre Apellido1 Nota 12121219A 34 Pedro Valiente 9 12121219A 25 Pedro Valiente 8 3457775G 34 Ana Fernández 6 5674378J 25 Sara Crespo 7 5674378J 34 Sara Crespo 6 Suponiendo que el DNI y el código de curso formen una clave principal para esta tabla, sólo la nota tiene dependencia funcional completa. El nombre y los apellidos dependen de forma completa del DNI. La tabla no es 2FN, para arreglarlo: ALUMNOS DNI Nombre Apellido1 12121219A Pedro Valiente 3457775G Ana Fernández 5674378J Sara Crespo ASISTENCIA DNI Cod Curso Nota 12121219A 34 9 12121219A 25 8 3457775G 34 6 5674378J 25 7 5674378J 34 6 [4.5.6] tercera forma normal (3FN) Ocurre cuando una tabla está en 2FN y además ningún atributo que no sea clave depende transitivamente de las claves de la tabla. Es decir no ocurre cuando algún atributo depende funcionalmente de atributos que no son clave.
- 64. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [63] Ejemplo: ALUMNOS DNI Nombre Apellido1 Cod Provincia Provincia 12121349A Salvador Velasco 34 Palencia 12121219A Pedro Valiente 34 Palencia 3457775G Ana Fernández 47 Valladolid 5674378J Sara Crespo 47 Valladolid 3456858S Marina Serrat 08 Barcelona La Provincia depende funcionalmente del código de provincia, lo que hace que no esté en 3FN. El arreglo sería: ALUMNOS DNI Nombre Apellido1 Cod Provincia 12121349A Salvador Velasco 34 12121219A Pedro Valiente 34 3457775G Ana Fernández 47 5674378J Sara Crespo 47 3456858S Marina Serrat 08 PROVINCIA Cod Provincia Provincia 34 Palencia 47 Valladolid 08 Barcelona [4.5.7] forma normal de Boyce-Codd (FNBC o BCFN) Ocurre si una tabla está en tercera forma normal y además todo determinante es una clave candidata. Ejemplo: TUTORÍAS DNI Asignatura Tutor 12121219A Lenguaje Eva 12121219A Matemáticas Andrés 3457775G Lenguaje Eva 5674378J Matemáticas Guillermo 5674378J Lenguaje Julia 5634823H Matemáticas Guillermo Esa tabla está en tercera forma normal (no hay dependencias transitivas), pero no en forma de Boyce - Codd, ya que (DNI, Asignatura) →Tutor y Tutor→Asignatura. En
- 65. Sistemas Gestores de Bases de Datos diseño de bases de datos relacionales [64] este caso la redundancia ocurre por mala selección de clave. La redundancia de la asignatura es completamente evitable. La solución sería: TUTORÍAS DNI Tutor 12121219A Eva 12121219A Andrés 3457775G Eva 5674378J Guillermo 5674378J Julia 5634823H Guillermo ASIGNATURASTUTOR Asignatura Tutor Lenguaje Eva Matemáticas Andrés Matemáticas Guillermo Lenguaje Julia En las formas de Boyce-Codd hay que tener cuidado al descomponer ya que se podría perder información por una mala descomposición [4.5.8] cuarta forma normal (4FN). dependencias multivaluadas dependencia multivaluada Para el resto de formas normales (las diseñadas por Fagin, mucho más complejas), es importante definir este tipo de dependencia, que es distinta de las funcionales. Si las funcionales eran la base de la segunda y tercera forma normal (y de la de Boyce-Codd), éstas son la base de la cuarta forma normal. Una dependencia multivaluada de una tabla con atributos X, Y, Z de X sobre Z (es decir X->>Z) ocurre cuando los posibles valores de Y sobre cualquier par de valores X y Z dependen sólo del valor de X y son independientes de Z. Se refiere a posibles valores (en plural) y se trata de que los valores de ese atributo siempre son los mismos según el valor de un atributo y no del otro. www.elsolucionario.org
- 66. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [65] Ejemplo: Nº Curso Profesor Material 17 Eva 1 17 Eva 2 17 Julia 1 17 Julia 2 25 Eva 1 25 Eva 2 25 Eva 3 La tabla cursos, profesores y materiales del curso. La tabla está en FNBC ya que no hay dependencias transitivas y todos los atributos son clave sin dependencia funcional hacia ellos. Sin embargo hay redundancia. Los materiales se van a repetir para cualquier profesor dando cualquier curso, ya que los profesores van a utilizar todos los materiales del curso (de no ser así no habría ninguna redundancia). Los materiales del curso dependen del curso y no del profesor en una dependencia multivaluada (no hay dependencia funcional ya que los posibles valores son varios). Para el par Nº de curso y profesor podemos saber los materiales; pero lo sabemos por el curso y no por el profesor. cuarta forma normal Ocurre esta forma normal cuando una tabla está en forma normal de Boyce Codd y toda dependencia multivaluada es una dependencia funcional. Para la tabla anterior la solución serían dos tablas: Nº Curso Material 17 1 17 2 25 1 25 2 25 3 Nº Curso Profesor 17 Eva 17 Julia 25 Eva Un teorema de Fagin indica cuando hay tres pares de conjuntos de atributos X, Y y Z si ocurre X->>Y|Z (Y y Z tienen dependencia multivaluada sobre X), entonces las tablas X,Y y º reproducen sin perder información lo que poseía la tabla original. Este teorema marca la forma de dividir las tablas hacia una 4FN
- 67. Sistemas Gestores de Bases de Datos diseño de bases de datos relacionales [66] [4.5.9] quinta forma normal (5FN) dependencias de JOIN o de unión Una proyección de una tabla es la tabla resultante de tomar un subconjunto de los atributos de una tabla (se trata de la operación proyección, Π, del álgebra relacional). Se dice que se tiene una tabla con dependencia de tipo JOIN si se puede obtener esa tabla como resultado de combinar (mediante la operación JOIN del álgebra relacional) varias proyecciones de la misma. quinta forma normal Ocurre cuando está en 4FN y además no hay proyecciones que combinadas formen la tabla original. Es la más compleja y polémica de todas. Polémica pues no está claro en muchas ocasiones que sea una solución mejor sacar las proyecciones de la tabla. Fue definida también por Fagin. Es raro encontrarse este tipo de problemas cuando la normalización llega a 4FN. Se deben a restricciones muy concretas. Ejemplo: Proveedor Material Proyecto 1 1 2 1 2 1 2 1 1 1 1 1 Indican códigos de material suministrado por un proveedor y utilizado en un determinado proyecto. Si ocurre una restricción especial como por ejemplo: Cuando un proveedor nos ha suministrado alguna vez un determinado material, si ese material aparece en otro proyecto, haremos que el proveedor nos suministre también ese material para ese proyecto. Eso ocurre en los datos como el proveedor número 1 nos suministró el material número 1 para el proyecto 2 y en el proyecto 1 utilizamos el material 1, aparecerá la tupla proveedor 1, material 1 y proyecto 1. La dependencia que produce esta restricción es lejana y se la llama de reunión. Para esa restricción esta división en tablas sería válida: Proveedor Material 1 1 1 2 2 1 Material Proyecto 1 2 2 1 1 1
- 68. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [67] Esa descomposición no pierde valores en este caso, sabiendo que si el proveedor nos suministra un material podremos relacionarle con todos los proyectos que utilizan ese material. Resumiendo, una tabla no está en quinta forma normal si hay una descomposición de esa tabla que muestre la misma información que la original. Normalmente se crean tablas en quinta forma normal cuando en la misma tabla hay muchos atributos y es casi inmanejable o cuando hay muchos registros y pocos atributos. En el caso de que haya muchos atributos se divide la tabla en dos donde la clave es la misma en ambas tablas. www.elsolucionario.org
- 70. [69] [Unidad 5] el lenguaje SQL (y Oracle SQL) notas previas versión de SQL Aunque este tema sirven como guía de uso de SQL, en estos apuntes sobre todo se escenifica el SQL del programa comercial Oracle. Normalmente se indican las diferencias entre Oracle y SQL estándar, pero todos los ejemplos han sido pensados para utilizarse en Oracle. La razón de utilizar Oracle como base de trabajo se debe a su respeto por SQL estándar (hasta cierto punto) y por ser el SGBD de referencia en el mundo desde hace ya muchos años. formato de las instrucciones en los apuntes En este manual en muchos apartados se indica sintaxis de comandos. Esta sintaxis sirve para aprender a utilizar el comando, e indica la forma de escribir dicho comando en el programa utilizado para escribir SQL. En el presente manual la sintaxis de los comandos se escribe en párrafos sombreados de azul celeste con el reborde en azul oscuro.
- 71. Sistemas Gestores de Bases de Datos el lenguaje SQL [70] Ejemplo: SELECT * | {[DISTINCT] columna | expresión [alias], ...} FROM tabla; Otras veces se describen códigos de ejemplo de un comando. Los ejemplos se escriben también con fondo celeste, pero sin el reborde. Ejemplo: SELECT nombre FROM cliente; Los ejemplos sirven para escenificar una instrucción concreta, la sintaxis se utiliza para indicar las forma de utilizar un comando. Para indicar la sintaxis de un comando se usan símbolos especiales. Los símbolos que utiliza este libro (de acuerdo con la sintaxis que se utiliza normalmente en cualquier documentación de este tipo) son: Å PALABRA Cuando en la sintaxis se utiliza una palabra en negrita, significa que es un comando que hay que escribir literalmente. Å texto El texto que aparece en cursiva sirve para indicar que no hay que escribirle literalmente, sino que se refiere a un tipo de elemento que se puede utilizar en el comando. Ejemplo: SELECT columna FROM tabla; El texto columna hay que cambiarlo por un nombre concreto de columna (nombre, apellidos,...) , al igual que tabla se refiere a un nombre de tabla concreto. Å [] (corchetes). Los corchetes sirven para encerrar texto que no es obligatorio en el comando, es decir para indicar una parte opcional. Å | (barra vertical). Este símbolo (|) , la barra vertical, indica opción, es decir que se puede elegir entre varias opciones Å ... (puntos suspensivos) Indica que se puede repetir el texto anterior en el comando continuamente (significaría, y así sucesivamente) Å {} (llaves) Las llaves sirven para indicar opciones mutuamente exclusivas pero obligatorias. Es decir, opciones de las que sólo se puede elegir una opción, pero de las que es obligado elegir una. Ejemplo: SELECT { * | columna | expresión } FROM tabla; El ejemplo anterior indicaría que se debe elegir obligatoriamente el asterisco o un nombre de columna o una expresión. Si las llaves del ejemplo fueran corchetes, entonces indicarían que incluso podría no aparecer ninguna opción. www.elsolucionario.org
- 72. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [71] [5.1] características y conceptos básicos [5.1.1] Historia del lenguaje SQL El nacimiento del lenguaje SQL data de 1970 cuando E. F. Codd publica su libro: "Un modelo de datos relacional para grandes bancos de datos compartidos". Ese libro dictaría las direcrices de las bases de datos relacionales. Apenas dos años después IBM (para quien trabajaba Codd) utiliza las directrices de Codd para crear el Standard English Query Language (Lenguaje Estándar Inglés para Consultas) al que se le llamó SEQUEL. Más adelante se le asignaron las siglas SQL (Standard Query Language, lenguaje estándar de consulta) aunque en inglés se siguen pronunciando SEQUEL. En español se le llama esecuele. Poco después se convertía en un estándar en el mundo de las bases de datos avalado por los organismos ISO y ANSI (el primer estándar es del año 1982). Aún hoy sigue siendo uno de los estándares más importantes de la industria informática. Los estándares más seguidos son los de los años 1992 y 1999 (el último estándar). Sobre estos dos estándares giran estos apuntes. [5.1.2] objetivos SQL pretende ser un lenguaje que simula su escritura en lenguaje normal. De ahí que se le considere un lenguaje de cuarta generación. Consta de palabras especiales y de expresiones. Se trata de un lenguaje que intenta agrupar todas las funciones que se le pueden pedir a una base de datos [5.2] modos de utilización [5.2.1] ejecución directa. SQL interactivo Las instrucciones SQL se introducen a través de una herramienta que las traduce inmediatamente a la base de datos, por lo que se ejecutan al instante. [5.2.2] ejecución incrustada o embebida Las instrucciones SQL se colocan como parte del código de otro lenguaje anfitrión (C, Java, Pascal, Visual Basic,...). Estas instrucciones están separadas del resto del código de forma conveniente. Al compilar el código se utiliza un precompilador de la propia base de datos para traducir el SQL.
- 73. Sistemas Gestores de Bases de Datos el lenguaje SQL [72] [5.2.3] ejecución dinámica Se trata de SQL incrustado en módulos especiales que pueden ser invocados una y otra vez desde distintas aplicaciones. [5.3] elementos del lenguaje SQL [5.3.1] código SQL El código SQL consta de los siguientes elementos: Å Comandos. Las distintas instrucciones que se pueden realizar desde SQL ² SELECT. Se trata del comando que permite realizar consultas sobre los datos de la base de datos. Obtiene datos de la base de datos. ² DML, Data Manipulation Language (Lenguaje de manipulación de datos). Modifica filas (registros) de la base de datos. Lo forman las instrucciones INSERT, UPDATE, MERGE y DELETE. ² DDL, Data Definition Language (Lenguaje de definición de datos). Permiten modificar la estructura de las tablas de la base de datos. Lo forman las instrucciones CREATE, ALTER, DROP, RENAME y TRUNCATE. ² Instrucciones de transferencia. Administran las modificaciones creadas por las instrucciones DML. Lo forman las instrucciones ROLLBACK, COMMIT y SAVEPOINT ² DCL, Data Control Language (Lenguaje de control de datos). Administran los derechos y restricciones de los usuarios. Lo forman las instrucciones GRANT y REVOKE. Å Cláusulas. Son palabras especiales que permiten modificar el funcionamiento de un comando (WHERE, ORDER BY,...) Å Operadores. Permiten crear expresiones complejas. Pueden ser aritméticos (+,- ,*,/,...) lógicos (>, <, !=,<>, AND, OR,...) Å Funciones. Para conseguir valores complejos (SUM(), DATE(),...) Å Constantes. Valores literales para las consultas, números, textos, caracteres,... Å Datos. Obtenidos de la propia base de datos [5.3.2] normas de escritura Å En SQL no se distingue entre mayúsculas y minúsculas. Da lo mismo como se escriba. Å El final de una instrucción lo determina el signo del punto y coma
- 74. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [73] Å Los comandos SQL (SELECT, INSERT,...) pueden ser partidos por espacios o saltos de línea antes de finalizar la instrucción Å Se pueden tabular líneas para facilitar la lectura si fuera necesario Å Los comentarios en el código SQL comienzan por /* y terminan por */ (excepto en algunos SGBD) [5.4] DDL [5.4.1] introducción El DDL es la parte del lenguaje que realiza la función de definición de datos. Fundamentalmente se encarga de la creación de esquemas, tablas y vistas. Por ahora veremos como crear tablas. Cada usuario de una base de datos posee un esquema. El esquema suele tener el mismo nombre que el usuario y sirve para almacenar los objetos de esquema, es decir los objetos que posee el usuario. Esos objetos pueden ser: tablas, vistas, índices y otras objetos relacionados con la definición de la base de datos. Los objetos son manipulados y creados por los usuarios. En principio sólo los administradores y los usuarios propietarios pueden acceder a cada objeto, salvo que se modifiquen los privilegios del objeto para permitir el acceso a otros usuarios. Hay que tener en cuenta que ninguna instrucción DDL puede ser anulada por una instrucción ROLLBACK (la instrucción ROLLBACK está relacionada con el uso de transacciones que se comentarán más adelante) por lo que hay que tener mucha precaución a la hora de utilizarlas. Es decir, las instrucciones DDL son definitivas. [5.4.2] creación de bases de datos Esta es una tarea administrativa que se comentará más profundamente en otros temas. Por ahora sólo se comenta de forma simple. Crear la base de datos implica indicar los archivos y ubicaciones que se utilizarán para la misma, además de otras indicaciones técnicas y administrativas que no se comentarán en este tema. Lógicamente sólo es posible crear una base de datos si se tienen privilegios DBA (DataBase Administrator) o SYSDBA. El comando SQL de creación de una base de datos es CREATE DATABASE. Este comando crea una base de datos con el nombre que se indique. Ejemplo: CREATE DATABASE prueba; www.elsolucionario.org
- 75. Sistemas Gestores de Bases de Datos el lenguaje SQL [74] Pero normalmente se indican más parámetros. Ejemplo: CREATE DATABASE prueba LOGFILE prueba.log MAXLOGFILES 25 MAXINSTANCES 10 ARCHIVELOG CHARACTER SET WIN1214 NATIONAL CHARACTER SET UTF8 DATAFILE prueba1.dbf AUTOEXTEND ON MAXSIZE 500MB; [5.4.3] objetos de la base de datos Según los estándares actuales, una base de datos es un conjunto de objetos pensados para gestionar datos. Estos objetos están contenidos en esquemas, los esquemas suelen estar asociados al perfil de un usuario en particular. En el estándar SQL existe el concepto de catálogo que sirve para almacenar esquemas. Así el nombre completo de un objeto vendría dado por: catálogo.esquema.objeto Si no se indica el catálogo se toma el catálogo por defecto. Si no se indica el esquema se entiende que el objeto está en el esquema actual. [5.4.4] creación de tablas nombre de las tablas Deben cumplir las siguientes reglas (en algunos SGBD podrían cambiar): Å Deben comenzar con una letra Å No deben tener más de 30 caracteres Å Sólo se permiten utilizar letras del alfabeto (inglés), números o el signo de subrayado (también el signo $ y #, pero esos se utilizan de manera especial por lo que no son recomendados) Å No puede haber dos tablas con el mismo nombre para el mismo esquema (pueden coincidir los nombres si están en distintos esquemas) Å No puede coincidir con el nombre de una palabra reservada SQL (por ejemplo no se puede llamar SELECT a una tabla) Å En el caso de que el nombre tenga espacios en blanco o caracteres nacionales (permitido sólo en algunas bases de datos), entonces se suele entrecomillar (en Oracle con comillas dobles, en SQLServer con comillas simples). En el estándar SQL 99 (respetado por Oracle) se pueden utilizar comillas dobles al poner el nombre de la tabla a fin de hacerla sensible a las mayúsculas (se diferenciará entre “FACTURAS” y “Facturas”)
- 76. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [75] orden CREATE TABLE Es la orden SQL que permite crear una tabla. Por defecto será almacenada en el espacio y esquema del usuario que crea la tabla. Sintaxis: CREATE TABLE [esquema.] nombreDeTabla (nombreDeLaColumna1 tipoDeDatos [, ...]); Ejemplo: CREATE TABLE proveedores (nombre varchar(25)); Crea una tabla con un solo campo de tipo varchar. Sólo se podrá crear la tabla si el usuario posee los permisos necesarios para ello. Si la tabla pertenece a otro esquema (suponiendo que el usuario tenga permiso para grabar tablas en ese otro esquema), se antepone al nombre de la tabla , el nombre del esquema: CREATE TABLE otroUsuario.proveedores (nombre varchar2(25)); [5.4.5] consultar las tablas del usuario consultar el diccionario de datos Todas las bases de datos poseen un diccionario de datos que contiene la lista de tablas. En cada sistema de base de datos se accede a esos datos de una forma. En el caso de Oracle, hay una tabla en el diccionario de datos que se llama USER_TABLES y que contiene una lista de las tablas del usuario actual. Así para sacar una lista de las tablas, se usa: SELECT * FROM USER_TABLES; Hay diversas columnas que muestran datos sobre cada tabla, entre ellas la columna TABLES_NAME muestra el nombre de cada tabla del usuario; el resto muestra información sobre el almacenamiento de la tabla. La tabla ALL_TABLES mostrará una lista de todas las tablas accesibles por el usuario. Finalmente DBA_TABLES es una tabla que contiene todas las tablas del sistema; esto es accesible sólo por el usuario administrador (DBA). orden DESCRIBE El comando DESCRIBE, permite obtener la estructura de una tabla. Ejemplo: DESCRIBE existencias; Y aparecerán los campos de la tabla proveedores. Esta instrucción no es parte del SQL estándar, pero casi es considerada así ya que casi todos los SGBD la utilizan.
- 77. Sistemas Gestores de Bases de Datos el lenguaje SQL [76] El resultado de la orden anterior (en Oracle) sería: Nombre ¿Nulo? Tipo N_ALMACEN NOT NULL NUMBER(2) TIPO NOT NULL VARCHAR2(2) MODELO NOT NULL NUMBER(2) CANTIDAD NUMBER(7) [5.4.6] orden INSERT Permite añadir datos a las tablas. Más adelante se comenta de forma más detallada. Su sintaxis básica es: INSERT INTO tabla [(columna1 [, columna2...])] VALUES (valor1 [,valor2]); Indicando la tabla se añaden los datos que se especifiquen tras el apartado values en un nuevo registro. Los valores deben corresponderse con el orden de las columnas. Si no es así se puede indicar tras el nombre de la tabla y entre paréntesis. Ejemplo: INSERT INTO proveedores(nombre, CIF) VALUES (‘Adaja SA’,’14244223Y’); Si la inserción es correcta se nos indicarán las filas insertadas [5.4.7] borrar tablas La orden DROP TABLE seguida del nombre de una tabla, permite eliminar la tabla en cuestión. Al borrar una tabla: Å Desaparecen todos los datos Å Cualquier vista y sinónimo referente a la tabla seguirán existiendo, pero ya no funcionarán (conviene eliminarlos) Å Las transacciones pendientes son aceptadas (COMMIT), en aquellas bases de datos que tengan la posibilidad de utilizar transacciones. Å Lógicamente sólo se pueden eliminar las tablas sobre las que tenemos permiso de borrado. Normalmente, el borrado de una tabla es irreversible, y no hay ninguna petición de confirmación, por lo que conviene ser muy cuidadoso con esta operación. www.elsolucionario.org
- 78. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [77] [5.4.8] tipos de datos A la hora de crear tablas, hay que indicar el tipo de datos de cada campo. Para ello describimos la siguiente tabla: Descripción Tipos ANSI SQL SQL Server Oracle SQL Tipo MySQL Texto de anchura fija CHARACTER(n) CHAR(n) CHAR(n) CHAR(n) CHAR(n) Texto de anchura variable CHARACTER VARYING(n) CHAR VARYING(n) VARCHAR(n) VARCHAR2(n) VARCHAR(n) Texto de anchura fija para caracteres nacionales NATIONAL CHARACTER(n) NATIONAL CHAR(n) NCHAR(n) NCHAR(n) NCHAR(n) Texto de anchura variable para caracteres nacionales NATIONAL CHARACTER VARYING(n) NATIONAL CHAR VARYING(n) NCHAR VARYING(n) NVARCHAR(n) NVARCHAR2(n) Enteros INTEGER INT SMALLINT INT INT SMALL INT NUMBER(38) INT SMALL INT TINY INT Decimal de coma variable FLOAT(b) DOUBLE DOUBLE PRECISSION REAL FLOAT NUMBER FLOAT(m,d) DOUBLE(m,d) Decimal de coma fija NUMERIC(m,d) DECIMAL(m,d) NUMERIC(m,d) DECIMAL(m,d) NUMBER(m,d) DECIMAL(m,d) Fechas DATE DATE DATE Fecha y hora TIMESTAMP TIMESTAMP DATETIME SMALLDATETIME TIMESTAMP TIMESTAMP DATETIME TIME Intervalos INTERVAL INTERVAL YEAR
- 79. Sistemas Gestores de Bases de Datos el lenguaje SQL [78] Descripción Tipos ANSI SQL SQL Server Oracle SQL Tipo MySQL Lógicos BIT BINARY BIT BOOL Texto gran longitud CLOB TEXT y NTEXT LONG (en desuso) y CLOB TEXT, MEDIUM TEXT y LONG TEXT Binario de gran longitud BLOB IMAGE RAW, LONG RAW BLOB BLOB, MEDIUM BLOB y LONG BLOB textos Para los textos disponemos de los siguientes tipos (Oracle): Å VARCHAR . Para textos de longitud variable. Su tamaño depende de la base de datos (en Oracle es de 4000) Å CHAR. Para textos de longitud fija (en Oracle hasta 2000 caracteres). Å NCHAR. Para el almacenamiento de caracteres nacionales de texto fijo Å NVARCHAR. Para el almacenamiento de caracteres nacionales de longitud variable. En todos estos tipos se indican los tamaños entre paréntesis tras el nombre del tipo. Conviene poner suficiente espacio para almacenar los valores. En el caso de los VARCHAR, no se malgasta espacio por poner más espacio del deseado ya que si el texto es más pequeño que el tamaño indicado, el resto del espacio se ocupa. números Si son enteros se indican con INT (en Oracle es el tipo NUMBER seguido del tamaño) que equivale a los long del lenguaje C. Si son decimales se elige FLOAT o DOUBLE si se desea precisión doble. En Oracle es el tipo NUMBER a secas, seguido de dos números separados por comas. También existe la posibilidad de utilizar el tipo DECIMAL que representa decimales de longitud fija (gastan más espacio, pero son más precisos). En ese caso se indica el tamaño completo del número y el número de decimales. Por ejemplo, DECIMAL (8,3) indica que se representan números de ocho cifras de precisión y tres decimales. En Oracle se usa igual pero sustituyendo la palabra DECIMAL por la palabra NUMBER (NUMBER(8,3) por ejemplo). Las cifras de precisión incluyen los decimales, es decir para almacenar el número 64563,2345 se usaría NUMBER(9,4) (o DECIMAL(9,4)). tipos LONG y CLOB Se trata de la posibilidad de utilizar textos muy grandes (varias MB o incluso GB). Dependiendo de la base de datos son tipos LONG, LOB o CLOB (en Oracle CLOB). Pero el uso es el mismo. tipos BLOB y RAW Parecidos a los anteriores pero utilizados para almacenar datos binarios (imágenes, vídeo,...).
- 80. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [79] fechas y horas DATE El tipo DATE permite almacenar fechas. Las fechas se pueden escribir en formato día, mes y año entre comillas. El separador puede ser una barra de dividir, un guión y casi cualquier símbolo. Para almacenar la fecha actual la mayoría de bases de datos proporcionan funciones (como SYSDATE en Oracle) que devuelven ese valor. TIMESTAMP Es una extensión del anterior, almacena valores de día, mes y año, junto con hora, minuto y segundos (incluso con decimales). Con lo que representa un instante concreto en el tiempo. Un ejemplo de TIMESTAMP sería ‘2/2/2004 18:34:23,34521’. En este caso si el formato de fecha y hora del sistema está pensado para el idioma español, el separador decimal será la coma (y no el punto). intervalos Sirven para almacenar intervalos de tiempo (no fechas, sino una suma de elementos de tiempo). En el caso de Oracle son: INTERVAL YEAR TO MONTH Este tipo de datos almacena años y meses. Tras la palabra YEAR se puede indicar la precisión de los años (cifras del año), por defecto es de dos. Ejemplo: CREATE TABLE tiempos (meses INTERVAL YEAR(3) TO MONTH); INSERT INTO tiempos VALUES(’3-2’); En el ejemplo se inserta un registro que representa 3 años y dos meses. INTERVAL DAY TO SECOND Representa intervalos de tiempo que expresan días, horas, minutos y segundos. Se puede indicar la precisión tras el texto DAY y el número de decimales de los segundos tras el texto SECOND. Ejemplo: CREATE TABLE tiempos (dias INTERVAL DAY(3) TO SECOND(0)); INSERT INTO tiempos VALUES(’2 7:12:23’); [5.4.9] modificar tablas cambiar de nombre La orden RENAME permite el cambio de nombre de cualquier objeto. Sintaxis: RENAME nombreViejo TO nombreNuevo borrar contenido de tablas La orden TRUNCATE TABLE seguida del nombre de una tabla, hace que se elimine el contenido de la tabla, pero no la tabla en sí. Incluso borra del archivo de datos el espacio ocupado por la tabla. www.elsolucionario.org
- 81. Sistemas Gestores de Bases de Datos el lenguaje SQL [80] modificar tablas La versátil instrucción ALTER TABLE permite hacer cambios en la estructura de una tabla. añadir columnas ALTER TABLE nombreTabla ADD(nombreColumna TipoDatos [Propiedades][,columnaSiguiente tipoDatos [propiedades]...) Permite añadir nuevas columnas a la tabla. Se deben indicar su tipo de datos y sus propiedades si es necesario (al estilo de CREATE TABLE). Las nuevas columnas se añaden al final, no se puede indicar otra posición. Ejemplo: ALTER TABLE facturas ADD (fecha DATE) borrar columnas ALTER TABLE nombreTabla DROP(columna [,columnaSiguiente,...]); Elimina la columna indicada de manera irreversible e incluyendo los datos que contenía. No se puede eliminar la última columna (habrá que usar DROP TABLE). ALTER TABLE facturas DROP (fecha); modificar columna Permite cambiar el tipo de datos y propiedades de una determinada columna. Sintaxis: ALTER TABLE nombreTabla MODIFY(columna tipo [propiedades] [columnaSiguiente tipo [propiedades] ...] Los cambios que se permiten son (en Oracle): Å Incrementar precisión o anchura de los tipos de datos Å Sólo se puede reducir la anchura si la anchura máxima de un campo si esa columna posee nulos en todos los registros, o todos los valores so o no hay registros Å Se puede pasar de CHAR a VARCHAR y viceversa (si no se modifica la anchura) Å Se puede pasar de DATE a TIMESTAMP y viceversa Ejemplo: ALTER TABLE facturas MODIFY(fecha TIMESTAMP); renombrar columna Esto permite cambiar el nombre de una columna. Sintaxis ALTER TABLE nombreTabla RENAME COLUMN nombreAntiguo TO nombreNuevo Ejemplo:
- 82. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [81] ALTER TABLE facturas RENAME fecha TO fechaYhora; [5.4.10] valor por defecto A cada columna se le puede asignar un valor por defecto durante su creación mediante la propiedad DEFAULT. Se puede poner esta propiedad durante la creación o modificación de la tabla, añadiendo la palabra DEFAULT tras el tipo de datos del campo y colocando detrás el valor que se desea por defecto. Ejemplo: CREATE TABLE articulo (cod NUMBER(7), nombre VARCHAR2(25), precio NUMBER(11,2) DEFAULT 3.5); La palabra DEFAULT se puede añadir durante la creación o la modificación de la tabla (comando ALTER TABLE) [5.4.11] restricciones Una restricción es una condición de obligado cumplimiento para una o más columnas de la tabla. A cada restricción se le pone un nombre, en el caso de no poner un nombre (en las que eso sea posible) entonces el propio Oracle le coloca el nombre que es un mnemotécnico con el nombre de tabla, columna y tipo de restricción. Su sintaxis general es: {CREATE TABLE nombreTabla | ALTER TABLE nombreTabla {ADD | MODIFY}} (campo tipo [propiedades] [,...] CONSTRAINT nombreRestricción tipoRestricción (columnas) [,CONSTRAINT nombrerestricción tipoRestricción (columnas) ...) Las restricciones tienen un nombre, se puede hacer que sea Oracle el que les ponga nombre, pero entonces será críptico. Por eso es mejor ponerle uno mismo. Los nombres de restricción no se pueden repetir para el mismo esquema, por lo que es buena idea incluir de algún modo el nombre de la tabla, los campos involucrados y el tipo de restricción en el nombre de la misma. Por ejemplo pieza_id_pk podría indicar que el campo id de la tabla pieza tiene una clave principal (PRIMARY KEY). Oracle aconseja esta regla a la hora de poner nombre a las restricciones: Å Tres letras para el nombre de la tabla Å Carácter de subrayado Å Tres letras con la columna afectada por la restricción Å Carácter de subrayado Å Dos letras con la abreviatura del tipo de restricción. La abreviatura puede ser: ² NN. NOT NULL. ² PK. PRIMARY KEY
- 83. Sistemas Gestores de Bases de Datos el lenguaje SQL [82] ² UK. UNIQUE ² FK. FOREIGN KEY ² CK. CHECK (validación) Por ejemplo para hacer que la clave principal de la tabla Alumnos sea el código del alumno, el nombre de la restricción podría ser: alu_cod_pk prohibir nulos La restricción NOT NULL permite prohibir los nulos en una determinada tabla. Eso obliga a que la columna tenga que tener obligatoriamente un valor para que sea almacenado el registro. Se puede colocar durante la creación (o modificación) del campo añadiendo la palabra NOT NULL tras el tipo: CREATE TABLE cliente(dni VARCHAR2(9) NOT NULL); En ese caso el nombre le coloca la propia base de datos (en el caso de Oracle el nombre sería algo como SY002341 por ejemplo). No es recomendable no poner nombre a las restricciones para controlarlas mejor. Para poner el nombre se usa: CREATE TABLE cliente(dni VARCHAR2(9) CONSTRAINT cli_dni_nn NOT NULL); La restricción NOT NULL es la única que sólo se puede poner seguida al nombre de la columna a la que se aplica (la razón es que NOT NULL sólo se puede aplicar a un campo a la vez) valores únicos Las restricciones de tipo UNIQUE obligan a que el contenido de una o más columnas no puedan repetir valores. Nuevamente hay dos formas de colocar esta restricción: CREATE TABLE cliente(dni VARCHAR2(9) UNIQUE); En ese caso el nombre de la restricción la coloca el sistema Oracle. Otra forma es: CREATE TABLE cliente(dni VARCHAR2(9) CONSTRAINT dni_u UNIQUE); Esta forma permite poner un nombre a la restricción. Si la repetición de valores se refiere a varios campos, la forma sería: CREATE TABLE alquiler(dni VARCHAR2(9), cod_pelicula NUMBER(5), CONSTRAINT alquiler_uk UNIQUE(dni,cod_pelicula) ; La coma tras la definición del campo cod_pelicula hace que la restricción sea independiente de ese campo. Eso obliga a que, tras UNIQUE se indique la lista de www.elsolucionario.org
- 84. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [83] campos. Incluso para un solo campo se puede colocar la restricción al final de la lista en lugar de definirlo a continuación del nombre y tipo de la columna. Las claves candidatas deben llevar restricciones UNIQUE y NOT NULL clave primaria La clave primaria de una tabla la forman las columnas que indican a cada registro de la misma. La clave primaria hace que los campos que la forman sean NOT NULL (sin posibilidad de quedar vacíos) y que los valores de los campos sean de tipo UNIQUE (sin posibilidad de repetición). Si la clave está formada por un solo campo basta con: CREATE TABLE cliente( dni VARCHAR2(9) PRIMARY KEY, nombre VARCHAR(50)) ; O, poniendo un nombre a la restricción: CREATE TABLE cliente( dni VARCHAR2(9) CONSTRAINT cliente_pk PRIMARY KEY, nombre VARCHAR(50)) ; Si la clave está formada por más de un campo: CREATE TABLE alquiler(dni VARCHAR2(9), cod_pelicula NUMBER(5), CONSTRAINT alquiler_pk PRIMARY KEY(dni,cod_pelicula) ; clave secundaria o foránea Una clave secundaria o foránea, es uno o más campos de una tabla que están relacionados con la clave principal (o incluso con una clave candidata) de otra tabla. La forma de indicar una clave foránea es: CREATE TABLE alquiler( dni VARCHAR2(9) CONSTRAINT dni_fk REFERENCES clientes(dni), cod_pelicula NUMBER(5) CONSTRAINT pelicula_fk REFERENCES peliculas(cod), CONSTRAINT alquiler_pk PRIMARY KEY(dni,cod_pelicula) ); Significa esta instrucción (en cuanto a claves foráneas) que el campo dni se relaciona con la columna dni de la tabla clientes.
- 85. Sistemas Gestores de Bases de Datos el lenguaje SQL [84] Si el campo al que se hace referencia es la clave principal, se puede obviar el nombre del campo: CREATE TABLE alquiler( dni VARCHAR2(9) CONSTRAINT dni_fk REFERENCES clientes, cod_pelicula NUMBER(5) CONSTRAINT pelicula_fk REFERENCES peliculas, CONSTRAINT alquiler_pk PRIMARY KEY(dni,cod_pelicula) ); En este caso se entiende que los campos hacen referencia a las claves principales de las tablas referenciadas (si la relación la forma más un campo, el orden de los campos debe de ser el mismo). Esto forma una relación entre dichas tablas, que además obliga al cumplimiento de la integridad referencial. Esta integridad obliga a que cualquier dni incluido en la tabla alquiler tenga que estar obligatoriamente en la tabla de clientes. De no ser así el registro no será insertado en la tabla (ocurrirá un error). Otra forma de crear claves foráneas (útil para claves formadas por más de un campo) es: CREATE TABLE existencias( tipo CHAR2(9), modelo NUMBER(3), n_almacen NUMBER(1) cantidad NUMBER(7), CONSTRAINT exi_t_m_fk FOREIGN KEY(tipo,modelo) REFERENCES piezas, CONSTRAINT exi_nal_fk FOREIGN KEY(n_almacen) REFERENCES almacenes, CONSTRAINT exi_pk PRIMARY KEY(tipo,modelo,n_almacen) ); Si la definición de clave secundaria se pone al final hace falta colocar el texto FOREIGN KEY para indicar en qué campos se coloca la restricción de clave foránea. En el ejemplo anterior es absolutamente necesario que forman la clave principal de la tabla piezas a la que hace referencia la clave sean tipo y modelo y en que estén en ese orden. La integridad referencial es una herramienta imprescindible de las bases de datos relacionales. Pero provoca varios problemas. Por ejemplo, si borramos un registro en la tabla principal que está relacionado con uno o varios de la secundaria ocurrirá un error, ya que de permitírsenos borrar el registro ocurrirá fallo de integridad (habrá claves secundarios refiriéndose a una clave principal que ya no existe). Por ello se nos pueden ofrecer soluciones a añadir tras la cláusula REFERENCES: Å ON DELETE SET NULL. Coloca nulos todas las claves secundarias relacionadas con la borrada. Å ON DELETE CASCADE. Borra todos los registros cuya clave secundaria es igual que la clave del registro borrado.
- 86. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [85] Å ON DELETE SET DEFAULT. Coloca en el registro relacionado el valor por defecto en la columna relacionada Å ON DELETE NOTHING. No hace nada. En esas cuatro cláusulas se podría sustituir la palabra DELETE por la palabra UPDATE, haciendo que el funcionamiento se refiera a cuando se modifica un registro de la tabla principal. En la base de datos Oracle sólo se permite utilizar ON DELETE SET NULL o ON DELETE CASCADE. La sintaxis completa para añadir claves foráneas es: CREATE TABLE tabla(lista_de_campos CONSTRAINT nombreRestriccion FOREIGN KEY (listaCampos) REFERENCES tabla(clavePrincipalRelacionada) [ON UPDATE {SET NULL | CASCADE}] ); Si es de un solo campo existe esta alternativa: CREATE TABLE tabla(lista_de_campos tipos propiedades, nombreCampoClaveSecundaria CONSTRAINT nombreRestriccion REFERENCES tabla(clavePrincipalRelacionada) [ON UPDATE {SET NULL | CASCADE}] ); Ejemplo (no válido para Oracle, por el uso de ON UPDATE): CREATE TABLE alquiler(dni VARCHAR2(9), cod_pelicula NUMBER(5), CONSTRAINT alquiler_pk PRIMARY KEY(dni,cod_pelicula), CONSTRAINT dni_fk FOREIGN KEY (dni) REFERENCES clientes(dni) ON DELETE SET NULL ON UPDATE CASCADE, CONSTRAINT pelicula_fk FOREIGN KEY (cod_pelicula) REFERENCES peliculas(cod) ON DELETE CASCADE ); www.elsolucionario.org
- 87. Sistemas Gestores de Bases de Datos el lenguaje SQL [86] restricciones de validación Son restricciones que dictan una condición que deben cumplir los contenidos de una columna. Una misma columna puede tener múltiples CHECKS en su definición (se pondrían varios CONSTRAINT seguidos, sin comas). Ejemplo: CREATE TABLE ingresos(cod NUMBER(5) PRIMARY KEY, concepto VARCHAR2(40) NOT NULL, importe NUMBER(11,2) CONSTRAINT importe_min CHECK (importe>0) CONSTRAINT importe_max CHECK (importe<8000) ); En este caso la CHECK prohíbe añadir datos cuyo importe no esté entre 0 y 8000 Para poder hacer referencia a otras columnas hay que construir la restricción de forma independiente a la columna (es decir al final de la tabla): CREATE TABLE ingresos(cod NUMBER(5) PRIMARY KEY, concepto VARCHAR2(40) NOT NULL, importe_max NUMBER(11,2), importe NUMBER(11,2), CONSTRAINT importe_maximo CHECK (importe<importe_max) ); añadir restricciones Es posible querer añadir restricciones tras haber creado la tabla. En ese caso se utiliza la siguiente sintaxis: ALTER TABLE tabla ADD [CONSTRAINT nombre] tipoDeRestricción(columnas); tipoRestricción es el texto CHECK, PRIMARY KEY o FOREIGN KEY. Las restricciones NOT NULL deben indicarse mediante ALTER TABLE .. MODIFY colocando NOT NULL en el campo que se modifica.
- 88. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [87] borrar restricciones Sintaxis: ALTER TABLE tabla DROP PRIMARY KEY | UNIQUE(campos) | CONSTRAINT nombreRestricción [CASCADE] La opción PRIMARY KEY elimina una clave principal (también quitará el índice UNIQUE sobre las campos que formaban la clave. UNIQUE elimina índices únicos. La opción CONSTRAINT elimina la restricción indicada. La opción CASCADE hace que se eliminen en cascada las restricciones de integridad que dependen de la restricción eliminada. Por ejemplo en: CREATE TABLE curso( cod_curso CHAR(7) PRIMARY KEY, fecha_inicio DATE, fecha_fin DATE, tItulo VARCHAR2(60), cod_siguientecurso CHAR(7), CONSTRAINT fecha_ck CHECK(fecha_fin>fecha_inicio), CONSTRAINT cod_ste_fk FOREIGN KEY(cod_siguientecurso) REFERENCES curso ON DELETE SET NULL); Tras esa definición de tabla, esta instrucción: ALTER TABLE curso DROP PRIMARY KEY; Produce este error (en la base de datos Oracle): ORA-02273: a esta clave única/primaria hacen referencia algunas claves ajenas Para ello habría que utilizar esta instrucción: ALTER TABLE curso DROP PRIMARY KEY CASCADE; Esa instrucción elimina la restricción de clave secundaria antes de eliminar la principal. También produce error esta instrucción: ALTER TABLE curso DROP(fecha_inicio); ERROR en línea 1: ORA-12991: se hace referencia a la columna en una restricción de multicolumna
- 89. Sistemas Gestores de Bases de Datos el lenguaje SQL [88] El error se debe a que no es posible borrar una columna que forma parte de la definición de una instrucción. La solución es utilizar CASCADE CONSTRAINT elimina las restricciones en las que la columna a borrar estaba implicada: ALTER TABLE curso DROP(fecha_inicio) CASCADE CONSTRAINTS; Esta instrucción elimina la restricción de tipo CHECK en la que aparecía la fecha_inicio y así se puede eliminar la columna. desactivar restricciones A veces conviene temporalmente desactivar una restricción para saltarse las reglas que impone. La sintaxis es: ALTER TABLE tabla DISABLE CONSTRAINT nombre [CASCADE] La opción CASCADE hace que se desactiven también las restricciones dependientes de la que se desactivó. activar restricciones Anula la desactivación. Formato: ALTER TABLE tabla ENABLE CONSTRAINT nombre [CASCADE] Sólo se permite volver a activar si los valores de la tabla cumplen la restricción que se activa. Si hubo desactivado en cascada, habrá que activar cada restricción individualmente. cambiar de nombre a las restricciones Para hacerlo se utiliza este comando: ALTER TABLE table RENAME CONSTRAINT nombreViejo TO nombreNuevo; mostrar restricciones El trabajo con restricciones ya se ha visto que es complejo. Por eso todas las bases de datos suelen proporcionar una vista (o más) del diccionario de datos que permite consultar las restricciones. En el caso de Oracle, se puede utilizar la vista del diccionario de datos USER_CONSTRAINTS. Esta vista permite identificar las restricciones colocadas por el usuario (ALL_CONSTRAINTS permite mostrar las restricciones de todos los usuarios, pero sólo está permitida a los administradores). En esa vista aparece toda la información que el diccionario de datos posee sobre las restricciones. En ella tenemos las siguientes columnas interesantes: Columna Tipo de datos Descripción OWNER VARCHAR2(20) Indica el nombre del usuario propietario de la tabla www.elsolucionario.org
- 90. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [89] Columna Tipo de datos Descripción CONSTRAINT_NAME VARCHAR2(30) Nombre de la restricción CONSTRAINT_TYPE VARCHAR2(1) Tipo de restricción: Å C. De tipo CHECK o NOT NULL Å P. PRIMARY KEY Å R. FOREIGN KEY Å U. UNIQUE TABLE_NAME VARCHAR2(30) Nombre de la tabla en la que se encuentra la restricción En el diccionario de datos hay otra vista que proporciona información sobre restricciones, se trata de USER_CONS_COLUMNS, en dicha tabla se muestra información sobre las columnas que participan en una restricción. Así si hemos definido una clave primaria formada por los campos uno y dos, en la tabla USER_CONS_COLUMNS aparecerán dos entradas, una para el primer campo del índice y otra para el segundo. Se indicará además el orden de aparición en la restricción. Ejemplo (resultado de la instrucción SELECT * FROM USER_CONS_COLUMNS): OWNER CONSTRAINT_NAME TABLE_NAME COLUMN_NAME POSITION JORGE EXIS_PK EXISTENCIAS TIPO 1 JORGE EXIS_PK EXISTENCIAS MODELO 2 JORGE EXIS_PK EXISTENCIAS N_ALMACEN 3 JORGE PIEZA_FK EXISTENCIAS TIPO 1 JORGE PIEZA_FK EXISTENCIAS MODELO 2 JORGE PIEZA_PK PIEZA TIPO 1 JORGE PIEZA_PK PIEZA MODELO 2 En esta tabla USER_CONS_COLUMNS aparece una restricción de clave primaria sobre la tabla existencias, esta clave está formada por las columnas (tipo, modelo y n_almacen) y en ese orden. Una segunda restricción llamada pieza_fk está compuesta por tipo y modelo de la tabla existencias. Finalmente la restricción pieza_pk está formada por tipo y modelo, columnas de la tabla pieza. Para saber de qué tipo son esas restricciones, habría que acudir a la vista USER_CONSTRAINTS.
- 91. Sistemas Gestores de Bases de Datos el lenguaje SQL [90] [5.5] DQL [5.5.1] capacidades DQL es la abreviatura del Data Query Language (lenguaje de consulta de datos) de SQL. El único comando que pertenece a este lenguaje es el versátil comando SELECT Este comando permite: Å Obtener datos de ciertas columnas de una tabla (proyección) Å Obtener registros (filas) de una tabla de acuerdo con ciertos criterios (selección) Å Mezclar datos de tablas diferentes (asociación, join) Å Realizar cálculos sobre los datos Å Agrupar datos [5.5.2] sintaxis sencilla del comando SELECT SELECT * | {[DISTINCT] columna | expresión [[AS] alias], ...} FROM tabla; Donde: Å *. El asterisco significa que se seleccionan todas las columnas Å DISTINCT. Hace que no se muestren los valores duplicados. Å columna. Es el nombre de una columna de la tabla que se desea mostrar Å expresión. Una expresión válida SQL Å alias. Es un nombre que se le da a la cabecera de la columna en el resultado de esta instrucción. Ejemplos: /* Selección de todos los registros de la tabla clientes */ SELECT * FROM Clientes; /* Selección de algunos campos*/ SELECT nombre, apellido1, apellido2 FROM Clientes; relación con el álgebra relacional El comando SELECT permite implementar de forma exacta todas las consultas del álgebra relación. En concreto la proyección se implementa así. Ejemplo: Πnombre, apellidos(Cliente)
- 92. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [91] La proyección anterior en SQL se escribe como: SELECT nombre, apellidos FROM Cliente; El renombrado es lo que permite realizar la cláusula AS, sólo que en SQL se utiliza exclusivamente para abreviar las referencias a una tabla. Ejemplo: SELECT c.nombre, c.apellidos, a.fecha FROM Clientes AS c, ALQUILERES AS a WHERE c.dni=a.dni; La palabra AS se puede obviar: SELECT c.nombre, c.apellidos, a.fecha FROM Clientes c, ALQUILERES a WHERE c.dni=a.dni; [5.5.3] cálculos aritméticos Los operadores + (suma), - (resta), * (multiplicación) y / (división), se pueden utilizar para hacer cálculos en las consultas. Cuando se utilizan como expresión en una consulta SELECT, no modifican los datos originales sino que como resultado de la vista generada por SELECT, aparece un nueva columna. Ejemplo: SELECT nombre, precio,precio*1.16 FROM articulos Esa consulta obtiene tres columnas. La tercera tendrá como nombre la expresión utilizada, para poner un alias basta utilizar dicho alias tras la expresión: SELECT nombre, precio, precio*1.16 AS precio_con_iva FROM articulos; La prioridad de esos operadores es la normal: tienen más prioridad la multiplicación y división, después la suma y la resta. En caso de igualdad de prioridad, se realiza primero la operación que esté más a la izquierda. Como es lógico se puede evitar cumplir esa prioridad usando paréntesis; el interior de los paréntesis es lo que se ejecuta primero. Cuando una expresión aritmética se calcula sobre valores NULL, el resultado de la expresión es siempre NULL. concatenación de textos Todas las bases de datos incluyen algún operador para encadenar textos. En SQLSERVER es el signo & en Oracle son los signos || Ejemplo (Oracle): SELECT tipo, modelo, tipo || '-' || modelo "Clave Pieza" FROM piezas; www.elsolucionario.org
- 93. Sistemas Gestores de Bases de Datos el lenguaje SQL [92] El resultado puede ser: TIPO MODELO Clave Pieza AR 6 AR-6 AR 7 AR-7 AR 8 AR-8 AR 9 AR-9 AR 12 AR-12 AR 15 AR-15 AR 20 AR-20 AR 21 AR-21 BI 10 BI-10 BI 20 BI-20 BI 38 BI-38 BI 57 BI-57 [5.5.4] condiciones Se pueden realizar consultas que restrinjan los datos de salida de las tablas. Para ello se utiliza la cláusula WHERE. Esta cláusula permite colocar una condición que han de cumplir todos los registros, los que no la cumplan no aparecen en el resultado. Ejemplo: SELECT Tipo, Modelo FROM Pieza WHERE Precio>3; relación con el álgebra relacional La cláusula WHERE es la encargada de implementar la operación de selección del álgebra relacional. Ejemplo: σnombre=”Pepe” ∧edad>25 (Cliente) Se corresponde con el SQL: SELECT * FROM Clientes WHERE nombre=’Pepe’ AND edad>25 operadores de comparación Se pueden utilizar en la cláusula WHERE, son: Operador Significado > Mayor que < Menor que >= Mayor o igual que <= Menor o igual que = Igual <> Distinto
- 94. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [93] Operador Significado != Distinto Se pueden utilizar tanto para comparar números como para comparar textos y fechas. En el caso de los textos, las comparaciones se hacen en orden alfabético. Sólo que es un orden alfabético estricto. Es decir el orden de los caracteres en la tabla de códigos. En muchas bases de datos hay problemas con la Ñ y otros símbolos nacionales. No obstante es un problema que tiende a arreglarse en la mayoría de aplicaciones. valores lógicos Son: Operador Significado AND Devuelve verdadero si las expresiones a su izquierda y derecha son ambas verdaderas OR Devuelve verdadero si cualquiera de las dos expresiones a izquierda y derecha del OR, son verdaderas NOT Invierte la lógica de la expresión que está a su derecha. Si era verdadera, mediante NOT pasa a ser falso. Ejemplos: /* Obtiene a las personas de entre 25 y 50 años*/ SELECT nombre,apellidos FROM personas WHERE edad>=25 AND edad<=50; /*Obtiene a la gente de más de 60 años o de menos de 20*/ SELECT nombre,apellidos FROM personas WHERE edad>60 OR edad<20; BETWEEN El operador BETWEEN nos permite obtener datos que se encuentren en un rango. Uso: SELECT tipo,modelo,precio FROM piezas WHERE precio BETWEEN 3 AND 8; Saca piezas cuyos precios estén entre 3 y 8 (ambos incluidos). IN Permite obtener registros cuyos valores estén en una lista: SELECT tipo,modelo,precio FROM piezas WHERE precio IN (3,5, 8); Obtiene piezas cuyos precios sea 3, 5 u 8, sólo uno de esos tres.
- 95. Sistemas Gestores de Bases de Datos el lenguaje SQL [94] LIKE Se usa sobre todo con textos, permite obtener registros cuyo valor en un campo cumpla una condición textual. LIKE utiliza una cadena que puede contener estos símbolos: Símbolo Significado % Una serie cualquiera de caracteres _ Un carácter cualquiera Ejemplos: /* Selecciona nombres que empiecen por S */ SELECT nombre FROM personas WHERE nombre LIKE 'A%'; /*Selecciona las personas cuyo apellido sea Sanchez, Senchez, Stnchez,...*/ SELECT apellido1 FROM Personas WHERE apellido1 LIKE 'S_nchez'; IS NULL Devuelve verdadero si una expresión contiene un nulo: SELECT nombre,apellidos FROM personas WHERE telefono IS NULL Esa instrucción selecciona a la gente que no tiene teléfono. Se puede usar la expresión IS NOT NULL que devuelve verdadero cuando una determinada columna no es nula Precedencia de operadores A veces las expresiones que se producen en los SELECT son muy extensas y es difícil saber que parte de la expresión se evalúa primero, por ello se indica la siguiente tabla de precedencia (tomada de Oracle): Orden de precedencia Operador 1 *(Multiplicar) / (dividir) 2 + (Suma) - (Resta) 3 || (Concatenación) 4 Comparaciones (>, <, !=, ...) 5 IS [NOT] NULL, [NOT ]LIKE, IN 6 NOT 7 AND 8 OR [5.5.5] ordenación El orden inicial de los registros obtenidos por un SELECT no guarda más que una relación respecto al orden en el que fueron introducidos. Para ordenar en base a criterios más interesantes, se utiliza la cláusula ORDER BY. www.elsolucionario.org
- 96. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [95] En esa cláusula se coloca una lista de campos que indica la forma de ordenar. Se ordena primero por el primer campo de la lista, si hay coincidencias por el segundo, si ahí también las hay por el tercero, y así sucesivamente. Se puede colocar las palabras ASC O DESC (por defecto se toma ASC). Esas palabras significan en ascendente (de la A a la Z, de los números pequeños a los grandes) o en descendente (de la Z a la a, de los números grandes a los pequeños) respectivamente. Sintaxis completa de SELECT: SELECT expresiones FROM tabla [WHERE condición] ORDER BY listaDeCamposOAlias; [5.5.6] funciones Todos los SGBD implementan funciones para facilitar la creación de consultas complejas. Esas funciones dependen del SGBD que utilicemos, las que aquí se comentan son algunas de las que se utilizan con Oracle. Todas las funciones reciben datos para poder operar (parámetros) y devuelven un resultado (que depende de los parámetros enviados a la función. Los argumentos se pasan entre paréntesis: nombreFunción[(parámetro1[, parámetro2,...])] Si una función no precisa parámetros (como SYSDATE) no hace falta colocar los paréntesis. En realidad hay dos tipos de funciones: Å Funciones que operan con datos de la misma fila Å Funciones que operan con datos de varias filas diferentes (funciones de agrupación). Sólo veremos las de primeras (más adelante se comentan las de varias filas). Nota: tabla DUAL (Oracle) Oracle proporciona una tabla llamada dual con la que se permiten hacer pruebas. Esa tabla tiene un solo campo (llamado DUMMY) y una sola fila de modo que es posible hacer pruebas. Por ejemplo la consulta: SELECT SQRT(5) FROM DUAL; Muestra una tabla con el contenido de ese cálculo (la raíz cuadrada de 5). DUAL es una tabla interesante para hacer pruebas.
- 97. Sistemas Gestores de Bases de Datos el lenguaje SQL [96] funciones de caracteres conversión del texto a mayúsculas y minúsculas Son: Función Descripción LOWER(texto) Convierte el texto a minúsculas (funciona con los caracteres españoles) UPPER(texto) Convierte el texto a mayúsculas INITCAP(texto) Coloca la primera letra de cada palabra en mayúsculas funciones de transformación Función Descripción RTRIM(texti) Elimina los espaciosa la derecha del texto LTRIM(texto) Elimina los espacios a la izquierda que posea el texto TRIM(texto) Elimina los espacios en blanco a la izquierda y la derecha del texto y los espacios dobles del interior. TRIM(caracteres FROM texto) Elimina del texto los caracteres indicados. Por ejemplo TRIM('h' FROM nombre) elimina las haches de la columna nombre que estén a la izquierda y a la derecha SUBSTR(texto,n[,m]) Obtiene los m siguientes caracteres del texto a partir de la posición n (si m no se indica se cogen desde n hasta el final). LENGTH(texto) Obtiene el tamaño del texto INSTR(texto, textoBuscado [,posInicial [, nAparición]]) Obtiene la posición en la que se encuentra el texto buscado en el texto inicial. Se puede empezar a buscar a partir de una posición inicial concreta e incluso indicar el número de aparición del texto buscado. Ejemplo, si buscamos la letra a y ponemos 2 en nAparición, devuelve la posición de la segunda letra a del texto). Si no lo encuentra devuelve 0 REPLACE(texto, textoABuscar, textoReemplazo) Buscar el texto a buscar en un determinado texto y lo cambia por el indicado como texto de reemplazo
- 98. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [97] funciones numéricas redondeos Función Descripción ROUND(n,decimales) Redondea el número al siguiente número con el número de decimales indicado más cercano. ROUND(8.239,2) devuelve 8.3 TRUNC(n,decimales) Los decimales del número se cortan para que sólo aparezca el número de decimales indicado matemáticas Función Descripción MOD(n1,n2) Devuelve el resto resultado de dividir n1 entre n2 POWER(valor,exponente) Eleva el valor al exponente indicado SQRT(n) Calcula la raíz cuadrada de n SIGN(n) Devuelve 1 si n es positivo, cero si vale cero y -1 si es negativo ABS(n) Calcula el valor absoluto de n EXP(n) Calcula en, es decir el exponente en base e del número n LN(n) Logaritmo neperiano de n LOG(n) Logaritmo en base 10 de n SIN(n) Calcula el seno de n (n tiene que estar en radianes) COS(n) Calcula el coseno de n (n tiene que estar en radianes) TAN(n) Calcula la tangente de n (n tiene que estar en radianes) ACOS(n) Devuelve en radianes el arcocoseno de n ASIN(n) Devuelve en radianes el arcoseno de n ATAN(n) Devuelve en radianes el arcotangente de n SINH(n) Devuelve el seno hiperbólico de n COSH(n) Devuelve el coseno hiperbólico de n TANH(n) Devuelve la tangente hiperbólica de n funciones de trabajo con nulos Permiten definir valores a utilizar en el caso de que las expresiones tomen el valor nulo. Función Descripción NVL(valor,sustituto) Si el valor es NULL, devuelve el valor sustituto; de otro modo, devuelve valor NVL2(valor,sustituto1, sustituto2) Variante de la anterior, devuelve el valor sustituto1 si valor no es nulo. Si valor es nulo devuelve el sustituto2 www.elsolucionario.org
- 99. Sistemas Gestores de Bases de Datos el lenguaje SQL [98] funciones de fecha y manejo de fechas Las fechas se utilizan muchísimo en todas las bases de datos. Oracle proporciona dos tipos de datos para manejar fechas, los tipos DATE y TIMESTAMP. En el primer caso se almacena una fecha concreta (que incluso puede contener la hora), en el segundo caso se almacena un instante de tiempo más concreto que puede incluir incluso fracciones de segundo. Hay que tener en cuenta que a los valores de tipo fecha se les pueden sumar números y se entendería que esta suma es de días. Si tiene decimales entonces se suman días, horas, minutos y segundos. La diferencia entre dos fechas también obtiene un número de días. intervalos Los intervalos son datos relacionados con las fechas en sí, pero que no son fechas. Hay dos tipos de intervalos el INTERVAL DAY TO SECOND que sirve para representar días, horas, minutos y segundos; y el INTERVAL YEAR TO MONTH que representa años y meses. Para los intervalos de año a mes los valores se pueden indicar de estas formas: /* 123 años y seis meses */ INTERVAL '123-6' YEAR(4) TO MONTH /* 123 años */ INTERVAL '123' YEAR(4) TO MONTH /* 6 meses */ INTERVAL '6' MONTH(3) TO MONTH La precisión en el caso de indicar tanto años como meses, se indica sólo en el año. En intervalos de días a segundos los intervalos se pueden indicar como: /* 4 días 10 horas 12 minutos y 7 con 352 segundos */ INTERVAL '4 10:12:7,352' DAY TO SECOND(3) /* 4 días 10 horas 12 minutos */ INTERVAL '4 10:12' DAY TO MINUTE /* 4 días 10 horas */ INTERVAL '4 10' DAY TO HOUR /* 4 días*/ INTERVAL '4' DAY /*10 horas*/ INTERVAL '10' HOUR /*25 horas*/ INTERVAL '253' HOUR /*12 minutos*/ INTERVAL '12' MINUTE /*30 segundos */ INTERVAL '30' SECOND /*8 horas y 50 minutos */ INTERVAL ('8:50') HOUR TO MINUTE;
- 100. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [99] /*7 minutos 6 segundos*/ INTERVAL ('7:06') MINUTE TO SECOND; /*8 horas 7 minutos 6 segundos*/ INTERVAL ('8:07:06') HOUR TO SECOND; Esos intervalos se pueden sumar a valores de tipo DATE o TIMESTAMP obtener la fecha y hora actual Función Descripción SYSDATE Obtiene la fecha y hora actuales SYSTIMESTAMP Obtiene la fecha y hora actuales en formato TIMESTAMP calcular fechas Función Descripción ADDMONTHS(fecha,n) Añade a la fecha el número de meses indicado por n MONTHS_BETWEEN(fecha1, fecha2) Obtiene la diferencia en meses entre las dos fechas (puede ser decimal) NEXT_DAY(fecha,día) Indica cual es el día que corresponde a añadir a la fecha el día indicado. El día puede ser el texto 'Lunes', 'Martes', 'Miércoles',... (si la configuración está en español) o el número de día de la semana (1=lunes, 2=martes,...) LAST_DAY(fecha) Obtiene el último día del mes al que pertenece la fecha. Devuelve un valor DATE EXTRACT(valor FROM fecha) Extrae un valor de una fecha concreta. El valor puede ser day (día), month (mes), year (año), etc. GREATEST(fecha1, fecha2,..) Devuelve la fecha más moderna la lista LEAST(fecha1, fecha2,..) Devuelve la fecha más antigua la lista ROUND(fecha [,'formato'] Redondea la fecha al valor de aplicar el formato a la fecha. El formato puede ser: 'YEAR' Hace que la fecha refleje el año completo 'MONTH' Hace que la fecha refleje el mes completo más cercano a la fecha 'HH24' Redondea la hora a las 00:00 más cercanas 'DAY’ Redondea al día más cercano TRUNC(fecha [formato]) Igual que el anterior pero trunca la fecha en lugar de redondearla.
- 101. Sistemas Gestores de Bases de Datos el lenguaje SQL [100] funciones de conversión Oracle es capaz de convertir datos automáticamente a fin de que la expresión final tenga sentido. En ese sentido son fáciles las conversiones de texto a número y viceversa. Ejemplo: SELECT 5+'3' FROM DUAL /*El resultado es 8 */ SELECT 5 || '3' FROM DUAL /* El resultado es 53 */ También ocurre eso con la conversión de textos a fechas. De hecho es forma habitual de asignar fechas. Pero en diversas ocasiones querremos realizar conversiones explícitas. TO_CHAR Obtiene un texto a partir de un número o una fecha. En especial se utiliza con fechas (ya que de número a texto se suele utilizar de forma implícita. fechas En el caso de las fechas se indica el formato de conversión, que es una cadena que puede incluir estos símbolos (en una cadena de texto): Símbolo Significado YY Año en formato de dos cifras YYYY Año en formato de cuatro cifras MM Mes en formato de dos cifras MON Las tres primeras letras del mes MONTH Nombre completo del mes DY Día de la semana en tres letras DAY Día completo de la semana DD Día en formato de dos cifras D Día de la semana (del 1 al 7) Q Semestre WW Semana del año D Día de la semana (del 1 al 7) DDD Día del año AM Indicador AM PM Indicador PM HH12 Hora de 1 a 12 HH24 Hora de 0 a 23 MI Minutos (0 a 59) SS Segundos (0 a 59) SSSS Segundos desde medianoche / . ,:;’ Posición de los separadores, donde se pongan estos símbolos aparecerán en el resultado www.elsolucionario.org
- 102. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [101] Ejemplos: SELECT TO_CHAR(SYSDATE, 'DD/MONTH/YYYY, DAY HH:MI:SS') FROM DUAL /* Sale : 16/AGOSTO /2004, LUNES 08:35:15, por ejemplo números Para convertir números a textos se usa está función cuando se desean características especiales. En ese caso en el formato se pueden utilizar estos símbolos: Símbolo Significado 9 Posición del número 0 Posición del número (muestra ceros) $ Formato dólar L Símbolo local de la moneda S Hace que aparezca el símbolo del signo D Posición del símbolo decimal (en español, la coma) G Posición del separador de grupo (en español el punto) TO_NUMBER Convierte textos en números. Se indica el formato de la conversión (utilizando los mismos símbolos que los comentados anteriormente). TO_DATE Convierte textos en fechas. Como segundo parámetro se utilizan los códigos de formato de fechas comentados anteriormente. [5.5.7] obtener datos de múltiples tablas Es más que habitual necesitar en una consulta datos que se encuentran distribuidos en varias tablas. Las bases de datos relacionales se basan en que los datos se distribuyen en tablas que se pueden relacionar mediante un campo. Ese campo es el que permite integrar los datos de las tablas. Por ejemplo si disponemos de una tabla de empleados cuya clave es el dni y otra tabla de tareas que se refiere a tareas realizadas por los empleados, es seguro (si el diseño está bien hecho) que en la tabla de tareas aparecerá el dni del empleado para saber qué empleado realizó la tarea. producto cruzado o cartesiano de tablas En el ejemplo anterior si quiere obtener una lista de los datos de las tareas y los empleados, se podría hacer de esta forma: SELECT cod_tarea, descripcion_tarea, dni_empleado, nombre_empleado FROM tareas,empleados;
- 103. Sistemas Gestores de Bases de Datos el lenguaje SQL [102] La sintaxis es correcta ya que, efectivamente, en el apartado FROM se pueden indicar varias tareas separadas por comas. Pero eso produce un producto cruzado, aparecerán todos los registros de las tareas relacionados con todos los registros de empleados. El producto cartesiano a veces es útil para realizar consultas complejas, pero en el caso normal no lo es. necesitamos discriminar ese producto para que sólo aparezcan los registros de las tareas relacionadas con sus empleados correspondientes. A eso se le llama asociar (join) tablas asociando tablas La forma de realizar correctamente la consulta anterior (asociado las tareas con los empleados que la realizaron sería: SELECT cod_tarea, descripcion_tarea, dni_empleado, nombre_empleado FROM tareas,empleados WHERE tareas.dni_empleado = empleados.dni; Nótese que se utiliza la notación tabla.columna para evitar la ambigüedad, ya que el mismo nombre de campo se puede repetir en ambas tablas. Para evitar repetir continuamente el nombre de la tabla, se puede utilizar un alias de tabla: SELECT a.cod_tarea, a.descripcion_tarea, b.dni_empleado, b.nombre_empleado FROM tareas a,empleados b WHERE a.dni_empleado = b.dni; Al apartado WHERE se le pueden añadir condiciones encadenándolas con el operador AND. Ejemplo: SELECT a.cod_tarea, a.descripcion_tarea FROM tareas a,empleados b WHERE a.dni_empleado = b.dni AND b.nombre_empleado='Javier'; Finalmente indicar que se pueden enlazar más de dos tablas a través de sus campos relacionados. Ejemplo: SELECT a.cod_tarea, a.descripcion_tarea, b.nombre_empleado, c.nombre_utensilio FROM tareas a,empleados b, utensilios_utilizados c WHERE a.dni_empleado = b.dni AND a.cod_tarea=c.cod_tarea; relaciones sin igualdad A las relaciones descritas anteriormente se las llama relaciones en igualdad (equijoins), ya que las tablas se relacionan a través de campos que contienen valores iguales en dos tablas.
- 104. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [103] Sin embargo no siempre las tablas tienen ese tipo de relación, por ejemplo: EMPLEADOS Empleado Sueldo Antonio 18000 Marta 21000 Sonia 15000 CATEGORIAS categoría Sueldo mínimo Sueldo máximo D 6000 11999 C 12000 17999 B 18000 20999 A 20999 80000 En el ejemplo anterior podríamos averiguar la categoría a la que pertenece cada empleado, pero estas tablas poseen una relación que ya no es de igualdad. La forma sería: SELECT a.empleado, a.sueldo, b.categoria FROM empleados a, categorias b WHERE a.sueldo between b.sueldo_minimo and b.sueldo_maximo; sintaxis SQL 1999 En la versión SQL de 1999 se ideó una nueva sintaxis para consultar varias tablas. La razón fue separar las condiciones de asociación respecto de las condiciones de selección de registros. Oracle incorpora totalmente esta normativa. La sintaxis completa es: SELECT tabla1.columna1, tabl1.columna2,... tabla2.columna1, tabla2.columna2,... FROM tabla1 [CROSS JOIN tabla2]| [NATURAL JOIN tabla2]| [JOIN tabla2 USING(columna)]| [JOIN tabla2 ON (tabla1.columa=tabla2.columna)]| [LEFT|RIGHT|FULL OUTER JOIN tabla2 ON (tabla1.columa=tabla2.columna)] Se describen sus posibilidades en los siguientes apartados. www.elsolucionario.org
- 105. Sistemas Gestores de Bases de Datos el lenguaje SQL [104] CROSS JOIN Utilizando la opción CROSS JOIN se realiza un producto cruzado entre las tablas indicadas. Esta orden es equivalente al producto del álgebra relacional. Ejemplo: Å álgebra relacional: R × S Å SQL. SELECT * FROM R CROSS JOIN S; NATURAL JOIN Establece una relación de igualdad entre las tablas a través de los campos que tengan el mismo nombre en ambas tablas: SELECT * FROM piezas NATURAL JOIN existencias; En ese ejemplo se obtienen los registros de piezas relacionados en existencias a través de los campos que tengan el mismo nombre en ambas tablas. Equivalencia con el álgebra relacional: Å álgebra relacional: R∞S Å SQL: SELECT * FROM R NATURAL JOIN S; JOIN USING Permite establecer relaciones indicando qué campo (o campos) común a las dos tablas hay que utilizar: SELECT * FROM piezas JOIN existencias USING(tipo,modelo); Equivalencia con el álgebra relacional: Å álgebra relacional: cliente ∞ alquiler dni Å SQL. SELECT * FROM clientes JOIN alquiler USING(dni); JOIN ON Permite establecer relaciones cuya condición se establece manualmente, lo que permite realizar asociaciones más complejas o bien asociaciones cuyos campos en las tablas no tienen el mismo nombre: SELECT * FROM piezas JOIN existencias ON(piezas.tipo=existencias.tipo AND piezas.modelo=existencias.modelo); Equivalencia con el álgebra relacional: Å álgebra relacional:
- 106. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [105] localidades ∞ provincias provincias.id_capital=localidades.id_localidad Å SQL. SELECT * FROM localidades JOIN provincias USING(provincias.id_capital=localidades.id_capital); relaciones externas La última posibilidad es obtener relaciones laterales o externas (outer join). Para ello se utiliza la sintaxis: SELECT * FROM piezas LEFT OUTER JOIN existencias ON(piezas.tipo=existencias.tipo AND piezas.modelo=existencias.modelo); En este consulta además de las relacionadas, aparecen los datos de los registros de la tabla piezas que no están en existencias. Si el LEFT lo cambiamos por un RIGHT, aparecerán las existencias no presentes en la tabla piezas (además de las relacionadas en ambas tablas). La condición FULL OUTER JOIN produciría un resultado en el que aparecen los registros no relacionados de ambas tablas. [5.5.8] agrupaciones Es muy común utilizar consultas en las que se desee agrupar los datos a fin de realizar cálculos en vertical, es decir calculados a partir de datos de distintos registros. Para ello se utiliza la cláusula GROUP BY que permite indicar en base a qué registros se realiza la agrupación. Con GROUP BY la instrucción SELECT queda de esta forma: SELECT listaDeExpresiones FROM listaDeTablas [JOIN tablasRelacionadasYCondicionesDeRelación] [WHERE condiciones] [GROUP BY grupos] [HAVING condiciones de grupo] [ORDER BY columnas]; En el apartado GROUP BY, se indican las columnas por las que se agrupa. La función de este apartado es crear un único registro por cada valor distinto en las columnas del grupo. Si por ejemplo agrupamos en base a las columnas tipo y modelo en una tabla de existencias, se creará un único registro por cada tipo y modelo distintos: SELECT tipo,modelo FROM existencias GROUP BY tipo,modelo; Si la tabla de existencias sin agrupar es:
- 107. Sistemas Gestores de Bases de Datos el lenguaje SQL [106] TI MODELO N_ALMACEN CANTIDAD AR 6 1 2500 AR 6 2 5600 AR 6 3 2430 AR 9 1 250 AR 9 2 4000 AR 9 3 678 AR 15 1 5667 AR 20 3 43 BI 10 2 340 BI 10 3 23 BI 38 1 1100 BI 38 2 540 BI 38 3 La consulta anterior creará esta salida: TI MODELO AR 6 AR 9 AR 15 AR 20 BI 10 BI 38 Es decir es un resumen de los datos anteriores. Los datos n_almacen y cantidad no están disponibles directamente ya que son distintos en los registros del mismo grupo. Sólo se pueden utilizar desde funciones (como se verá ahora). Es decir esta consulta es errónea: SELECT tipo,modelo, cantidad FROM existencias GROUP BY tipo,modelo; SELECT tipo,modelo, cantidad * ERROR en línea 1: ORA-00979: no es una expresión GROUP BY www.elsolucionario.org
- 108. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [107] funciones de cálculo con grupos Lo interesante de la creación de grupos es las posibilidades de cálculo que ofrece. Para ello se utilizan funciones que permiten trabajar con los registros de un grupo son: Función Significado COUNT(*) Cuenta los elementos de un grupo. Se utiliza el asterisco para no tener que indicar un nombre de columna concreto, el resultado es el mismo para cualquier columna SUM(expresión) Suma los valores de la expresión AVG(expresión) Calcula la media aritmética sobre la expresión indicada MIN(expresión) Mínimo valor que toma la expresión indicada MAX(expresión) Máximo valor que toma la expresión indicada STDDEV(expresión) Calcula la desviación estándar VARIANCE(expresión) Calcula la varianza Todos esos valores se calculan para cada elemento del grupo, así la expresión: SELECT tipo,modelo, cantidad, SUM(Cantidad) FROM existencias GROUP BY tipo,modelo; Obtiene este resultado: TI MODELO SUM(CANTIDAD) AR 6 10530 AR 9 4928 AR 15 5667 AR 20 43 BI 10 363 BI 38 1740 Se suman las cantidades para cada grupo condiciones HAVING A veces se desea restringir el resultado de una expresión agrupada, por ejemplo con: SELECT tipo,modelo, cantidad, SUM(Cantidad) FROM existencias WHERE SUM(Cantidad)>500 GROUP BY tipo,modelo;
- 109. Sistemas Gestores de Bases de Datos el lenguaje SQL [108] Pero Oracle devolvería este error: WHERE SUM(Cantidad)>500 * ERROR en línea 3: ORA-00934: función de grupo no permitida aquí La razón es que Oracle calcula primero el WHERE y luego los grupos; por lo que esa condición no la puede realizar al no estar establecidos los grupos. Por ello se utiliza la cláusula HAVING, que se ejecuta una vez realizados los grupos. Se usaría de esta forma: SELECT tipo,modelo, cantidad, SUM(Cantidad) FROM existencias GROUP BY tipo,modelo HAVING SUM(Cantidad)>500; Eso no implica que no se pueda usar WHERE. Esta expresión sí es válida: SELECT tipo,modelo, cantidad, SUM(Cantidad) FROM existencias WHERE tipo!='AR' GROUP BY tipo,modelo HAVING SUM(Cantidad)>500; En definitiva, el orden de ejecución de la consulta marca lo que se puede utilizar con WHERE y lo que se puede utilizar con HAVING: Para evitar problemas estos podrían ser los pasos en la ejecución de una instrucción de agrupación por parte del gestor de bases de datos: [1] Seleccionar las filas deseadas utilizando WHERE. Esta cláusula eliminará columnas en base a la condición indicada [2] Se establecen los grupos indicados en la cláusula GROUP BY [3] Se calculan los valores de las funciones de totales (COUNT, SUM, AVG,...) [4] Se filtran los registros que cumplen la cláusula HAVING [5] El resultado se ordena en base al apartado ORDER BY.
- 110. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [109] [5.5.9] subconsultas Se trata de una técnica que permite utilizar el resultado de una tabla SELECT en otra consulta SELECT. Permite solucionar problemas en los que el mismo dato aparece dos veces. La sintaxis es: SELECT listaExpresiones FROM tabla WHERE expresión operador (SELECT listaExpresiones FROM tabla); Se puede colocar el SELECT dentro de las cláusulas WHERE, HAVING o FROM. El operador puede ser >,<,>=,<=,!=, = o IN. Ejemplo: SELECT nombre_empleado, paga FROM empleados WHERE paga < (SELECT paga FROM empleados WHERE nombre_empleado='Martina') ; Lógicamente el resultado de la subconsulta debe incluir el campo que estamos analizando. Se pueden realizar esas subconsultas las veces que haga falta: SELECT nombre_empleado, paga FROM empleados WHERE paga < (SELECT paga FROM empleados WHERE nombre_empleado='Martina') AND paga > (SELECT paga FROM empleados WHERE nombre_empleado='Luis'); La última consulta obtiene los empleados cuyas pagas estén entre lo que gana Luis y lo que gana Martina. Una subconsulta que utilice los valores >,<,>=,... tiene que devolver un único valor, de otro modo ocurre un error. Pero a veces se utilizan consultas del tipo: mostrar el sueldo y nombre de los empleados cuyo sueldo supera al de cualquier empleado del departamento de ventas. La subconsulta necesaria para ese resultado mostraría los sueldos del departamento de ventas. Pero no podremos utilizar un operador de comparación directamente ya que compararíamos un valor con muchos valores. La solución a esto es utilizar instrucciones especiales entre el operador y la consulta. www.elsolucionario.org
- 111. Sistemas Gestores de Bases de Datos el lenguaje SQL [110] Esas instrucciones son: Instrucción Significado ANY Compara con cualquier registro de la consulta. La instrucción es válida si hay un registro en la subconsulta que permite que la comparación sea cierta ALL Compara con todos los registros de la consulta. La instrucción resulta cierta si es cierta toda comparación con los registros de la subconsulta IN No usa comparador, ya que sirve para comprobar si un valor se encuentra en el resultado de la subconsulta NOT IN Comprueba si un valor no se encuentra en una subconsulta Ejemplo: SELECT nombre, sueldo FROM empleados WHERE sueldo >= ALL (SELECT sueldo FROM empleados) Esa consulta obtiene el empleado que más cobra. Otro ejemplo: SELECT nombre FROM empleados WHERE dni IN (SELECT dni FROM directivos) En ese caso se obtienen los nombres de los empleados cuyos dni están en la tabla de directivos. [5.5.10] combinaciones especiales uniones La palabra UNION permite añadir el resultado de un SELECT a otro SELECT. Para ello ambas instrucciones tienen que utilizar el mismo número y tipo de columnas. Ejemplo: SELECT nombre FROM provincias UNION SELECT nombre FROM comunidades El resultado es una tabla que contendrá nombres de provincia y de comunidades. Es decir, UNION crea una sola tabla con registros que estén presentes en cualquiera de las consultas. Si están repetidas sólo aparecen una vez, para mostrar los duplicados se utiliza UNION ALL en lugar de la palabra UNION.
- 112. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [111] intersecciones De la misma forma, la palabra INTERSECT permite unir dos consultas SELECT de modo que el resultado serán las filas que estén presentes en ambas consultas. diferencia Con MINUS también se combinan dos consultas SELECT de forma que aparecerán los registros del primer SELECT que no estén presentes en el segundo. Se podrían hacer varias combinaciones anidadas (una unión cuyo resultado se intersectara con otro SELECT por ejemplo), en ese caso es conveniente utilizar paréntesis para indicar qué combinación se hace primero: (SELECT.... .... UNION SELECT.... ... ) MINUS SELECT.... /* Primero se hace la unión y luego la diferencia*/ [5.6] DML [5.6.1] introducción Es una de las partes fundamentales del lenguaje SQL. El DML (Data Manipulation Language) lo forman las instrucciones capaces de modificar los datos de las tablas. Al conjunto de instrucciones DML que se ejecutan consecutivamente, se las llama transacciones y se pueden anular todas ellas o aceptar, ya que una instrucción DML no es realmente efectuada hasta que no se acepta (commit). En todas estas consultas, el único dato devuelto por Oracle es el número de registros que se han modificado. [5.6.2] inserción de datos La adición de datos a una tabla se realiza mediante la instrucción INSERT. Su sintaxis fundamental es: INSERT INTO tabla [(listaDeCampos)] VALUES (valor1 [,valor2 ...]) La tabla representa la tabla a la que queremos añadir el registro y los valores que siguen a VALUES son los valores que damos a los distintos campos del registro. Si no se
- 113. Sistemas Gestores de Bases de Datos el lenguaje SQL [112] especifica la lista de campos, la lista de valores debe seguir el orden de las columnas según fueron creados (es el orden de columnas según las devuelve el comando DESCRIBE). La lista de campos a rellenar se indica si no queremos rellenar todos los campos. Los campos no rellenados explícitamente con la orden INSERT, se rellenan con su valor por defecto (DEFAULT) o bien con NULL si no se indicó valor alguno. Si algún campo tiene restricción de tipo NOT NULL, ocurrirá un error si no rellenamos el campo con algún valor. Por ejemplo, supongamos que tenemos una tabla de clientes cuyos campos son: dni, nombre, apellido1, apellido2, localidad y dirección; supongamos que ese es el orden de creación de los campos de esa tabla y que la localidad tiene como valor por defecto Palencia y la dirección no tiene valor por defecto. En ese caso estas dos instrucciones son equivalentes: INSERT INTO clientes VALUES('11111111','Pedro','Gutiérrez', 'Crespo',DEFAULT,NULL); INSERT INTO clientes(dni,nombre,apellido1,apellido2) VALUES('11111111','Pedro','Gutiérrez', 'Crespo') Son equivalentes puesto que en la segunda instrucción los campos no indicados se rellenan con su valor por defecto y la dirección no tiene valor por defecto. La palabra DEFAULT fuerza a utilizar ese valor por defecto. El uso de los distintos tipos de datos debe de cumplir los requisitos ya comentados en temas anteriores (véase tipos de datos, página 77). relleno de registros a partir de filas de una consulta Hay un tipo de consulta, llamada de adición de datos, que permite rellenar datos de una tabla copiando el resultado de una consulta. Ese relleno se basa en una consulta SELECT que poseerá los datos a añadir. Lógicamente el orden de esos campos debe de coincidir con la lista de campos indicada en la instrucción INDEX. Sintaxis: INSERT INTO tabla (campo1, campo2,...) SELECT campoCompatibleCampo1, campoCompatibleCampo2,... FROM tabla(s) [...otras cláusulas del SELECT...] Ejemplo: INSERT INTO clientes2004 (dni, nombre, localidad, direccion) SELECT dni, nombre, localidad, direccion FROM clientes WHERE problemas=0; www.elsolucionario.org
- 114. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [113] [5.6.3] actualización de registros La modificación de los datos de los registros lo implementa la instrucción UPDATE. Sintaxis: UPDATE tabla SET columna1=valor1 [,columna2=valor2...] [WHERE condición] Se modifican las columnas indicadas en el apartado SET con los valores indicados. La cláusula WHERE permite especificar qué registros serán modificados. Ejemplos: UPDATE clientes SET provincia='Ourense' WHERE provincia='Orense'; UPDATE productos SET precio=precio*1.16; El primer dato actualiza la provincia de los clientes de Orense para que aparezca como Ourense. El segundo UPDATE incrementa los precios en un 16%. La expresión para el valor puede ser todo lo compleja que se desee: UPDATE partidos SET fecha= NEXT_DAY(SYSDATE,'Martes') WHERE fecha=SYSDATE; Incluso se pueden utilizar subconsultas: UPDATE empleados SET puesto_trabajo=(SELECT puesto_trabajo FROM empleados WHERE id_empleado=12) WHERE seccion=23; Esta consulta coloca a todos los empleados de la sección 23 el mismo puesto de trabajo que el empleado número 12. Este tipo de actualizaciones sólo son válidas si el subselect devuelve un único valor, que además debe de ser compatible con la columna que se actualiza. Hay que tener en cuenta que las actualizaciones no pueden saltarse las reglas de integridad que posean las tablas. [5.6.4] borrado de registros Se realiza mediante la instrucción DELETE: DELETE [FROM] tabla [WHERE condición]
- 115. Sistemas Gestores de Bases de Datos el lenguaje SQL [114] Es más sencilla que las anteriores, elimina los registros de la tabla que cumplan la condición indicada. Ejemplos: DELETE FROM empleados WHERE seccion=23; DELETE FROM empleados WHERE id_empleado IN (SELECT id_empleado FROM errores_graves); Hay que tener en cuenta que el borrado de un registro no puede provocar fallos de integridad y que la opción de integridad ON DELETE CASCADE (véase página 83, clave secundaria o foránea) hace que no sólo se borren los registros indicados en el SELECT, sino todos los relacionados. [5.6.5] transacciones Como se ha comentado anteriormente, una transacción está formada por una serie de instrucciones DML. Una transacción comienza con la primera instrucción DML que se ejecute y finaliza con alguna de estas circunstancias: Å Una operación COMMIT o ROLLBACK Å Una instrucción DDL (como ALTER TABLE por ejemplo) Å Una instrucción DCL (como GRANT) Å El usuario abandona la sesión Å Caída del sistema Hay que tener en cuenta que cualquier instrucción DDL o DCL da lugar a un COMMIT implícito, es decir todas las instrucciones DML ejecutadas hasta ese instante pasan a ser definitivas. COMMIT La instrucción COMMIT hace que los cambios realizados por la transacción sean definitivos, irrevocables. Sólo se debe utilizar si estamos de acuerdo con los cambios, conviene asegurarse mucho antes de realizar el COMMIT ya que las instrucciones ejecutadas pueden afectar a miles de registros. Además el cierre correcto de la sesión da lugar a un COMMIT, aunque siempre conviene ejecutar explícitamente esta instrucción a fin de asegurarnos de lo que hacemos. ROLLBACK Esta instrucción regresa a la instrucción anterior al inicio de la transacción, normalmente el último COMMIT, la última instrucción DDL o DCL o al inicio de sesión. Anula definitivamente los cambios, por lo que conviene también asegurarse de esta operación. Un abandono de sesión incorrecto o un problema de comunicación o de caída del sistema dan lugar a un ROLLBACK implícito.
- 116. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [115] estado de los datos durante la transacción Si se inicia una transacción usando comandos DML hay que tener en cuenta que: Å Se puede volver a la instrucción anterior a la transacción cuando se desee Å Las instrucciones de consulta SELECT realizadas por el usuario que inició la transacción muestran los datos ya modificados por las instrucciones DML Å El resto de usuarios ven los datos tal cual estaban antes de la transacción, de hecho los registros afectados por la transacción aparecen bloqueados hasta que la transacción finalice. Esos usuarios no podrán modificar los valores de dichos registros. Å Tras la transacción todos los usuarios ven los datos tal cual quedan tras el fin de transacción. Los bloqueos son liberados y los puntos de ruptura borrados. [5.7] creación de otros objetos de base de datos [5.7.1] vistas introducción Una vista no es más que una consulta almacenada a fin de utilizarla tantas veces como se desee. Una vista no contiene datos sino la instrucción SELECT necesaria para crear la vista, eso asegura que los datos sean coherentes al utilizar los datos almacenados en las tablas. Por todo ello, las vistas gastan muy poco espacio de disco. Las vistas se emplean para: Å Realizar consultas complejas más fácilmente, ya que permiten dividir la consulta en varias partes Å Proporcionar tablas con datos completos Å Utilizar visiones especiales de los datos Å Ser utilizadas como tablas que resumen todos los datos Å Ser utilizadas como cursores de datos en los lenguajes procedimentales (como PL/SQL) Hay dos tipos de vistas: Å Simples. Las forman una sola tabla y no contienen funciones de agrupación. Su ventaja es que permiten siempre realizar operaciones DML sobre ellas. Å Complejas. Obtienen datos de varias tablas, pueden utilizar funciones de agrupación. No siempre permiten operaciones DML. www.elsolucionario.org
- 117. Sistemas Gestores de Bases de Datos el lenguaje SQL [116] creación de vistas Sintaxis: CREATE [OR REPLACE] [FORCE|NOFORCE] VIEW vista [(alias[, alias2...]] AS consultaSELECT [WITH CHECK OPTION [CONSTRAINT restricción]] [WITH READ ONLY [CONSTRAINT restricción]] Å OR REPLACE. Si la vista ya existía, la cambia por la actual Å FORCE. Crea la vista aunque los datos de la consulta SELECT no existan Å vista. Nombre que se le da a la vista Å alias. Lista de alias que se establecen para las columnas devueltas por la consulta SELECT en la que se basa esta vista. El número de alias debe coincidir con el número de columnas devueltas por SELECT. Å WITH CHECK OPTION. Hace que sólo las filas que se muestran en la vista puedan ser añadidas (INSERT) o modificadas (UPDATE). La restricción que sigue a esta sección es el nombre que se le da a esta restricción de tipo CHECK OPTION. Å WITH READ ONLY. Hace que la vista sea de sólo lectura. Permite grabar un nombre para esta restricción. Lo bueno de las vistas es que tras su creación se utilizan como si fueran una tabla. Ejemplo: CREATE VIEW resumen /* alias */ (id_localidad, localidad, poblacion, n_provincia, provincia, superficie, capital_provincia, id_comunidad, comunidad, capital_comunidad) AS ( SELECT l.id_localidad, l.nombre, l.poblacion, n_provincia, p.nombre, p.superficie, l2.nombre, id_comunidad, c.nombre, l3.nombre FROM localidades l JOIN provincias p USING (n_provincia) JOIN comunidades c USING (id_comunidad) JOIN localidades l2 ON (p.id_capital=l2.id_localidad) JOIN localidades l3 ON (c.id_capital=l3.id_localidad) ) SELECT DISTINCT (comunidad, capital_comunidad) FROM resumen;
- 118. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [117] La creación de la vista del ejemplo es compleja ya que hay relaciones complicadas, pero una vez creada la vista, se le pueden hacer consultas como si se tratara de una tabla normal. Incluso se puede utilizar el comando DESCRIBE sobre la vista para mostrar la estructura de los campos que forman la vista. ejecución de comandos DML sobre vistas Las instrucciones DML ejecutadas sobre las vistas permiten añadir o modificar los datos de las tablas relacionados con las filas de la vista. Ahora bien, no es posible ejecutar instrucciones DML sobre vistas que: Å Utilicen funciones de grupo (SUM, AVG,...) Å Usen GROUP BY o DISTINCT Å Posean columnas con cálculos (PRECIO * 1.16) Además no se pueden añadir datos a una vista si en las tablas referencias en la consulta SELECT hay campos NOT NULL que no aparecen en la consulta (es lógico ya que al añadir el dato se tendría que añadir el registro colocando el valor NULL en el campo). Ejemplo (sobre la vista anterior): INSERT INTO resumen(id_localidad, localidad, poblacion) VALUES (10000, 'Sevilla', 750000) mostrar la lista de vistas La vista del diccionario de datos de Oracle USER_VIEWS permite mostrar una lista de todas las vistas que posee el usuario actual. Es decir, para saber qué vistas hay disponibles se usa: SELECT * FROM USER_VIEWS; La columna TEXT de esa vista contiene la sentencia SQL que se utilizó para crear la vista (sentencia que es ejecutada cada vez que se invoca a la vista). borrar vistas Se utiliza el comando DROP VIEW: DROP VIEW nombreDeVista; [5.7.2] secuencias Una secuencia sirve para generar automáticamente números distintos. Se utilizan para generar valores para campos que se utilizan como clave forzada (claves cuyo valor no interesa, sólo sirven para identificar los registros de una tabla). Es decir se utilizan en los identificadores de las tablas (campos que comienzan con la palabra id), siempre y cuando no importe qué número se asigna a cada fila. Es una rutina interna de la base de datos la que realiza la función de generar un número distinto cada vez. Las secuencias se almacenan independientemente de la tabla, por lo que la misma secuencia se puede utilizar para diversas tablas.
- 119. Sistemas Gestores de Bases de Datos el lenguaje SQL [118] creación de secuencias Sintaxis: CREATE SEQUENCE secuencia [INCREMENT BY n] [START WITH n] [{MAXVALUE n|NOMAXVALUE}] [{MINVALUE n|NOMINVALUE}] [{CYCLE|NOCYCLE}] Donde: Å secuencia. Es el nombre que se le da al objeto de secuencia Å INCREMENT BY. Indica cuánto se incrementa la secuencia cada vez que se usa. Por defecto se incrementa de uno en uno Å START WITH. Indica el valor inicial de la secuencia (por defecto 1) Å MAXVALUE. Máximo valor que puede tomar la secuencia. Si no se toma NOMAXVALUE que permite llegar hasta el 1027 Å MINVALUE. Mínimo valor que puede tomar la secuencia. Por defecto -1026 Å CYCLE. Hace que la secuencia vuelva a empezar si se ha llegado al máximo valor. Ejemplo: CREATE SEQUENCE numeroPlanta INCREMENT 100 STARTS WITH 100 MAXVALUE 2000 ver lista de secuencias La vista del diccionario de datos de Oracle USER_SEQUENCES muestra la lista de secuencias actuales. La columna LAST_NUMBER muestra cual será el siguiente número de secuencia disponible uso de la secuencia Los métodos NEXTVAL y CURRVAL se utilizan para obtener el siguiente número y el valor actual de la secuencia respectivamente. Ejemplo de uso: SELECT numeroPlanta.NEXTVAL FROM DUAL; Eso muestra en pantalla el siguiente valor de la secuencia. Realmente NEXTVAL incrementa la secuencia y devuelve el valor actual. CURRVAL devuelve el valor de la secuencia, pero sin incrementar la misma. Ambas funciones pueden ser utilizadas en: www.elsolucionario.org
- 120. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [119] Å Una consulta SELECT que no lleve DISTINCT, ni grupos, ni sea parte de una vista, ni sea subconsulta de otro SELECT, UPDATE o DELETE Å Una subconsulta SELECT en una instrucción INSERT Å La cláusula VALUES de la instrucción INSERT Å La cláusula SET de la instrucción UPDATE No se puede utilizar (y siempre hay tentaciones para ello) como valor para la cláusula DEFAULT de un campo de tabla. Su uso más habitual es como apoyo al comando INSERT: INSERT INTO plantas(num, uso) VALUES(numeroPlanta.NEXTVAL, 'Suites'); modificar secuencias Se pueden modificar las secuencias, pero la modificación sólo puede afectar a los futuros valores de la secuencia, no a los ya utilizados. Sintaxis: ALTER SEQUENCE secuencia [INCREMENT BY n] [START WITH n] [{MAXVALUE n|NOMAXVALUE}] [{MINVALUE n|NOMINVALUE}] [{CYCLE|NOCYCLE}] borrar secuencias Lo hace el comando DROP SEQUENCE seguido del nombre de la secuencia a borrar. [5.7.3] índices Los índices son esquemas que hacen que una base de datos acelere las operaciones de consulta y ordenación sobre los campos a los que el índice hace referencia. Se almacenan aparte de la tabla a la que hace referencia, lo que permite crearles y borrarles en cualquier momento. Lo que realizan es una lista ordenada por la que Oracle puede acceder para facilitar la búsqueda de los datos. cada vez que se añade un nuevo registro, los índices involucrados se actualizan a fin de que su información esté al día. De ahí que cuantos más índices haya, más le cuesta a Oracle añadir registros, pero más rápidas se realizan las instrucciones de consulta. La mayoría de los índices se crean de manera implícita, como consecuencia de las restricciones PRIMARY KEY (que obliga a crear un índice único sobre los campos clave) , UNIQUE (crea también un índice único) y FOREIGN KEY (crea un índice con posibilidad de repetir valores, índice con duplicados). Estos son índices obligatorios, por los que les crea la propia base de datos. El nombre que se les da a esos índices suele ser el mismo que el nombre de la restricción que los genera
- 121. Sistemas Gestores de Bases de Datos el lenguaje SQL [120] creación de índices Aparte de los índices obligatorios comentados anteriormente, se pueden crear índices de forma explícita. Éstos se crean para aquellos campos sobre los cuales se realizarán búsquedas e instrucciones de ordenación frecuente. Sintaxis: CREATE INDEX nombre ON tabla (columna1 [,columna2...]) Ejemplo: CREATE INDEX nombre_completo ON clientes (apellido1, apellido2, nombre); El ejemplo crea un índice para los campos apellido1, apellido2 y nombre. Esto no es lo mismo que crear un índice para cada campo, este índice es efectivo cuando se buscan u ordenan clientes usando los tres campos (apellido1, apellido2, nombre) a la vez. Se aconseja crear índices en campos que: Å Contengan una gran cantidad de valores Å Contengan una gran cantidad de nulos Å Son parte habitual de cláusulas WHERE, GROUP BY u ORDER BY Å Son parte de listados de consultas de grandes tablas sobre las que casi siempre se muestran como mucho un 4% de su contenido. No se aconseja en campos que: Å Pertenezcan a tablas pequeñas Å No se usan a menudo en las consultas Å Pertenecen a tablas cuyas consultas muestran más de un 6% del total de registros Å Pertenecen a tablas que se actualizan frecuentemente Å Se utilizan en expresiones Los índices se pueden crear utilizando expresiones complejas: CREATE INDEX nombre_complejo ON clientes (UPPER(nombre)); Esos índices tienen sentido si en las consultas se utilizan exactamente esas expresiones. lista de índices Para ver la lista de índices se utiliza la vista USER_INDEXES . Mientras que la vista USER_IND_COLUMNS Muestra la lista de columnas que son utilizadas por índices.
- 122. 2º de Administración de Sistemas Informáticos Copyleft - Jorge Sánchez – www.jorgesanchez.net [121] borrar índices La instrucción DROP INDEX seguida del nombre del índice permite eliminar el índice en cuestión. [5.7.4] sinónimos Un sinónimo es un nombre que se asigna a un objeto cualquiera. Normalmente es un nombre menos descriptivo que el original a fin de facilitar la escritura del nombre del objeto en diversas expresiones. creación Sintaxis: CREATE [PUBLIC] SYNONYM nombre FOR objeto; objeto es el objeto al que se referirá el sinónimo. La cláusula PUBLIC hace que el sinónimo esté disponible para cualquier usuario (sólo se permite utilizar si disponemos de privilegios administrativos). borrado DROP SYNONYM nombre lista de sinónimos La vista USER_SYNONYMS permite observar la lista de sinónimos del usuario, la vista ALL_SYNONYMS permite mostrar la lista completa de sinónimos. www.elsolucionario.org