In dit deel leer je data over verschillende tabellen heen te combineren. Er is nog veel meer te leren over de DML, maar dit is het meest gevorderde gebruik van de DML in deze cursus.
Om de integriteit van de database te bewaren, normaliseren we de gegevens in de database. Door normalisering geraakt de informatie echter verspreid over meer dan één tabel. De gebruiker heeft daar echter niet veel aan. Primaire en vreemde sleutels zeggen de gebruiker niets. Anders gesteld, een tabel vol getallen zoals onderaan op de pagina over primary keys is op zich niet leesbaar. We moeten dus een manier vinden om de informatie weer voor te stellen alsof die uit één tabel komt.
De "domste" manier om data uit meerdere tabellen te combineren tot data die uit één tabel lijkt te komen, is de "cross join". Deze "plakt" elke rij uit tabel A aan elke rij uit tabel B. Veronderstel bijvoorbeeld volgende tabellen voor taken en voor personen:
omschrijving
Id
bestek voorzien
1
frisdrank meebrengen
2
aardappelsla maken
3
voornaam
Id
Taken_Id
Yannick
1
2
Bavo
2
1
Max
3
3
Deze kunnen we op deze manier combineren en tonen:
Dit levert dan een resultaat dat er als volgt uitziet:
omschrijving
Taken.Id
voornaam
Leden.Id
Taken_Id
bestek voorzien
1
Yannick
1
2
bestek voorzien
1
Bavo
2
1
bestek voorzien
1
Max
3
3
frisdrank meebrengen
2
Yannick
1
2
frisdrank meebrengen
2
Bavo
2
1
frisdrank meebrengen
2
Max
3
3
aardappelsla maken
3
Yannick
1
2
aardappelsla maken
3
Bavo
2
1
aardappelsla maken
3
Max
3
3
Dit bevat nuttige informatie, maar ook rijen waar we niets aan hebben. De interessante rijen zijn die, die een persoon koppelen aan een taak. Dat zijn de rijen waarin Taken.Id
gelijk is aan Taken_Id
(afkomstig uit Leden
).
Je kan dus personen koppelen aan hun taak via:
Hier moet je Taken.Id
schrijven omdat zowel Taken
als Leden
een kolom Id
hebben. Door de tabelnaam toe te voegen, maak je duidelijk over welke kolom het precies gaat.
Dit laatste voorbeeld werkt in MySQL, maar het wordt typisch anders geschreven. Meestal zal CROSS JOIN
vervangen worden door INNER JOIN
, terwijl WHERE
vervangen wordt door ON
. Wanneer we twee tabellen willen koppelen zodat samenhorende rijen uit tabel A en tabel B één nieuwe rij opleveren, zullen we deze conventie volgen.
Het resultaat zal er dus zo uitzien:
Het resultaat is hetzelfde, maar in dit scenario wordt INNER JOIN
verkozen. ON
is ook geen synoniem voor WHERE
, want het kan alleen gebruikt worden in een JOIN
-statement.
We weten wel hoe we leden aan taken kunnen koppelen door middel van INNER JOIN, maar die aanpak werkt niet wanneer er meer dan twee tabellen nodig zijn om de data terug te combineren, zoals in het geval van releases van games op platformen.
Om entiteiten gekoppeld via een M-op-N-relatie aan elkaar te koppelen, moet je eerst de informatie langs de M-kant koppelen met de tabel die de relatie voorstelt en vervolgens de informatie langs de N-kant koppelen.
Onze tabel met info over releases van games was:
Games_Id
Platformen_Id
1
1
1
2
1
3
2
1
2
2
2
3
3
1
3
2
4
1
4
2
4
3
4
4
We kunnen deze tonen met informatie over de game als volgt:
Dit voegt langs de rechterkant gewoon de details over de uitgebrachte game. Het is dus een meer uitgebreide versie van de tabel Releases. Daarom kunnen we dezelfde techniek herhalen en enkel de interessante info tonen:
JOIN
is niet alleen handig om informatie samen te tonen. Deze operatie kan ook gebruikt worden om aanpassingen door te voeren waarvoor we informatie uit een andere tabel nodig hebben.
Volgend script werd in de oefeningen gebruikt om nummers via een ID te linken aan een artiest, nadat artiesten in een aparte tabel waren geplaatst. De liedjes hebben dus nog géén ID, maar bevatten wel nog de naam van de artiest:
Eerst moet je dus kijken naar wat een gewone SELECT
van deze samengevoegde tabel zou opleveren. Hij zou informatie over een nummer plaatsen naast informatie over een artiest met dezelfde naam.
Onthoud heel goed: het is niet omdat we vaak schrijven ON X.Id = X_Id
dat dat de manier is om JOIN te gebruiken. Dit is niet meer of niet minder dan een vergelijking van de waarden in twee kolommen.
Voor uitvoering zien rijen uit de tabel met liedjes er dus zou uit:
Rijen uit de tabel met artiesten zien er zo uit:
Een combinatie van de twee tabellen kan je bekijken via (dus zoals in de update hierboven, maar de informatie wordt alleen getoond):
Deze ziet er zo uit:
Dus de kolom Artiesten_Id
is nog leeg, maar we kunnen het volgende zeggen:
ze is afkomstig uit Nummers
de waarde die we wensen in te vullen is wel zichtbaar in deze JOIN
, want ze staat in de kolom Id
afkomstig uit Artiesten
We weten dus wat we zouden moeten invullen voor al deze NULL
-waarden en we weten waar die info dan zou moeten worden opgeslagen. De UPDATE
is dan ook toegelaten en werkt zoals gewenst.