Vergelijkingen

overzicht operatoren

Om waarden te vergelijken, maakt MySQL gebruik van enkele operatoren die erg lijken op wat je mogelijk kent uit andere programmeertalen:

Symbool

Omschrijving

=

Gelijk aan

<

Kleiner dan

>

Groter dan

<=

Kleiner of gelijk

>=

Groter of gelijk

<>

Verschillend

Voor "gelijk aan" heb je maar één = nodig, waar veel programmeertalen == gebruiken. Dat komt omdat = in die andere talen gebruikt wordt voor toekenning. In SQL is duidelijk uit de context dat je met = een vergelijking bedoelt.

operatoren in combinatie met collations

Voor getallen betekenen bovenstaande operatoren precies wat je zou verwachten. Je moet in het achterhoofd houden dat FLOAT en DOUBLE niet helemaal precies zijn, maar voor de rest betekenen ze wat je verwacht uit de wiskunde.

Voor tekst is het wat complexer. Je kan wel degelijk iets als het volgende schrijven:

USE ApDB;
SELECT Familienaam, Titel FROM Boeken WHERE Familienaam < 'B';

Dit SELECT statement retourneert alle rijen uit de tabel Boeken waarvan de Familienaam een waarde heeft die "kleiner" is dan 'B'. Wanneer is een string "kleiner" dan een andere string? Om op die vraag te antwoorden moet je eerst weten dat de namen in een bepaalde, gewoonlijk alfabetische volgorde (in het Engels collation order) worden gerangschikt. "Alle namen kleiner dan 'B'" wil dan zeggen "alle namen die na het sorteren voor 'B' komen."

De collation is een stel regels voor het vergelijken van tekens in een tekenset. De tekenset bepaalt dat A een symbool is dat je kan weergeven en bepaalt welke bytes nodig zijn om dit symbool voor te stellen. De collation legt vast dat "A" voor "B" komt en of "A" voor, na of op dezelfde plaats als "a" komt.

Als de familienaam Beth in je tabel voorkomt, wordt deze niet in de selectie opgenomen. Om ook die rij te selecteren, zou je kunnen denken om de expressie Familienaam <= 'B' te gebruiken:

USE ApDB;
SELECT Familienaam, Titel FROM Boeken WHERE Familienaam <= 'B';

Dit zal niet werken. Dat komt omdat we de boeken opvragen waarvan de familienaam van de auteur kleiner of gelijk is aan 'B'. De tekst 'Beth' is niet gelijk aan 'B' en is zeker niet kleiner! In het algemeen mag je dit onthouden: als een string A een prefix is van een string B, d.w.z. als string B letterlijk begint met de inhoud van A en dan nog meer tekst bevat, dan zal A altijd voor B gesorteerd worden. Zo wordt 'schoen' gesorteerd voor 'schoenmaker', omdat 'schoen' een prefix is van 'schoenmaker'. Maar er wordt éérst naar de letters gekeken en dan pas naar de lengte van de tekst. Zo wordt 'schoeisel' voor 'schoen' gesorteerd, omdat 'i' voor 'n' komt.

Ter verduidelijking: als we 'B' als familienaam toevoegen, wordt het resultaat wel geselecteerd:

USE ApDB;
INSERT INTO Boeken (Familienaam,Titel,Voornaam,Categorie)
VALUES
('B','Het Boek','Jef','Filosofie');
SELECT Titel, Familienaam FROM Boeken
   where Familienaam <= 'B';

Stel dat je alle titels wilt van de auteurs wilt waarvan de familienaam begint met een' A' of een 'B'. Dan moet je de WHERE clausule verfijnen. Je zou dit kunnen proberen:

USE ApDB;
SELECT Familienaam, Titel FROM Boeken where Familienaam <= 'Bz';

Maar hier zijn verschillende problemen mee. Als 'Bz' een prefix is van de naam van een auteur (niet erg waarschijnlijk, maar het zou kunnen), zal dit niet werken. Nog lastiger: dit is erg afhankelijk van de collation. Het is niet in elke collation zo dat 'Bz' voor 'Bé' komt, bijvoorbeeld. Sommige collations sorteren eerst de gebruikelijke 26 letters van het alfabet en pas daarna de letters met accenten.

Volgend script is beter (je mag er in het algemeen wel vanuit gaan dat 'B' voor 'C' komt):

USE ApDB;
SELECT Familienaam, Titel FROM Boeken where Familienaam < 'C'

Hoe weet je precies wat er met accenten en hoofdletters gebeurt? Dat hangt ervan af of de gebruikte collation hoofdlettergevoelig (case sensitive) en/of accentgevoelig (accent sensitive) is voor de kolom die je aan het beschouwen bent.

Probeer dit eens uit:

INSERT INTO Boeken (
   Voornaam,
   Familienaam,
   Titel,
   Categorie
)
VALUES
(
   'Emile',
   'Bréhier',
   'Cours de Philosophie',
   'Filosofie'
),
(
   'Andre',
   'Breton',
   'Nadja',
   'Roman'
);

SELECT Voornaam, Familienaam, Titel FROM Boeken
   where Familienaam <= 'Breton';

Als de collation voor Familienaam accentongevoelig is, zal je sowieso beide nieuwe records zien. Anders worden de zaken complexer. Dan moet je kijken naar het gebruikte collation algoritme en de accentgevoeligheid. Dan moet je bijvoorbeeld weten of de é pas ergens na de z komt of na de e maar voor de f. Als je de collation van de kolommen van de tabel Boeken te weten wil komen, kan je in MySQL Workbench rechtsklikken op de tabel in kwestie en dan via "Table Inspector" naar "Columns" gaan om de collation te achterhalen. Er zijn véél collations, maar onthoud vooral volgende vuistregels:

als ze _bin bevat (al dan niet met hoofdletters geschreven), worden de bytevoorstellingen van de karakters vergeleken
- dit is zowat de strengste definitie van gelijkheid die je kan hebben
als ze _as bevat, is de collation accentgevoelig
als ze _ai bevat, is de collation accentongevoelig
als ze _cs bevat, is de collation hoofdlettergevoelig
als ze _ci bevat, is de collation hoofdletterongevoelig

Als je dus bijvoorbeeld enkel een boek van Breton wil, zonder boeken van "Bréton" of "breton", schrijf je:

SELECT * FROM Boeken WHERE Familienaam COLLATE utf8mb4_0900_as_cs = 'Breton';

Als je MySQL geïnstalleerd hebt zoals afgesproken, wordt standaard de tekenset utf8mb4 en de collation utf8mb4_0900_ai_ci gebruikt. Dus met de standaardinstellingen maakt het niet uit of je CHAR SET utf8mb4 toevoegt, maar het is beter expliciet te zijn dan te hopen dat jouw database nog volledig ingesteld is op standaardinstellingen.

PreviousLogische operatoren NextSELECT sorteren

Last updated 4 years ago

Was this helpful?

hashtagoverzicht operatoren

hashtagoperatoren in combinatie met collations

overzicht operatoren

operatoren in combinatie met collations