SQL - Clustered Index

Hallo zusammen, zukünftige Datenbank-Zauberer! Heute machen wir uns auf eine aufregende Reise in die Welt der SQL-Clustered Indexes. Keine Sorge, wenn ihr neu im Programmieren seid; ich werde euch Schritt für Schritt durch dieses Konzept führen, genau wie ich es in den letzten Jahren für unzählige Schüler getan habe. Also, holt euch eine Tasse Kaffee (oder Tee, wenn das euer Ding ist) und tauchen wir ein!

Was ist ein Clustered Index?

Bevor wir ins Detail gehen, beginnen wir mit einer einfachen Analogie. Stellt euch vor, ihr habt eine Bibliothek voller Bücher. Ein Clustered Index ist wie das Organisieren dieser Bücher alphabetisch nach ihren Titeln auf den Regalen. Wenn ihr ein bestimmtes Buch finden wollt, wisst ihr genau, wo ihr nachsehen müsst basierend auf seinem Titel.

In SQL-Begriffen bestimmt ein Clustered Index die physische Reihenfolge der Daten in einer Tabelle. Es ist wie ein eingebauter Sortiersystem für eure Daten. Hier ist der Knackpunkt: jede Tabelle kann nur einen Clustered Index haben. Warum? Weil man die gleiche Gruppe von Büchern nicht gleichzeitig auf zwei verschiedene Weisen anordnen kann!

Wesentliche Merkmale von Clustered Indexes

Physische Ordnung: Clustered Indexes sortieren und speichern die Datenzeilen in der Tabelle basierend auf ihren Schlüsselwerten.
Einzigartigkeit: Der Indexschlüssel muss für jede Zeile eindeutig sein.
Automatische Erstellung: In SQL Server wird die Erstellung eines Primärschlüssels automatisch einen Clustered Index erstellen,除非另外指定。
Leistung: Clustered Indexes können die Geschwindigkeit von Datenabrufoperationen erheblich verbessern.

Erstellen eines Clustered Index

Nun, da wir verstehen, was ein Clustered Index ist, lassen Sie uns einen erstellen! Wir beginnen mit einem einfachen Beispiel.

Beispiel 1: Erstellen eines einfachen Clustered Index

Stellen wir uns eine Tabelle namens Students mit Spalten für StudentID, FirstName und LastName vor. Lassen wir einen Clustered Index auf der StudentID-Spalte erstellen.

CREATE CLUSTERED INDEX IX_Students_StudentID
ON Students (StudentID);

In diesem Beispiel:

IX_Students_StudentID ist der Name, den wir unserem Index geben.
Students ist der Name unserer Tabelle.
StudentID ist die Spalte, die wir indizieren.

Nach der Ausführung dieses Befehls wird SQL Server die Daten in der Students-Tabelle basierend auf den StudentID-Werten physisch neu anordnen.

Beispiel 2: Erstellen eines Clustered Index auf einem vorhandenen Primärschlüssel

Oftentimes, Sie möchten, dass Ihr Primärschlüssel Ihr Clustered Index ist. Hier ist, wie Sie das tun können:

ALTER TABLE Students
ADD CONSTRAINT PK_Students PRIMARY KEY CLUSTERED (StudentID);

Dieser Befehl doet zwei Dinge:

Fügt eine Primärschlüsselbedingung zur StudentID-Spalte hinzu.
Gibt an, dass dieser Primärschlüssel ein Clustered Index sein soll.

SQL Clustered Indexes in der Praxis

Um die Macht der Clustered Indexes wirklich zu verstehen, sehen wir uns an, wie sie die Abfragleistung beeinflussen. Wir verwenden eine vor-und-nach-Szenario.

Vor dem Clustered Index

Stellen wir uns eine große Orders-Tabelle mit Millionen von Zeilen vor, und wir durchsuchen häufig Bestellungen nach OrderDate. Ohne einen Clustered Index könnte eine Abfrage wie diese aussehen:

SELECT * FROM Orders
WHERE OrderDate = '2023-05-15';

Diese Abfrage würde einen Tabellenscan durchführen und jede einzelne Zeile in der Tabelle überprüfen. Es ist wie das Suchen eines Buches in einer Bibliothek, in der die Bücher in zufälliger Reihenfolge sind!

Nach dem Clustered Index

Nun erstellen wir einen Clustered Index auf OrderDate:

CREATE CLUSTERED INDEX IX_Orders_OrderDate
ON Orders (OrderDate);

Nach der Erstellung dieses Index wird dieselbe Abfrage viel schneller ausgeführt. SQL Server kann jetzt schnell zu der genauen Datenposition navigieren, genau wie das Finden eines Buches in einer alphabetisch organisierten Bibliothek.

Erstellen eines Clustered Index auf mehreren Spalten

Manchmal möchte man einen Clustered Index auf mehrere Spalten erstellen. Dies ist besonders nützlich, wenn man häufig nach einer Kombination von Spalten suchen oder sortieren möchte.

Beispiel: Multi-Spalten-Clustered Index

Angenommen, wir haben eine Sales-Tabelle und wir durchsuchen oft Daten basierend auf SalesDate und ProductID. Wir können einen Clustered Index wie folgt erstellen:

CREATE CLUSTERED INDEX IX_Sales_DateProduct
ON Sales (SalesDate, ProductID);

Dieser Index wird die Daten zuerst nach SalesDate sortieren und dann nach ProductID innerhalb jedes Datums. Es ist wie das Organisieren von Büchern zuerst nach Genre und dann nach Autor innerhalb jedes Genres.

Wann man Multi-Spalten-Clustered Indexes verwendet

Multi-Spalten-Clustered Indexes sind vorteilhaft, wenn:

Sie häufig nach oder nach mehreren Spalten gleichzeitig suchen oder sortieren.
Die Kombination von Spalten einen eindeutigeren Schlüssel als eine einzelne Spalte bietet.

Seien Sie jedoch vorsichtig! Das Hinzufügen zu vieler Spalten kann Einfüge- und Aktualisierungsoperationen langsamer machen, da SQL Server die physische Reihenfolge der Daten für alle indizierten Spalten aufrechterhalten muss.

Best Practices für Clustered Indexes

Nach Jahren des Unterrichtens und Arbeitens mit Datenbanken habe ich eine Liste von Best Practices für die Verwendung von Clustered Indexes zusammengestellt:

Best Practice	Beschreibung
Die richtigen Spalten wählen	Wählen Sie Spalten, die häufig in WHERE-Klauseln und JOIN-Bedingungen verwendet werden
Datenverteilung berücksichtigen	Wählen Sie Spalten mit hoher Kardinalität (viele eindeutige Werte)
Breite im Auge behalten	Halten Sie den Indexschlüssel so schmal wie möglich
Überlegungen zu Einfügemustern	Für Tabellen mit häufigen Einfügungen, erwägen Sie die Verwendung eines monotonisch steigenden Schlüssels (wie einer Identity-Spalte)
Aktualisierte Indexspalten vermeiden	Häufige Aktualisierungen der indizierten Spalten können zu Fragmentierung führen
Mit nicht-Clustered Indexes ausgleichen	Verwenden Sie nicht-Clustered Indexes für andere häufig zugreifte Spalten

Fazit

Und das war's, Leute! Wir haben die Welt der SQL-Clustered Indexes bereist, von der Verständnis des grundlegenden Konzepts bis hin zur Erstellung von Indexen auf einer und mehreren Spalten. Denken Sie daran, wie jedes mächtige Werkzeug, sollten Clustered Indexes klug verwendet werden. Sie können die Abfragleistung erheblich verbessern, aber eine Überbeanspruchung oder Missbrauch kann unerwartete Verlangsamungen verursachen.

While you continue your SQL adventure, keep experimenting with different indexing strategies. Every database is unique, and finding the right balance is part of the fun (and challenge) of database optimization.

Before I sign off, here's a little joke to remember clustered indexes by: Why did the SQL query go to the gym? To work on its index!

Happy coding, and may your queries always run lightning-fast!

Credits: Image by storyset

Vorheriges Tutorial:

SQL - Eindeutiger Index

Nächstes Tutorial:

SQL - Nichteingruppierte Index