Februar 22, 2022

Mathematik

image KAPITELÜBERSICHT

Unit 2.1 Merkmale einer guten Datenbank
Unit 2.2 Probleme mit Datenbanken
Einheit 2.3 Wie man Anomalien loswird

image Lernergebnisse

Am Ende dieses Kapitels sollten Sie in der Lage sein:

  • Geben Sie die Eigenschaften einer guten Datenbank an
  • Beschreiben Sie die Probleme mit Datenbanken
  • Erklären Sie die Normalisierung und den Prozess.

EINLEITUNG

Daten werden in Tabellen in einer Datenbank gespeichert. Es kann in einer einzigen Tabelle (als flache Datenbank bezeichnet – wie in Abbildung 2.1 gezeigt) oder in mehreren verbundenen Tabellen (als relationale Datenbank bezeichnet – wie in Abbildung 2.2 gezeigt) gespeichert werden.

image
Abbildung 2.1: Daten, die in einer einzigen Tabelle in einer flachen Datenbank gespeichert sind
image
Abbildung 2.2: Daten, die in mehreren Tabellen in einer relationalen Datenbank gespeichert sind

image
Neue Wörter

feld – ein einzelnes Bit an Informationen über eine Person oder ein Element, z. B. Alter

Datensatz – eine Gruppe verwandter Felder zu einem Element oder einer Person, die in der Tabelle erfasst werden

Primärschlüssel – ein Feld, das eine eindeutige Kennung für jeden Datensatz in der Datenbank enthält (Eindeutig bedeutet, dass es nur einen)

Jede Tabelle besteht aus Feldern und Datensätzen. Felder sind die Kategorien, für die Sie Daten aufzeichnen möchten. Die oben gezeigte Musiktabelle enthält beispielsweise Felder wie Titel, Interpret, Dauer und Album. Datensätze beziehen sich auf die tatsächlich erfassten Daten, wobei jeder Datensatz die Daten eines einzelnen Elements enthält. In der Song-Tabelle repräsentiert beispielsweise jeder Datensatz einen einzelnen Song mit allen Informationen (wie Interpret und Dauer), die sich auf diesen Song beziehen.

Jede Tabelle kann ein obligatorisches Feld haben, das als Primärschlüssel bezeichnet wird und eine eindeutige Kennung für jeden Datensatz in der Datenbank enthält. Auf diese Weise können Sie auf einen bestimmten Datensatz in einer Tabelle so verweisen, dass er nur auf einen Eintrag verweisen kann. Während es möglich ist, ein vorhandenes Feld einer Tabelle zu einem Schlüsselfeld zu machen, erstellen Datenbankersteller normalerweise ein neues Feld speziell für diesen Zweck. Dadurch können sie sicherstellen, dass keine Duplikate vorhanden sind.

Manchmal gibt es Anomalien mit Datenbanken, Sie werden lernen, wie Sie diese Anomalien beseitigen können.

In diesem Kapitel entwerfen und erstellen Sie eine relationale Datenbank. Manchmal gibt es Anomalien bei Datenbanken, Sie werden lernen, diese zu beseitigen und eine Normalisierung zu erreichen.

DATENBANKEN AUF DEN PUNKT GEBRACHT

Daten werden im Prinzip in 1s und 0s gespeichert. Der Computer muss noch wissen, wie diese 1s und 0s organisiert sind und wie sie interpretiert werden sollen. Dazu nutzen Computer Datenstrukturen, die eine bestimmte Reihenfolge der zu organisierenden Daten beschreiben. Auf diese Weise kann der Computer verstehen, wie die verschiedenen Datenbits zusammenhängen, und die Daten korrekt interpretieren.

Wir wissen, dass jeder Buchstabe im Alphabet ein Zeichen darstellt. Wenn Sie genügend Zeichen zusammenfügen, bilden sie ein Wort (wie ‚Orange‘ oder ‚Liebe‘), das ein Konzept darstellt. Daher ermöglicht die Kommunikation von nützlichen Informationen zwischen zwei oder mehr Personen – auch über Entfernungen.

Um Daten und Anweisungen zu kommunizieren, werden Daten wie Zahlen, Buchstaben, Zeichen, Sonderzeichen, Töne / Phonik und Bilder in computerlesbare Form (binär) umgewandelt. Sobald die Verarbeitung dieser Daten abgeschlossen ist, werden sie in ein für Menschen lesbares Format umgewandelt, Die verarbeiteten Daten werden zu aussagekräftigen Informationen. Die Informationen werden zu Wissen und können von Menschen für verschiedene Zwecke verstanden und verwendet werden.

AKTIVITÄT 2.1 Revision Aktivität

2.1.1 Erklären Sie in Ihren eigenen Worten, was eine Datenbank ist und wofür sie verwendet werden kann. Geben Sie ein Beispiel an, um Ihre Antwort zu unterstützen.

2.1.2Wahr oder Falsch: Ein Data Warehouse verwendet Transaktionsdaten aus verschiedenen Quellen und nutzt die Daten analytisch.

2.1.3Füllen Sie die Lücken aus, indem Sie den richtigen Begriff aus der folgenden Liste auswählen:

a.Die Daten werden in ____________ in einer Datenbank.

b.Ein einzelnes Bit Information über einen Gegenstand oder eine Person ist ein ________.

c.Wenn viele verwandte Felder zu einem Element zusammengefügt werden, wird das Formular a ___________.

d.A ___________ schlüssel enthält eindeutige Bezeichner für jeden Datensatz in einer Datenbank.

e.Eine Datenbank dient zum Speichern _____________ transaktionen mit Daten ______________ speichert eine große Menge historischer Daten.

f.A ______________ datenbank speichert Daten in mehreren Tabellen.

UNIT2.1 Merkmale einer guten Datenbank

Alle guten Datenbanken sollten mit wertvollen Metadaten und Daten beginnen. In Kapitel 1 haben wir uns die Eigenschaften wertvoller Daten und deren Verwaltung angesehen. Diese sind in Abbildung 2.3 unten dargestellt:

image
Abbildung 2.3: Verwalten einer Datenbank

Schauen wir uns nun die Eigenschaften einer guten Datenbank an:

  • Die Datenbank sollte stark genug sein, um alle relevanten Daten und Anforderungen zu speichern.
  • Sollte in der Lage sein, die Tabellen in der Datenbank über eine Beziehung zu verknüpfen, z. B. arbeitet ein Mitarbeiter für eine Abteilung, sodass der Mitarbeiter mit einer bestimmten Abteilung verknüpft ist. Wir sollten in der Lage sein, eine solche Beziehung zwischen zwei beliebigen Entitäten in der Datenbank zu definieren.
  • Mehrere Benutzer sollten in der Lage sein, auf dieselbe Datenbank zuzugreifen, ohne den anderen Benutzer zu beeinträchtigen. Beispielsweise können mehrere Lehrer an einer Datenbank arbeiten, um die Noten der Lernenden gleichzeitig zu aktualisieren. Lehrer sollten auch die Noten für ihre Fächer aktualisieren dürfen, ohne andere Fachmarken zu ändern.
  • Eine einzelne Datenbank bietet verschiedene Ansichten für verschiedene Benutzer, es unterstützt mehrere Ansichten für den Benutzer, abhängig von seiner Rolle. In einer Schuldatenbank können Lehrer beispielsweise die Aufschlüsselung der Noten der Lernenden sehen; Eltern können jedoch nur den Bericht ihres Kindes sehen – der Zugriff der Eltern wäre also schreibgeschützt. Gleichzeitig haben Lehrkräfte Zugriff auf alle Informationen und Bewertungsdetails der Lernenden mit Änderungsrechten. All dies kann in derselben Datenbank geschehen.
  • Datenintegrität bezieht sich darauf, wie genau und konsistent die Daten in einer Datenbank sind. Datenbanken mit vielen fehlenden Informationen und falschen Informationen sollen eine geringe Datenintegrität aufweisen.
  • Datenunabhängigkeit bezieht sich auf die Trennung zwischen Daten und der Anwendung (oder den Anwendungen), in der sie verwendet wird. Auf diese Weise können Sie die Daten in Ihrer Anwendung aktualisieren (z. B. einen Rechtschreibfehler beheben), ohne die gesamte Anwendung neu kompilieren zu müssen.
  • Datenredundanz bezieht sich darauf, dass genau dieselben Daten an verschiedenen Stellen in der Datenbank vorhanden sind. Datenredundanz erhöht die Größe der Datenbank, führt zu Integritätsproblemen, verringert die Effizienz und führt zu Anomalien. Daten sollten so gespeichert werden, dass sie nicht in mehreren Tabellen wiederholt werden.
  • Datensicherheit bezieht sich darauf, wie gut die Daten in der Datenbank vor Abstürzen, Hacks und versehentlichem Löschen geschützt sind.
  • Datenpflege bezieht sich auf monatliche, tägliche oder stündliche Aufgaben, die ausgeführt werden, um Fehler innerhalb einer Datenbank zu beheben und das Auftreten von Anomalien zu verhindern. Die Datenbankpflege behebt nicht nur Fehler, sondern erkennt auch potenzielle Fehler und verhindert, dass zukünftige Fehler auftreten.

Es gibt auch viele Leute, die an der Organisation einer gut geführten Datenbank beteiligt sind. Dies sind:

  • die Entwickler, die die Datenbank entwerfen und entwickeln, um den Anforderungen eines Unternehmens zu entsprechen
  • der Administrator, der:
  • überprüft die Datenbank auf ihre Verwendungen
  • Wer überprüft sie
  • bietet Zugriff auf andere Verwendungen
  • bietet alle anderen Wartungsarbeiten an, die erforderlich sind, um die Datenbank auf dem neuesten Stand zu halten bis heute
  • der Endbenutzer, der die Datenbank verwendet, z. B. Lehrer oder Eltern.
image
Abbildung 2.4: Personen, die an der Organisation einer gut geführten Datenbank beteiligt sind

image Aktivität 2.1

2.1.1 Wählen Sie einen Begriff / Begriff aus SPALTE B, der einer Beschreibung in SPALTE A entspricht. Schreiben Sie nur den Buchstaben neben die Fragennummer (z. B. 5–F).

image

2.1.2 Beschreiben Sie die drei Typen von Personen, die an einer Datenbank beteiligt sind.

2.1.3Listen Sie die fünf Merkmale von Qualitätsdaten auf.

2.1.4Eine Schule möchte eine Datenbank erstellen, die:

  • Informieren Sie die Eltern über die Arbeit, Bewertungen und Schulaktivitäten ihres Kindes
  • Helfen Sie den Lehrern, Arbeiten und Bewertungen aufzuzeichnen
  • Speichern Sie Details zu jedem Kind und seinen Familien.

a. Arbeiten Sie in kleinen Gruppen von vier oder fünf Lernenden. Besprechen Sie jedes Merkmal einer guten Datenbank und erklären Sie diese anhand des obigen Szenarios.

b. Verwenden Sie eine Mindmap, um Ihre Diskussion zu präsentieren.

EINHEIT2.2 Probleme mit Datenbanken

Wenn eine Flat-File-Datenbank schlecht geplant, denormalisiert und inkonsistent ist, führt dies zu Problemen beim Einfügen, Löschen oder Ändern der Datensätze (Tabellen) in der Datenbank. Dies führt zu Anomalien, die den Umgang mit den Daten mit zunehmendem Wachstum der Datenbank immer schwieriger machen. Es macht es auch schwieriger, die Datenintegrität aufrechtzuerhalten. Der Versuch, die Daten konsistent zu machen, sobald eine Anomalie auftritt, kann ziemlich schwierig werden.

Es gibt drei Arten von Problemen, die in Datenbanken auftreten können:

  • Einfügungsanomalie: Die Datenbank wurde so erstellt, dass erforderliche Daten nur hinzugefügt werden können, wenn auch andere nicht verfügbare Daten hinzugefügt werden. Zum Beispiel eine Krankenhausdatenbank, in der die Details eines neuen Mitglieds erst gespeichert werden können, wenn dieses Mitglied von einem Arzt gesehen wurde.
  • Löschanomalie: Die legitime Löschung eines Datensatzes kann zur Löschung einiger erforderlicher Daten führen. Wenn Sie beispielsweise einige Patientendaten löschen, können alle Patientendaten aus der Krankenhausdatenbank entfernt werden.
  • Modifikationsanomalie: Möglicherweise müssen falsche Daten geändert werden, was dazu führen kann, dass viele Datensätze geändert werden müssen, was dazu führen kann, dass einige Änderungen falsch vorgenommen werden.

Beispiel 2.1 Probleme, die in einer Datenbank auftreten

Sehen Sie sich beispielsweise das folgende Schema an, das Informationen zu einer Schule darstellt:

AccountInfo

image

Probleme:

  • Datenredundanz: Datenredundanz bezieht sich auf das Speichern genau derselben Daten an verschiedenen Stellen in einer Datenbank. Datenredundanz erhöht die Größe Ihrer Datenbank, führt zu Integritätsproblemen, verringert die Effizienz der Datenbank und kann zu Datenbankanomalien führen. Daten sollten so gespeichert werden, dass sie nicht in mehreren Tabellen wiederholt werden. Die Familie kann als eine Einheit dargestellt werden.
  • Update-Anomalie: Daten sind inkonsistent, wenn eine Entität aktualisiert wird, z. B. wenn sich die Familienadresse ändert, muss der Data Capturer alle vier Entitäten ändern.
  • Einige Informationen können nicht dargestellt werden: die Schule kann keine Informationen über Lernende speichern, die auf der Warteliste stehen, da sie kein Konto bei der Schule haben.
  • Löschanomalie: Durch die Schließung des Kontos für ein Kind werden alle Daten des zweiten Kindes aus der Datenbank entfernt.

image Aktivität 2.2

2.2.1 Listen Sie die drei Arten von Anomalien auf und geben Sie für jede ein Beispiel an.

2.2.2Sehen Sie sich das folgende Schema an, das Informationen zu einem Krankenhaus darstellt:

Kontoinfo

image

Listen Sie mindestens vier Anomalien mit dieser Datenbank auf und erklären Sie sie.

UNIT2.3 So beseitigen Sie Anomalien

Um Anomalien zu vermeiden, müssen Sie die Datenbank normalisieren, indem Sie die Daten effizient in einer Datenbank organisieren.
Laut Edgar F Codd, dem Erfinder relationaler Datenbanken, umfassen die Ziele der Normalisierung:

  • Entfernen aller redundanten (oder wiederholten) Daten aus der Datenbank
  • Entfernen unerwünschter Einfügungen, Aktualisierungen und Löschabhängigkeiten
  • Verringerung der Notwendigkeit, die gesamte Datenbank jedes Mal neu zu strukturieren, wenn neue Felder hinzugefügt werden
  • die Beziehungen zwischen Tabellen nützlicher und verständlicher machen.

Normalisierung ist ein systematischer Ansatz zum Zerlegen von Tabellen, um Datenredundanz und Anomalien beim Einfügen, Ändern und Löschen zu beseitigen. Der Datenbankdesigner strukturiert die Daten so, dass unnötige Duplikate vermieden werden und ein schneller Suchpfad zu allen erforderlichen Informationen bereitgestellt wird. Es ist ein mehrstufiger Prozess, der Daten in tabellarische Form bringt und doppelte Daten aus den Beziehungstabellen entfernt. Dieser Prozess des Spezifizierens und Definierens von Tabellen, Schlüsseln, Spalten und Beziehungen, um eine effiziente Datenbank zu erstellen, wird als Normalisierung bezeichnet.

Durch die Normalisierung wird der Speicherplatz einer Datenbank reduziert und sichergestellt, dass Daten effizient gespeichert werden. Ohne Normalisierung können Datenbanksysteme ungenau, langsam und ineffizient sein. Sie produzieren möglicherweise nicht die Daten, die Sie erwarten.

In der Praxis bedeutet dies, Ihre Datenbank so zu ändern, dass die folgenden Anforderungen erfüllt sind:

  • jede Tabelle muss einen Primärschlüssel haben
  • Jeder Datensatz sollte einwertige Attribute / Spalten (atomar) haben
  • Es sollte keine sich wiederholenden Informationsgruppen geben.

Schlüssel werden verwendet, um Beziehungen zwischen Tabellen herzustellen und zu identifizieren und um jeden Datensatz oder jede Datenzeile in einer Tabelle eindeutig zu identifizieren. Ein Schlüssel kann ein einzelnes Attribut oder eine Gruppe von Attributen (compositeprimary key) sein, wobei die Kombination als Schlüssel fungieren kann. Schlüssel helfen uns, jede Datenzeile zu identifizieren.

Beim Entwerfen einer Datenbank sind die vier Arten von Schlüsselfeldern:

  • Primärschlüssel: Das Feld, das vom Datenbankersteller ausgewählt wurde, um jeden Datensatz in einer Tabelle eindeutig zu identifizieren. Zum Beispiel könnte jeder Song in Ihrer Musikdatenbank ein Primärschlüsselfeld namens „song_id“ haben.
  • Alternativer Schlüssel: ein Feld mit eindeutigen Werten, die als Primärschlüssel verwendet werden könnten, aber derzeit nicht als Primärschlüssel festgelegt sind, z. B. artist_id.
  • Fremdschlüssel: Ein Feld, das Werte aus dem Primärschlüsselfeld einer anderen Tabelle enthält. Fremdschlüssel werden verwendet, um die Beziehung zwischen verschiedenen Tabellen anzuzeigen. Zum Beispiel könnte jeder Song in Ihrer Musikdatenbank ein Fremdschlüsselfeld namens „artist_id“ haben, das den Song mit einem bestimmten Künstler in einer „artists“ -Tabelle verknüpft.
  • Zusammengesetzter Schlüssel: eine Kombination aus mehr als einem Feld, das jeden Datensatz in einer Tabelle eindeutig identifiziert, z. B. song_id und artist_id.

Verwenden wir dieses Beispiel, um die vier Haupttypen von Schlüsseln zu verstehen:

image

Normalisierungsregeln sind in die folgenden Normalformen unterteilt:

ERSTE NORMALFORM (1NF)

Damit eine Tabelle die erste Normalform hat, sollte sie den folgenden vier Regeln folgen:

  • Jede Spalte muss ein separates Feld / Attribut haben. Jede Spalte Ihrer Tabelle sollte nicht mehrere Werte enthalten. Stellen Sie sich beispielsweise die Datenbank für Facebook-Statusaktualisierungen vor, insbesondere die Tabelle zu Likes. Damit die Datensätze unteilbar sind, sollte jeder Like in einem separaten Datensatz gespeichert werden. Auf diese Weise wäre jeder Datensatz entweder aufgetreten oder nicht aufgetreten. Es gibt keine Möglichkeit zu sagen, dass nur ein kleiner Teil des Gleichen aufgetreten ist, während ein anderer Teil nicht. Wenn jedoch alle Likes für eine Statusaktualisierung in einem einzigen Datensatz gespeichert sind, wäre der Datensatz teilbar, da es möglich wäre, dass einige der Likes aufgetreten sind, während andere nicht aufgetreten sind.
  • In einer Spalte gespeicherte Werte sollten von derselben Art oder demselben Typ (Domäne) sein. In jeder Spalte müssen die gespeicherten Werte von derselben Art oder demselben Typ sein.
  • Alle Spalten in einer Tabelle sollten eindeutige Namen haben. Jede Spalte in einer Tabelle sollte einen eindeutigen Namen haben, um Verwechslungen beim Abrufen von Daten oder beim Ausführen anderer Vorgänge für die gespeicherten Daten zu vermeiden. Geben Sie beispielsweise den Namen des Kindes und den Namen des Elternteils an.
  • Die Reihenfolge, in der Daten gespeichert werden, spielt keine Rolle. Zum Beispiel

image
  • Die Tabelle entspricht drei der vier Regeln: Die Spaltennamen sind eindeutig, die gespeicherten Daten sind in der richtigen Reihenfolge und es gibt keine verschiedenen Datentypen in den Spalten. Die Lernenden in der Tabelle haben sich jedoch für mehr als ein Fach entschieden. Diese Daten wurden in den Betreff-Namen in einer einzigen Spalte gespeichert. Gemäß 1NF muss jede Spalte einen einzelnen Wert enthalten.

ZWEITE NORMALFORM (2NF)

Für eine Tabelle in der zweiten Normalform:

  • es sollte in der ersten Normalform sein.
  • und es sollte keine partielle Abhängigkeit haben.

Hier hängt ein Attribut in einer Tabelle nur von einem Teil des Primärschlüssels und nicht vom gesamten Schlüssel ab. Beispielsweise zeichnet eine Tabelle die Primärschlüssel als student_id und subject_id jedes Lernenden auf. Nur der Name des Lehrers hängt vom Fach ab. Also, die subject_id und hat nichts mit student_id zu tun.

DRITTE NORMALFORM (3NF)

Eine Tabelle soll in der dritten Normalform sein, wenn:

  • es liegt in der zweiten Normalform vor.
  • es hat keine transitive Abhängigkeit. Transitive Abhängigkeit tritt auf, wenn ein Attribut / Feld von anderen Attributen / Feldern abhängt und nicht vom Primärschlüssel.

Dies ist eine indirekte Beziehung zwischen Werten in derselben Tabelle.

image Aktivität 2.3

2.3.1 Erklären Sie, warum die Normalisierung für eine Datenbank wichtig ist.

2.3.2Wie kann eine Normalisierung erreicht werden?

2.3.3Listen und beschreiben Sie die vier Arten von Schlüsselfeldern, die in einer Datenbank verwendet werden können.

2.3.4Wie würden Sie die folgende Tabelle beheben, um 1N zu erreichen?

image

2.3.5 Nennen Sie Beispiele, die oben nicht erwähnt wurden, für die verschiedenen Schlüsselfelder.

2.3.6Geben Sie anhand der Informationen in der folgenden Tabelle Beispiele für zwei beliebige Schlüssel an.

image

KONSOLIDIERUNGSAKTIVITÄT Kapitel 2: Datenbankdesignkonzepte

1.Wählen Sie die richtige Antwort.

a.Welches der folgenden Szenarien benötigt KEINE Datenbank?

A.Speichern der Anmeldeinformationen aller Google Mail-Konten.

B.Sichern Sie alle Informationen auf Ihrem PC.

C.Speichern aller Webseiten einer Website.

D.Speichern aller Informationen über das Inventar eines Unternehmens.

b.Welche der folgenden Eigenschaften zeichnet eine gute Datenbank aus?

A.Erstellen von Kopien von Daten in einer Datenbank zur Sicherung.

B.Daten und Anwendung verbunden und voneinander abhängig halten.

C.Verhindern des Auftretens von Fehlern in der Datenbank.

D.Speichern von Daten in verschiedenen Formaten.

c.Welche der folgenden Schritte ist erforderlich, um jeden Datensatz in einer Datenbanktabelle anders zu gestalten?

A.Sekundärschlüssel

B.Fremdschlüssel

C.Primärschlüssel

D.Alternativer Schlüssel

2.Listen Sie die vier Arten von Schlüsseln auf, die zum Entwerfen einer Datenbank verwendet werden. Entwerfen Sie eine Tabelle als Beispiel.

3.In datenbankdesign Was sind die Anforderungen für 1NF, 2NF und 3NF?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.