februari 22, 2022

Wiskunde

image HOOFDSTUK OVERZICHT

Unit 2.1 Kenmerken van een goede database
Eenheid 2.2 Problemen met databases
Eenheid 2.3 Hoe om zich te ontdoen van onregelmatigheden

image leerresultaten

Aan het einde van dit hoofdstuk moet u in staat zijn om:

  • geef de kenmerken van een goede database
  • beschrijf de problemen met databases
  • leg normalisatie en het proces uit.

inleiding

gegevens worden opgeslagen in tabellen in een database. Het kan worden opgeslagen in een enkele tabel (genaamd een platte database – Zoals weergegeven in Figuur 2.1) of in meerdere verbonden tabellen (genaamd een relationele database – Zoals weergegeven in Figuur 2.2).

image
figuur 2.1: gegevens opgeslagen in een enkele tabel in een platte database
image
figuur 2.2: Gegevens in meerdere tabellen in een relationele database

image
Nieuwe woorden

veld – een enkele bit van Informatie over een persoon of een item, bijvoorbeeld leeftijd

opnemen – een groep van gerelateerde velden over een item of een persoon die is vastgelegd in de tabel

Primaire sleutel – een veld dat heeft een unieke identificatie voor elke record in de database (Unieke betekent dat er slechts één in zijn soort)

Elke tabel bestaat uit velden en records. Velden zijn de categorieën waarvoor u gegevens wilt opslaan. De bovenstaande muziektabel bevat bijvoorbeeld velden als titel, artiest, duur en Album. Records verwijzen naar de feitelijke gegevens die worden vastgelegd, waarbij elke record de gegevens van een enkel item bevat. Bijvoorbeeld, in de Songtabel, elk record vertegenwoordigt een enkel nummer, met alle informatie (zoals artiest en duur) gerelateerd aan dat nummer.

elke tabel kan een verplicht veld hebben, een primaire sleutel genaamd, dat een unieke identificatiecode bevat voor elke record in de database. Hiermee kunt u naar een bepaald record op een tabel verwijzen op een zodanige manier dat het slechts naar één item kan verwijzen. Hoewel het mogelijk is om een bestaand veld van een tabel een sleutelveld te maken, maken databasemakers meestal een nieuw veld speciaal voor dit doel. Hierdoor kunnen ze ervoor zorgen dat er geen duplicaten zijn.

soms zijn er anomalieën met databases, u zult leren hoe u zich van deze anomalieën kunt ontdoen.

in dit hoofdstuk zal u een relationele database ontwerpen en aanmaken. Soms zijn er anomalieën met databases, je leert hoe je van deze af te komen en normalisering te bereiken.

DATABASES in een notendop

gegevens worden in principe opgeslagen in 1s en 0s. De computer moet nog weten hoe deze 1 ’s en 0′ s zijn georganiseerd en hoe ze moeten worden geïnterpreteerd. Om dit te doen, maken computers gebruik van datastructuren die een specifieke volgorde beschrijven voor gegevens die moeten worden georganiseerd. Dit staat de computer toe om te begrijpen hoe de verschillende bits van gegevens worden gerelateerd en om de gegevens correct te interpreteren.

we weten dat elke letter in het alfabet een teken vertegenwoordigt. Als je genoeg karakters bij elkaar optelt, vormen ze een woord (zoals ‘oranje’ of ‘liefde’) dat een concept voorstelt. Daarom, waardoor de communicatie van nuttige informatie tussen twee of meer mensen – zelfs over afstanden.

om gegevens en instructies te communiceren, worden gegevens zoals cijfers, letters, tekens, speciaal symbool, geluiden/fonieken en afbeeldingen omgezet in een voor de computer leesbare vorm (binair). Zodra de verwerking van deze gegevens is voltooid, wordt deze omgezet in menselijk leesbaar formaat, de verwerkte gegevens worden zinvolle informatie. De informatie wordt kennis en kan worden begrepen en gebruikt door mensen voor verschillende doeleinden.

activiteit 2.1 Revisieactiviteit

2.1.1 leg In je eigen woorden uit wat een database is en waarvoor het kan worden gebruikt. Geef een voorbeeld om uw antwoord te ondersteunen.

2.1.2 waar of niet waar: een datawarehouse gebruikt transactiegegevens uit verschillende bronnen en maakt analytisch gebruik van de gegevens.

2.1.3 vul de blanco ‘ s in door de juiste term uit onderstaande lijst te kiezen:

a. gegevens worden opgeslagen in ____________ in een database.

b.een enkel beetje informatie over een item of persoon is een ________.

c.Wanneer veel gerelateerde velden over een Item worden samengesteld de vorm a ___________.

d. A ___________ sleutel bevat unieke identifiers voor elke record in een database.

e. een database is ontworpen om op te slaan _____________ transacties terwijl een gegevens ______________ slaat een grote hoeveelheid historische gegevens op.

f. A ______________database slaat gegevens op in meerdere tabellen.

UNIT2.1 Kenmerken van een goede database

alle goede databases moeten beginnen met waardevolle metagegevens en gegevens. In Hoofdstuk 1 hebben we gekeken naar de kenmerken van waardevolle gegevens en hoe die gegevens te beheren. Deze zijn weergegeven in Figuur 2.3 hieronder:

image
figuur 2.3: hoe te beheren waardevolle database

laten we nu kijken naar de kenmerken van een goede database:

  • de databank moet sterk genoeg zijn om alle relevante gegevens en vereisten op te slaan.
  • moet in staat zijn de tabellen in de database te relateren door middel van een relatie, bijvoorbeeld, een werknemer werkt voor een afdeling, zodat de werknemer is gerelateerd aan een bepaalde afdeling. We moeten een dergelijke relatie tussen twee entiteiten in de database kunnen definiëren.
  • meerdere gebruikers moeten toegang hebben tot dezelfde database, zonder de andere gebruiker te beïnvloeden. Zo kunnen verschillende leraren aan een database werken om de cijfers van de leerlingen tegelijkertijd bij te werken. Leraren moeten ook de mogelijkheid krijgen om de cijfers voor hun vakken bij te werken, zonder andere vakken te wijzigen.
  • een enkele database biedt verschillende weergaven voor verschillende gebruikers, het ondersteunt meerdere weergaven voor de gebruiker, afhankelijk van zijn rol. In een schooldatabank kunnen leraren bijvoorbeeld de uitsplitsing van de cijfers van de leerlingen zien; ouders kunnen echter alleen het verslag van hun kind zien-dus de toegang van de ouders zou alleen gelezen worden. Tegelijkertijd krijgen leraren toegang tot alle informatie en beoordelingsgegevens van de leerlingen met wijzigingsrechten. Dit alles kan gebeuren in dezelfde database.
  • data-integriteit verwijst naar hoe nauwkeurig en consistent de gegevens in een database zijn. Databases met veel ontbrekende informatie en onjuiste informatie wordt gezegd dat lage gegevensintegriteit hebben.
  • Gegevensonafhankelijkheid verwijst naar de scheiding tussen gegevens en de toepassing (of toepassingen) waarin deze wordt gebruikt. Hiermee kunt u de gegevens in uw applicatie bijwerken (zoals het repareren van een spelfout)zonder dat u de hele applicatie opnieuw hoeft te compileren.
  • gegevensredundantie verwijst naar het hebben van exact dezelfde gegevens op verschillende plaatsen in de database. Gegevensredundantie vergroot de omvang van de database, creëert Integriteitsproblemen, vermindert de efficiëntie en leidt tot anomalieën. Gegevens moeten zo worden opgeslagen dat ze niet in meerdere tabellen worden herhaald.
  • gegevensbeveiliging verwijst naar hoe goed de gegevens in de database beschermd zijn tegen crashes, hacks en accidentale verwijdering.
  • gegevensonderhoud verwijst naar maandelijkse, dagelijkse of uurwerktaken die worden uitgevoerd om fouten in een databank op te lossen en anomalieën te voorkomen. Database-onderhoud lost niet alleen fouten op,maar detecteert ook potentiële fouten en voorkomt toekomstige fouten.

er zijn ook veel mensen betrokken bij het opzetten van een goed beheerde database. Deze zijn:

  • de ontwikkelaars, die de database ontwerpen en ontwikkelen om tegemoet te komen aan de behoeften van een onderneming
  • de beheerder, who:
  • controleert de database op zijn gebruik
  • wie controleert de database
  • geeft toegang tot andere toepassingen
  • levert alle andere onderhoudswerkzaamheden die nodig zijn om de database up-to-date te houden
  • de eindgebruiker, die de database gebruikt, voor bijvoorbeeld leraren of ouders.
image
figuur 2.4: mensen die betrokken zijn bij het opzetten van een goed beheerde database

image activiteit 2.1

2.1.1 Kies een term/concept uit kolom B die overeenkomt met een beschrijving in kolom A. schrijf alleen de letter naast het vraagnummer (bijvoorbeeld 5–F).

image

2.1.2 Beschrijf de drie soorten mensen die betrokken zijn bij een database.

2.1.3 Geef een overzicht van de vijf kenmerken van kwaliteitsgegevens.

2.1.4 een school wil graag een database aanmaken die:

  • de ouders op de hoogte houden van de academici, beoordelingen en schoolactiviteiten van hun kind
  • de leerkrachten helpen werk en beoordelingen
  • de gegevens van elk kind en hun gezin op te slaan.

a. werken in kleine groepen van vier of vijf lerenden. Bespreek elk kenmerk van een goede database en leg deze verwijzend naar het bovenstaande scenario.

b. Gebruik een mindmap om uw discussie te presenteren.

EENHEID2.2 problemen met Databases

als een database met platte bestanden slecht gepland, gedenormaliseerd en inconsistent is, zal dit problemen veroorzaken bij het invoegen, verwijderen of wijzigen van records (tabellen) in de database. Dit veroorzaakt anomalieën, die het omgaan met de gegevens steeds moeilijker maken naarmate de database groeit. Het maakt ook de data-integriteit moeilijker te onderhouden. Proberen om de gegevens consistent te maken zodra een anomalie optreedt kan heel moeilijk worden.

er zijn drie soorten problemen die zich kunnen voordoen in databases:

  • invoeging-anomalie: De database is zo gemaakt dat de vereiste gegevens niet kunnen worden toegevoegd, tenzij er ook nog een stuk niet-beschikbare gegevens wordt toegevoegd. Bijvoorbeeld een ziekenhuisdatabase die de gegevens van een nieuw lid niet kan opslaan totdat dat lid door een arts is gezien.
  • Verwijderingsanomalie: de legitieme verwijdering van een gegevensbestand kan ertoe leiden dat sommige vereiste gegevens worden verwijderd. Het verwijderen van sommige gegevens van de patiënt kan bijvoorbeeld alle gegevens van de patiënt uit de ziekenhuisdatabase verwijderen.
  • wijzigingsanomalie: Het kan zijn dat onjuiste gegevens moeten worden gewijzigd, wat kan betekenen dat veel records moeten worden gewijzigd, wat kan leiden tot de mogelijkheid dat sommige wijzigingen verkeerd worden aangebracht.

voorbeeld 2.1 problemen die voorkomen in een database

kijk bijvoorbeeld naar het onderstaande schema dat informatie met betrekking tot een school weergeeft:

AccountInfo

image

problemen:

  • gegevensredundantie: gegevensredundantie verwijst naar het opslaan van exact dezelfde gegevens op verschillende plaatsen in een database. Data redundantie verhoogt de omvang van uw database, creëert integriteitsproblemen, vermindert de efficiëntie van de database en kan leiden tot database anomalieën. Gegevens moeten zo worden opgeslagen dat ze niet in meerdere tabellen worden herhaald. De familie kan worden weergegeven als een eenheid.
  • anomalie bijwerken: gegevens zijn inconsistent als één entiteit wordt bijgewerkt, bijvoorbeeld als het familieadres verandert, moet de data capturer alle vier entiteiten wijzigen.
  • kan bepaalde informatie niet weergeven: de school kan geen informatie bewaren over leerlingen die op de wachtlijst staan omdat ze geen account bij de school hebben.
  • Verwijderingsanomalie: het afsluiten van het account voor één kind zal alle gegevens van het tweede kind uit de database verwijderen.

image activiteit 2.2

2.2.1 vermeld de drie soorten anomalieën en geef een voorbeeld voor elk ervan.

2.2.2 Kijk naar het onderstaande schema dat informatie met betrekking tot een ziekenhuis weergeeft:

AccountInfo

image

lijst en verklaar ten minste vier anomalieën met deze database.

UNIT2. 3 Hoe zich te ontdoen van anomalieën

om anomalieën te voorkomen moet u de database normaliseren door de gegevens efficiënt in een database te organiseren.
volgens Edgar F Codd, de uitvinder van relationele databases, omvatten de doelstellingen van normalisatie::

  • het verwijderen van alle overbodige (of herhaalde) gegevens uit de database
  • het verwijderen van ongewenste inserties, updates en verwijderingsafhankelijkheden
  • het verminderen van de noodzaak om de hele database te herstructureren telkens er nieuwe velden aan worden toegevoegd
  • waardoor de relaties tussen tabellen nuttiger en begrijpelijker worden.

normalisatie is een systematische aanpak van het ontbinden van tabellen om gegevensredundantie en invoeging, wijziging en verwijdering anomalieën te elimineren. De database designer structureert de gegevens op een manier die onnodige duplicatie(s) elimineert en zorgt voor een snel zoekpad naar alle benodigde informatie. Het is een meerstapsproces dat gegevens in tabelvorm plaatst, waarbij dubbele gegevens uit de relatietabellen worden verwijderd. Dit proces van het specificeren en definiëren van tabellen, sleutels, kolommen en relaties om een efficiënte database te creëren wordt normalisatie genoemd.

normalisatie zal de hoeveelheid ruimte die een database gebruikt verminderen en ervoor zorgen dat gegevens efficiënt worden opgeslagen. Zonder normalisatie kunnen databasesystemen onnauwkeurig, traag en inefficiënt zijn. Ze produceren misschien niet de gegevens die je verwacht.

in de praktijk betekent dit dat uw database zodanig moet worden gewijzigd dat aan de volgende vereisten wordt voldaan::

  • elke tabel moet een primaire sleutel hebben
  • elke record moet enkelvoudige gewaardeerde attributen / kolommen (atomair)
  • er mogen geen herhalingsgroepen van informatie zijn.

sleutels worden gebruikt om relaties tussen tabellen vast te stellen en te identificeren en ook om een record of Rij gegevens binnen een tabel uniek te identificeren. Een sleutel kan een enkel attribuut of een groep attributen zijn (compositeprimary key), waarbij de combinatie als een sleutel kan fungeren. Sleutels helpen ons om een Rij gegevens te identificeren.

bij het ontwerpen van een database zijn de vier typen sleutelvelden::

  • primaire sleutel: het veld dat door de maker van de database is geselecteerd om elk record op een unieke manier op een tabel te identificeren. Bijvoorbeeld, elk nummer in uw muziek database kan een primaire sleutel veld genaamd hebben “song_id”.
  • alternatieve sleutel: een veld dat unieke waarden bevat die als primaire sleutel gebruikt kunnen worden, maar momenteel niet als primaire sleutel is ingesteld, bijvoorbeeld artist_id.
  • vreemde sleutel: een veld met waarden uit het primaire sleutelveld van een andere tabel. Buitenlandse sleutels worden gebruikt om de relatie tussen verschillende tabellen te tonen. Bijvoorbeeld, elk nummer in uw muziekdatabase kan een buitenlands sleutelveld hebben genaamd “artist_id” dat het nummer koppelt aan een specifieke artiest op een “artists” tabel.
  • samengestelde sleutel: een combinatie van meer dan één veld dat elk record op een tabel uniek identificeert, bijvoorbeeld song_id en artist_id.

Laten we dit voorbeeld gebruiken om te begrijpen van de vier belangrijkste soorten toetsen:

image

Normalisering regels zijn onderverdeeld in de volgende normale vormen:

EERSTE normaalvorm (1NF)

Voor een tabel met in de Eerste normaalvorm, moet u de volgende vier regels:

  • Elke kolom moet een apart veld/attribuut. Elke kolom van uw tabel mag niet meerdere waarden bevatten. Bijvoorbeeld, stel je de database voor Facebook status updates, in het bijzonder de tabel met betrekking tot likes. Om de records ondeelbaar te maken, moet elke like worden opgeslagen in een aparte record. Op deze manier zou elke record hebben plaatsgevonden of niet hebben plaatsgevonden. Er is geen manier om te zeggen dat slechts een klein deel van het soortgelijke gebeurde, terwijl een ander deel dat niet deed. Echter, als alle likes voor een statusupdate in een enkel record worden opgeslagen, dan is het record deelbaar, omdat het mogelijk zou zijn dat sommige likes hebben plaatsgevonden terwijl andere niet hebben plaatsgevonden.
  • in een kolom opgeslagen waarden moeten van dezelfde soort of hetzelfde type (domein) zijn. In elke kolom moeten de opgeslagen waarden van dezelfde soort of hetzelfde type zijn.
  • alle kolommen in een tabel moeten unieke namen hebben. Elke kolom in een tabel moet een unieke naam hebben om verwarring te voorkomen op het moment van het ophalen van gegevens of het uitvoeren van een andere bewerking op de opgeslagen gegevens. Geef bijvoorbeeld de naam van het kind en de naam van de ouder op, Gebruik geen ‘naam’.
  • de volgorde waarin de gegevens worden opgeslagen, doet er niet toe. Bijvoorbeeld:

image
  • de tabel voldoet aan drie van de vier regels: de kolomnamen zijn uniek, de opgeslagen gegevens zijn in de juiste volgorde en er zijn geen onderling gemengde verschillende soorten gegevens in de kolommen. De cursisten in de tabel hebben echter gekozen voor meer dan één vak. Deze gegevens zijn opgeslagen in de onderwerpnamen in één kolom. Volgens de 1NF moet elke kolom een enkele waarde bevatten.

tweede normale vorm (2NF)

voor een tabel in de tweede normale vorm:

  • in de eerste normale vorm.
  • en het mag geen gedeeltelijke afhankelijkheid hebben.

Dit is waar een attribuut in een tabel afhankelijk is van slechts een deel van de primaire sleutel en niet van de hele sleutel. Bijvoorbeeld, een tabel registreert de primaire sleutels als student_id en de subject_id van elke leerling. Alleen de naam van de leraar hangt af van het onderwerp. Dus, de subject_id, en heeft niets te maken met student_id.

derde normale vorm (3NF)

een tabel zou in de derde normale vorm zijn wanneer:

  • het is in de tweede normale vorm.
  • het heeft geen transitieve afhankelijkheid. Transitieve afhankelijkheid treedt op wanneer een attribuut / veld afhankelijk is van andere attributen/velden in plaats van afhankelijk van de primaire sleutel.

dit is een indirecte relatie tussen waarden in dezelfde tabel.

image activiteit 2.3

2.3.1 leg uit waarom normalisatie belangrijk is voor een database.

2.3.2 Hoe kan normalisatie worden bereikt?

2.3.3 lijst en beschrijf de vier typen sleutelvelden die in een database kunnen worden gebruikt.

2.3.4hoe zou u de onderstaande tabel repareren om 1N te bereiken?

image

2.3.5 geef voorbeelden, niet hierboven vermeld, van de verschillende sleutelvelden.

2.3.6 geef aan de hand van de informatie in onderstaande tabel voorbeelden van twee sleutels.

image

CONSOLIDATIEACTIVITEIT hoofdstuk 2: concepten voor databaseontwerp

1.Kies het juiste antwoord.

A. Voor welke van de volgende scenario ‘ s is geen database nodig?

A. de referenties van alle Gmail-accounts opslaan.

B.Back-up van alle informatie op uw personal computer.

C. alle webpagina ‘ s van een website Opslaan.

D. alle informatie over de bedrijfsinventaris opslaan.

b. welke van de volgende kenmerken is kenmerkend voor een goede database?

A. kopiëren van gegevens in een database voor back-up.

B. gegevens en toepassing onderling verbonden en afhankelijk houden.

C. voorkomen van fouten in de database.

D. gegevens in verschillende formaten opslaan.

c.Welke van de volgende is nodig om elk record in een databasetabel anders te maken?

A. secundaire sleutel

B. buitenlandse sleutel

C. primaire sleutel

D. alternatieve sleutel

2.Geef een lijst van de vier soorten sleutels die worden gebruikt om een database te ontwerpen. Ontwerp een tafel om als voorbeeld te gebruiken.

3.In wat zijn de vereisten voor 1NF, 2NF en 3NF?

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.