matematika
fejezet áttekintés
Unit 2.1 | egy jó adatbázis jellemzői |
Unit 2.2 | adatbázisokkal kapcsolatos problémák |
Unit 2.3 | hogyan lehet megszabadulni az anomáliáktól |
tanulási eredmények
ennek a fejezetnek a végén képesnek kell lennie arra, hogy:
- adja meg a jó adatbázis jellemzőit
- írja le az adatbázisokkal kapcsolatos problémákat
- magyarázza el a normalizálást és a folyamatot.
bevezetés
az adatokat táblázatokban tárolják egy adatbázisban. Tárolható egyetlen táblában (úgynevezett lapos adatbázis – a 2.1.ábrán látható módon) vagy több összekapcsolt táblában (relációs adatbázisnak nevezik – a 2.2. ábrán látható módon).
új szavak
mező-egyetlen bit információ egy személyről vagy egy elemről, például életkor
rekord-kapcsolódó mezők csoportja egy elemről vagy személyről, amelyet a táblázat rögzít
elsődleges kulcs – olyan mező, amely egyedi azonosítót tartalmaz az adatbázis minden egyes rekordjához (az egyedi azt jelenti, hogy csak egy van a maga nemében)
Minden táblázat mezőkből és rekordokból áll. A mezők azok a kategóriák, amelyekhez adatokat szeretne rögzíteni. Például a fenti zenei táblázat olyan mezőket tartalmaz, mint a cím, az előadó, az időtartam és az Album. A rekordok a rögzített tényleges adatokra vonatkoznak, minden rekord egyetlen elem adatait tartalmazza. Például a dal táblázatban minden rekord egyetlen dalt képvisel, az adott dalhoz kapcsolódó összes információval (például előadóval és időtartammal).
minden táblának lehet egy kötelező mezője, az úgynevezett elsődleges kulcs, amely egyedi azonosítót tartalmaz az adatbázis minden rekordjához. Ez lehetővé teszi, hogy egy táblázat egy adott rekordjára hivatkozzon oly módon, hogy csak egy bejegyzésre hivatkozhasson. Bár lehetséges, hogy egy tábla meglévő mezője kulcsmező legyen, az adatbázis-készítők általában egy új mezőt hoznak létre kifejezetten erre a célra. Ez lehetővé teszi számukra, hogy megbizonyosodjanak arról, hogy nincsenek másolatok.
néha vannak anomáliák az adatbázisokkal, megtudhatja, hogyan lehet megszabadulni ezektől az anomáliáktól.
ebben a fejezetben egy relációs adatbázist tervez és hoz létre. Néha anomáliák vannak az adatbázisokkal, megtanulod, hogyan lehet megszabadulni ezektől és elérni a normalizálódást.
adatbázisok dióhéjban
az adatokat alapvetően az 1s és a 0s tárolja. A számítógépnek még mindig tudnia kell, hogyan szerveződnek ezek az 1-es és 0-asok, és hogyan kell értelmezni őket. Ennek érdekében a számítógépek olyan adatstruktúrákat használnak, amelyek leírják a szervezendő adatok meghatározott sorrendjét. Ez lehetővé teszi a számítógép számára, hogy megértse, hogyan kapcsolódnak egymáshoz a különböző bitek, és helyesen értelmezze az adatokat.
tudjuk, hogy az ábécé minden betűje egy karaktert képvisel. Ha elegendő karaktert ad hozzá, akkor egy szót alkotnak (például ‘narancs’ vagy ‘szerelem’), amely egy fogalmat képvisel. Ezért lehetővé teszi a hasznos információk kommunikációját két vagy több ember között – akár távolságokon is.
az adatok és utasítások közléséhez az adatokat, például számokat, betűket, karaktereket, speciális szimbólumokat, hangokat/hangzásokat és képeket számítógéppel olvasható (bináris) formába alakítják át. Miután ezen adatok feldolgozása befejeződött, az ember által olvasható formátumba kerül, a feldolgozott adatok értelmes információvá válnak. Az információ tudássá válik, és az emberek különböző célokra megérthetik és felhasználhatják.
2.tevékenység.1 felülvizsgálati tevékenység
2.1.1 saját szavaival magyarázza el, mi az adatbázis, és mire használható. Adjon példát a válasz alátámasztására.
2.1.2 igaz vagy hamis: az adattárház különböző forrásokból származó tranzakciós adatokat használ fel, és analitikusan használja fel az adatokat.
2.1.3 töltse ki az üres helyeket az alábbi listából a megfelelő kifejezés kiválasztásával:
a. az adatokat ____________ egy adatbázisban.
b.egy elemről vagy személyről egyetlen információ egy________.
c.Ha sok kapcsolódó mezők egy elemet össze az űrlap a ___________.
nap ___________ a kulcs egyedi azonosítókat tartalmaz az adatbázis minden rekordjához.
e. az adatbázis célja, hogy tárolja _____________ tranzakciók, miközben egy adat ______________ nagy mennyiségű történelmi adatot tárol.
f.A ______________az adatbázis több táblában tárolja az adatokat.
UNIT2.1 A jó adatbázis jellemzői
minden jó adatbázisnak értékes metaadatokkal és adatokkal kell kezdődnie. Az 1. fejezetben megvizsgáltuk az értékes adatok jellemzőit és az adatok kezelésének módját. Ezeket az alábbi 2.3. ábra szemlélteti:
nézzük meg most egy jó adatbázis jellemzőit:
- az adatbázisnak elég erősnek kell lennie ahhoz, hogy tárolja az összes vonatkozó adatot és követelményt.
- képesnek kell lennie arra, hogy az adatbázisban lévő táblákat relációval kapcsolja össze, például egy alkalmazott egy részlegnél dolgozik, így az alkalmazott egy adott részleghez kapcsolódik. Meg kell tudnunk határozni egy ilyen kapcsolatot az adatbázis bármely két entitása között.
- több felhasználónak képesnek kell lennie arra, hogy hozzáférjen ugyanahhoz az adatbázishoz, anélkül, hogy befolyásolná a másik felhasználót. Például több tanár is dolgozhat egy adatbázison, hogy egyszerre frissítse a tanulók jegyeit. A tanárok számára lehetővé kell tenni, hogy frissítsék tantárgyaik jegyeit, más tantárgyi jegyek módosítása nélkül.
- egyetlen adatbázis különböző nézeteket biztosít a különböző felhasználók számára, több nézetet támogat a felhasználó számára, szerepétől függően. Egy iskolai adatbázisban például a tanárok láthatják a tanulók jegyeinek bontását; a szülők azonban csak a gyermekük jelentését láthatják-így a szülők hozzáférése csak olvasható lenne. Ugyanakkor a tanárok módosítási joggal férhetnek hozzá a tanulók összes információjához és értékelési részletéhez. Mindez ugyanabban az adatbázisban történhet.
- az adatintegritás azt jelenti, hogy az adatbázisban lévő adatok mennyire pontosak és konzisztensek. A sok hiányzó információt és helytelen információt tartalmazó adatbázisok alacsony adatintegritással rendelkeznek.
- az Adatfüggetlenség az adatok és az alkalmazás (vagy alkalmazások) elválasztását jelenti, amelyben az adatokat használják. Ez lehetővé teszi az alkalmazás adatainak frissítését (például helyesírási hiba kijavítását)anélkül, hogy újra kellene fordítania a teljes alkalmazást.
- az Adatredundancia arra utal, hogy pontosan ugyanazok az adatok vannak az adatbázis különböző helyein. Az adatredundancia növeli az adatbázis méretét, integritási problémákat okoz, csökkenti a hatékonyságot és anomáliákhoz vezet. Az adatokat úgy kell tárolni, hogy azok ne ismétlődjenek meg több táblában.
- az adatbiztonság arra utal, hogy az adatbázisban lévő adatok mennyire védettek az összeomlásoktól, hackektől ésbalesetes törlés.
- az Adatkarbantartás olyan havi, napi vagy óránkénti feladatokra vonatkozik, amelyek az adatbázison belüli hibák kijavítására és az anomáliák előfordulásának megelőzésére szolgálnak. Az adatbázis-karbantartás nem csak a hibákat javítja, hanem a lehetséges hibákat is felismeri, és megakadályozza a jövőbeni hibák előfordulását.
sok ember is részt vesz egy jól működő adatbázis megszervezésében. Ezek a következők:
- a fejlesztők, akik az adatbázist úgy tervezik és fejlesztik, hogy egy vállalkozás igényeit kielégítsék
- az adminisztrátor, aki:
- ellenőrzi az adatbázis használatát
- ki ellenőrzi azt
- hozzáférést biztosít más felhasználásokhoz
- biztosítja az adatbázis karbantartásához szükséges egyéb karbantartási munkákat eddig
- a végfelhasználó, aki az adatbázist használja, például tanárok vagy szülők.
tevékenység 2.1
2.1.1 válasszon egy kifejezést / fogalmat A B oszlopból, amely megfelel az A oszlop leírásának.
2.1.2 ismertesse az adatbázissal foglalkozó három típusú embert.
2.1.3 sorolja fel a minőségi adatok öt jellemzőjét.
2.1.4 egy iskola olyan adatbázist szeretne létrehozni, amely:
- folyamatosan tájékoztassa a szülőket gyermekük tanulmányi eredményeiről, értékeléseiről és iskolai tevékenységeiről
- segítsen a tanároknak feljegyezni a munkát és az értékeléseket
- tárolja az egyes gyermekek és családjaik adatait.
a. négy vagy öt tanulóból álló kis csoportokban dolgozzon. Beszélje meg a jó adatbázis minden jellemzőjét, és magyarázza el ezeket a fenti forgatókönyvre hivatkozva.
b. használja a mindmap bemutatni a vitát.
EGYSÉG2.2 problémák az adatbázisokkal
ha egy sima fájlú adatbázis rosszul van megtervezve, denormalizálva és következetlen, akkor problémákat okoz, amikor megpróbálja beilleszteni, törölni vagy módosítani a rekordokat (táblákat) az adatbázisban. Ez anomáliákat okoz, amelyek az adatbázis növekedésével egyre nehezebbé teszik az adatok kezelését. Ez megnehezíti az adatok integritásának fenntartását is. Az anomália bekövetkezése után az adatok következetessé tétele meglehetősen nehézzé válhat.
háromféle probléma fordulhat elő az adatbázisokban:
- beillesztési anomália: Az adatbázist úgy hozták létre, hogy a szükséges adatokat csak akkor lehet hozzáadni, ha egy másik nem elérhető adatot is hozzáadnak. Például egy kórházi adatbázis, amely nem tudja tárolni egy új tag adatait, amíg az adott tagot orvos nem látja.
- törlési anomália: az adatrekord jogszerű törlése egyes szükséges adatok törlését okozhatja. Például a beteg egyes adatainak törlése eltávolíthatja a beteg összes részletét a kórházi adatbázisból.
- módosítási anomália: Előfordulhat, hogy helytelen adatokat kell megváltoztatni, ami sok rekord megváltoztatását vonhatja maga után, ami bizonyos változtatások helytelen elvégzésének lehetőségéhez vezethet.
2.1. példa az adatbázisban előforduló problémák
nézze meg például az alábbi sémát, amely egy iskolához kapcsolódó információkat képvisel:
AccountInfo
problémák:
- Adatredundancia: az Adatredundancia arra utal, hogy pontosan ugyanazokat az adatokat tárolja az adatbázis különböző helyein. Az adatredundancia növeli az adatbázis méretét, integritási problémákat okoz, csökkenti az adatbázis hatékonyságát, és adatbázis-anomáliákhoz vezethet. Az adatokat úgy kell tárolni, hogy azokat ne lehessen több táblázatban megismételni. A család egy egységként képviselhető.
- frissítési anomália: az adatok inkonzisztensek lesznek, ha egy entitás frissül, például ha a család címe megváltozik, az adatrögzítőnek mind a négy entitást meg kell változtatnia.
- nem lehet megjeleníteni néhány információt: az iskola nem tárolhat információkat a várólistán szereplő tanulókról, mivel nincs számlájuk az iskolánál.
- törlési anomália: az egyik gyermek fiókjának bezárása eltávolítja a második gyermek összes adatait az adatbázisból.
tevékenység 2.2
2.2.1 sorolja fel az anomáliák három típusát, és adjon példát mindegyikre.
2.2.2 nézze meg az alábbi sémát, amely a kórházzal kapcsolatos információkat képviseli:
AccountInfo
sorolja fel és magyarázza meg legalább négy anomáliát ezzel az adatbázissal.
UNIT2.3 Hogyan lehet megszabadulni az anomáliáktól
az anomáliák megelőzése érdekében normalizálni kell az adatbázist az adatok hatékony rendszerezésével egy adatbázisban.
Edgar F Codd, a relációs adatbázisok feltalálója szerint a normalizálás céljai a következők:
- az összes redundáns (vagy ismétlődő) adat eltávolítása az adatbázisból
- a nemkívánatos Beillesztések, frissítések és törlési függőségek eltávolítása
- a teljes adatbázis átalakításának szükségességének csökkentése minden alkalommal, amikor új mezőket adnak hozzá
- a táblák közötti kapcsolatok hasznosabbá és érthetőbbé tétele.
a normalizálás a táblázatok lebontásának szisztematikus megközelítése az adatredundancia, valamint a beillesztési, módosítási és törlési anomáliák kiküszöbölésére. Az adatbázis-tervező úgy strukturálja az adatokat, hogy kiküszöbölje a felesleges duplikációkat, és gyors keresési útvonalat biztosítson az összes szükséges információhoz. Ez egy többlépcsős folyamat, amely az adatokat táblázatos formába helyezi, eltávolítva a duplikált adatokat a relációs táblákból. A táblázatok, kulcsok, oszlopok és kapcsolatok meghatározásának és definiálásának folyamatát egy hatékony adatbázis létrehozása érdekében normalizálásnak nevezzük.
a normalizálás csökkenti az adatbázis által használt terület mennyiségét, és biztosítja az adatok hatékony tárolását. Normalizálás nélkül az adatbázis-rendszerek pontatlanok, lassúak és hatástalanok lehetnek. Lehet, hogy nem hozza létre a várt adatokat.
a gyakorlatban ez azt jelenti, hogy az adatbázist úgy kell megváltoztatni, hogy a következő követelmények teljesüljenek:
- minden táblának elsődleges kulccsal kell rendelkeznie
- minden rekordnak egyetlen értékű attribútummal/oszlopmal kell rendelkeznie (atomi)
- ne legyenek ismétlődő információcsoportok.
a kulcsok a táblák közötti kapcsolatok létrehozására és azonosítására, valamint a táblán belüli bármely rekord vagy adatsor egyedi azonosítására szolgálnak. A kulcs lehet egyetlen attribútum vagy attribútumok csoportja (compositeprimary key), ahol a kombináció kulcsként működhet. A kulcsok segítenek bármilyen adatsor azonosításában.
adatbázis tervezésekor a kulcsmezők négy típusa a következő:
- elsődleges kulcs: az adatbázis létrehozója által kiválasztott mező, amely egyedileg azonosítja az egyes rekordokat egy táblán. Például a zenei adatbázis minden egyes dalának lehet egy elsődleges kulcsmezője, a “song_id”.
- alternatív kulcs: olyan egyedi értékeket tartalmazó mező, amelyek elsődleges kulcsként használhatók, de jelenleg nincsenek elsődleges kulcsként beállítva, például artist_id.
- idegen kulcs: egy másik tábla elsődleges kulcs mezőjének értékeit tartalmazó mező. Az idegen kulcsokat a különböző táblák közötti kapcsolat bemutatására használják. Például a zenei adatbázis minden egyes dalában lehet egy idegen kulcsmező, az úgynevezett “artist_id”, amely összekapcsolja a dalt egy adott előadóval egy” művészek ” táblán.
- összetett kulcs: egynél több mező kombinációja, amely egyedileg azonosítja az egyes rekordokat egy táblán, például song_id és artist_id.
használjuk ezt a példát a kulcsok négy fő típusának megértéséhez:
a normalizálási szabályok A következő normál formákra vannak felosztva:
első normál forma (1NF)
ahhoz, hogy egy táblázat az első normál formában legyen, a következő négy szabályt kell követnie:
- minden oszlopnak külön mezővel / attribútummal kell rendelkeznie. A táblázat minden oszlopa nem tartalmazhat több értéket. Képzelje el például a Facebook állapotfrissítéseinek adatbázisát, különös tekintettel a lájkokkal kapcsolatos táblázatra. Ahhoz, hogy a rekordok oszthatatlanok legyenek, mindegyik hasonlót külön rekordban kell tárolni. Ily módon minden rekord vagy megtörtént, vagy nem történt meg. Nem lehet azt mondani, hogy a hasonlóknak csak egy kis része történt, míg egy másik rész nem. Ha azonban az állapotfrissítés összes kedvelését egyetlen rekord tárolja, akkor a rekord osztható lenne, mivel lehetséges, hogy néhány kedvelés megtörtént, míg mások nem.
- az oszlopban tárolt értékeknek azonos típusúnak vagy típusúnak (tartománynak) kell lenniük. Minden oszlopban a tárolt értékeknek azonos típusúnak vagy típusúnak kell lenniük.
- a táblázat összes oszlopának egyedi névvel kell rendelkeznie. A táblázat minden oszlopának egyedi névvel kell rendelkeznie, hogy elkerülje az összetévesztést az adatok lekérésekor vagy a tárolt adatok bármely más műveletének végrehajtásakor. Adja meg például a gyermek és a szülő nevét, ne használja a ‘nevet’.
- az adatok tárolásának sorrendje nem számít. Például
- a táblázat a négy szabályból három szabálynak felel meg: az oszlopnevek egyediek, a tárolt adatok a megfelelő sorrendben vannak, és az oszlopokban nincsenek keverve különböző típusú adatok. A táblázatban szereplő tanulók azonban egynél több tantárgyat választottak. Ezeket az adatokat a tárgynevek egyetlen oszlopban tárolták. Az 1NF szerint minden oszlopnak egyetlen értéket kell tartalmaznia.
második normál forma (2NF)
ahhoz, hogy egy táblázat a második normál formában legyen:
- az első normál formában kell lennie.
- és nem lehet részleges függősége.
ez az, ahol egy attribútum a táblázatban csak az elsődleges kulcs egy részétől függ, nem pedig az egész kulcstól. Például egy táblázat rögzíti az elsődleges kulcsokat student_id és a subject_id minden tanuló. Csak a tanár neve függ a tantárgytól. Tehát a subject_id, és semmi köze a student_id-hez.
harmadik normál forma (3NF)
azt mondják, hogy egy táblázat a harmadik normál formában van, amikor:
- a második normál formában van.
- nincs tranzitív függősége. Tranzitív függőség akkor fordul elő, amikor egy attribútum/mező más attribútumoktól/mezőktől függ, nem pedig az elsődleges kulcstól.
ez egy közvetett kapcsolat az ugyanazon táblázatban szereplő értékek között.
tevékenység 2.3
2.3.1 magyarázza el, miért fontos az adatbázis normalizálása.
2.3.2 hogyan érhető el a normalizálás?
2.3.3 sorolja fel és írja le az adatbázisban használható kulcsmezők négy típusát.
2.3.4hogyan javítaná az alábbi táblázatot az 1N eléréséhez?
2.3.5 adjon példákat, fent nem említett, a különböző kulcsmezőkről.
2.3.6 az alábbi táblázatban szereplő információk felhasználásával adjon példákat bármelyik két kulcsra.
konszolidációs tevékenység 2. fejezet: adatbázis-tervezési koncepciók
1.Válassza ki a helyes választ.
a. az alábbi forgatókönyvek közül melyiknek nincs szüksége adatbázisra?
A. az összes Gmail-fiók hitelesítő adatainak tárolása.
B.Biztonsági mentés az összes információt a személyi számítógépen.
C. egy weboldal összes weboldalának tárolása.
D. a vállalkozás leltárával kapcsolatos összes információ tárolása.
b. az alábbiak közül melyik a jó adatbázis jellemzője?
A. adatok másolása az adatbázisban biztonsági mentés céljából.
B. Az adatok és alkalmazások összekapcsolása és egymástól való függése.
C. az adatbázisban előforduló hibák megelőzése.
D. adatok tárolása különböző formátumokban.
c.Az alábbiak közül melyik szükséges ahhoz, hogy az adatbázis-tábla minden rekordja eltérő legyen?
A. másodlagos kulcs
B. idegen kulcs
C. elsődleges kulcs
D. alternatív kulcs
2.Sorolja fel az adatbázis tervezéséhez használt négy kulcstípust. Tervezzen egy táblázatot, amelyet példaként használhat.
3.In adatbázis tervezés melyek az 1NF, 2NF és 3NF követelmények?