Lucrare Proiectarea Bazelor De Date Distribuite

  • Nota 10.00
  • 0 comentarii
  • Publicat pe 07 August 2021

Descriere Lucrare

EXTRAS DIN DOCUMENT

    Principalul domeniu de utilizare a calculatorului îl reprezintă cel al prelucrării de date. Pe măsură ce societatea se dezvoltă     cresc şi necesităţile de informare ale acesteia, deci creşte şi volumul de date ce trebuie prelucrate. Apare astfel problema memorării acestor date, a prelucrării lor în vederea obţinerii diverselor rezultate solicitate. Acesta este tocmai domeniul bazelor de date.
Termenul de “bază de date” se referă la datele de prelucrat, la modul de organizare a acestora pe suportul fizic de memorare.
Sistemele de Gestiune a Bazelor de Date sunt sisteme informatice specializate în stocarea şi prelucrarea unui volum mare de date, volumul de prelucrări fiind relativ mic.
Un SGBD trebuie să asigure următoarele funcţii elementare relativ la bazele de date:
Definirea, crearea bazei de date;
Introducerea datelor în baza de date (adăugare);
Modificarea unor date deja existente în baza de date;
Ştergerea datelor din baza de date;
Consultarea bazelor de date (interogarea, extragerea informaţiilor);
    Alături de acestea, SGBD-urile mai pot furniza şi alte servicii, cum ar fi:
Suport pentru limbaj de programare;
Interfaţă cât mai atractivă şi performantă, pentru comunicarea cu utilizatorul;
Diferite tehnici avansate de memorare, organizare, accesare a datelor din bazele de date;
Utilitare incorporate: sistem de gestiune a fişierelor, liste şi tabele etc;
Help pentru “ajutarea” utilizatorului în lucrul cu bazele de date etc.
    Apariţia şi răspândirea reţelelor de calculatoare a dus la dezvoltarea într-o nouă direcţie a SGBD-urilor, ele căpătând un caracter multiutilizatori - mai mulţi utilizatori folosesc simultan aceeaşi bază de date. Principalul avantaj al reţelelor a fost eficienţa mult sporită de utilizare a resurselor sistemului de calcul: la o bază de date aflată pe un server central, de obicei foarte puternic, au acces simultan mai mulţi utilizatori, situaţi la distanţă de aceasta, de unde rezultă o bună utilizare a resurselor serverului şi o economie de memorare, datorită memorării unice a bazei de date.
    Domeniul bazelor de date a fost abordat pentru prima dată la începutul anilor ’70. De atunci, cercetările au evoluat atât în partea teoretică cât şi în partea de proiecte pilot. Sistemele comerciale au început să apară de abia în a doua jumătate a anilor ’80. Dar, sistemele existente pe piaţă la ora actuală nu oferă toate facilităţile definite teoretic, sau implementate în proiectul pilot din planul cercetării. Pe plan mondial, cercetările şi realizările din domeniul bazelor de date distribuite şi al proiectelor bazelor de date distribuite sunt avansate atât în mediul  universitar cât şi în mediul industrial.
Bazele de date distribuite reprezintă baze de date logic integrate dar fizic distribuite pe mai multe sisteme de calcul.     Utilizatorul unei asemenea baze de date o vede ca pe o bază de date unică, compactă (nivelul logic), cu toate că, în realitate, ea este distribuită pe mai multe calculatoare legate între ele (nivelul fizic). La nivel statistic aceasta organizare a dus la o creştere substanţială a vitezei de acces la o bază de date într-o reţea de calculatoare. Astfel, anumite date depozitate pe un server local sunt mult mai rapid accesibile decat dacă ele s-ar fi aflat pe un server la distanţă, unde ar fi fost stocată baza de date în îintregime, în cazul nedistribuirii (menţionăm că un factor important care limitează viteza de lucru este transferul de date între calculatoare). Tot datorită distribuirii se măreşte considerabil limita maximă a dimensiunii unei baze de date care nu mai este determinată de capacitatea fizică de memorare a sistemului de calcul.
    Una dintre problemele majore anterioare folosirii sistemelor de baze de date era dorinţa de a integra informaţii într-o întreprindere şi de a obţine centralizarea lor, pentru a controla accesul la acele informaţii. Tehnologia reţelelor promovează un mod de lucru ce acţionează împotriva eforturilor de centralizare. La prima vedere ar putea fi dificil de înţeles cum aceste două curente opuse (bazele de date şi reţelele de calculatoare) pot fi unite ca să se producă o tehnologie cu mult mai puternică şi mai promiţătoare decât fiecare în parte. În tehnologia bazelor de date obiectivul cel mai important este integrarea  nu centralizarea informaţiei. Este important să se înţeleagă că fiecare dintre aceşti termeni nu se implica reciproc. Este posibilă realizarea integrării fără centralizare şi acest lucru este exact ceea ce încearcă să îndeplinească tehnologia bazelor de date distribuite. Bazele de date distribuite reprezintă unul dintre compromisurile cele mai profitabile, păstrând avantajele ambelor abordări.
    Lucrarea de faţă îşi propune să prezinte o alternativă de viziune şi proiectare a unui sistem de gestiune a bazelor de date     distribuite ale cărui scheme şi conexiuni trebuie să emuleze funcţionarea unei prezentări de modă. Lucrarea este structurată pe capitole care reţin atenţia asupra unor aspecte teoretice privind cadrul de abordare şi formalizare a conceptelor cu exemplificări practice care merg până la definirea structurii bazelor de date implicate şi a operaţiilor de manipulare şi de regăsire a datelor. Tehnicile de proiectare a bazelor de date sunt prezentate într-un context distribuit. În general pentru proiectarea bazelor de date distribuite se utilizează metode şi tehnici de proiectare a bazelor de date centralizate. Aspecte de proiectare a fragmentelor, replicare şi localizare sunt lăsate la dispoziţia proiectantului.
    Lucrarea este structurată în patru capitole al căror conţinut este sintetizat În continuare:
    În capitolul 2-Noţiuni generale despre bazele de date distribuite, se prezintă contextul de ansamblu al bazelor de date distribuite. Se definesc conceptele din domeniul bazelor de date distribuite, al fragmentelor acestora, elementele sistemelor bazelor de date distribuite şi structura datelor unei baze de date distribuite. Sunt prezentate de asemenea avantajele şi dezavantajele bazelor de date distribuite.
    În capitolul 3 –Proiectarea bazelor de date distribuite, se expun etapele metodelor de proiectare a bazelor de date distribuite, alternativele proiectării, fragmentarea, replicarea şi localizarea datelor. Corectitudinea acestor procese este asigurată printr-un sistem de reguli bine definite.
    Capitolul 4-Descriera aplicaţiei-sunt prezentate aplicaţiile realizate în cadrul acestei lucrări şi anume: diagrame relaţionale, conceptuale şi chiar programele propriu-zise.
    NOŢIUNI GENERALE DESPRE BAZELE DE DATE DISTRIBUITE
În elucidarea conceptului de bază de date considerăm necesar a se pleca de la abordarea într-o succesiune logică a elementelor ce concură la definirea acestui concept.
Ce sunt de fapt, bazele de date? Ce sunt datele?
Datele reprezintă informaţii în formă numerică care pot fi transmise digital şi care trebuie procesate pentru a deveni relevante. Aceasta înseamnă că pentru ca datele să ajungă într-o formă tabelară sau altă structură de date, ele trebuie culese, procesate şi organizate. Toate aceste operaţii se realizează cu ajutorul calculatorului, iar forma fizică pe care o va îmbrăca o colecţie de date va fi fişierul.
Prin baze de date înţelegem colecţii de date organizate sub formă de fişiere astfel încât să permită căutarea rapidă şi regăsirea de informaţii folosind calculatorul.
SGBD-urile (Sisteme de Gestiune a Bazelor de Date) reprezintă acea categorie de programe software specializate în gestionarea, administrarea şi manipularea unor volume mari de date. De regulă, SGBD-urile moderne dispun de un limbaj de programare de nivel înalt şi sunt integrate într-un mediu de dezvoltare. SGBD-urile sunt utilizate, în principal, de specialişti: de programatori, de proiectanţi şi de arhitecţii bazelor de date. Un SGBDD reprezintă un sistem software care permite gestiunea bazelor de date distribuite şi face bazele de date vizibile tuturor utilizatorilor.
            2.1. BAZELE DE DATE DISTRIBUITE
În ultimii ani, bazele de date distribuite (BDD) au devenit un sector important al prelucrării informaţiei şi se poate anticipa că importanţa lor va creşte rapid. Această tendinţă este motivată atât organizatoric cât şi tehnologic întrucât BDD elimină multe din neajunsurile BD centralizate şi sunt bine venite pentru descentralizarea structurilor organizatorice.
Prelucrarea distribuită a datelor presupune executarea unor anumite task-uri de către mai multe elemente de prelucrare nu neapărat omogene dar care sunt interconectate printr-o reţea de calculatoare. Elementele de prelucrare pot fi dispozitive de calcul care pot executa independent un program.
Din punctul de vedere al distribuirii informaţiilor în reţea, cel mai adecvat sistem este SGBDD (Sistemul de Gestiune a Bazelor de Date Distribuite) care combină tehnologia sistemelor de baze de date cu tehnologia reţelelor de calculatoare. Aceasta înseamnă că informaţiile sunt prelucrate distribuit şi deci, accesul la bazele de date se va face descentralizat.
 Descentralizarea accesului la date se poate defini prin faptul că o BD este accesată multilateral în cadrul unui proces de negociere (deciziile de utilizare a datelor se iau pe baza punerii de acord a mai multor utilizatori).
Din punctul de vedere al bazelor de date distribuite o importanţă deosebită o are, evident distribuirea elementelor de prelucrare, distribuirea funcţiilor sistemului de operare destinate diferitelor componente software şi hardware, distribuirea datelor care pot fi folosite de mai multe aplicaţii de pe staţii diferite şi distribuirea controlului executării task-urilor, adică realizarea lor de către mai multe computere din reţea. Prin această reorganizare a modului de lucru cu datele, sistemele de baze de date distribuite pot face prelucrarea informaţiilor multa mai rapidă, mai eficientă şi mai puţin costisitoare.
În concluzie, se poate spune că o bază de date distribuită  este o colecţie de date corelate logic, dar distribuite fizic într-o reţea de calculatoare, împreună cu un mecanism de acces care face această colecţie transparentă utilizatorilor.
 Corelarea logică presupune că, fişierele bazelor de date trebuie să aibă aceeaşi structură şi că accesul la date se face printr-o interfaţă comună. Din punct de vedere al utilizatorului există o singură bază de date cu care utilizatorul interacţionează la fel ca şi în cazul bazelor de date centralizate (BDC).
Distribuirea fizică se referă la partiţionarea fizică a bazei de date pe staţiile unei reţele de calculatoare.
O BDD se deosebeşte de un set de BD locale prin existenţa unor aplicaţii care accesează date din mai multe staţii. Aceste aplicaţii sunt numite aplicaţii globale sau aplicaţii distribuite.
Putem însuma consideraţiile pe care le-am făcut într-o definiţie de lucru.
O BDD reprezintă o colecţie de date integrate din punct de vedere logic care sunt fizic distribuite pe staţii ale unei reţele de calculatoare. Fiecare staţie a reţelei are autonomie de prelucrare care îi permite să realizeze aplicaţii locale. De asemenea, fiecare staţie participă la execuţia aplicaţiilor globale care necesită accesarea datelor din mai multe staţii.
BDD nu sunt simple implementări ale bazelor de date centralizate, ele impun proiectarea unor sisteme care prezintă obiective comune cu sistemele centralizate dar şi specifice. În acest sens este interesant de a compara obiectivele tipice ale BD tradiţionale cu cele corespunzătoare ale BDD.
Obiectivele BD tradiţionale se referă la: controlul centralizat, independenţa datelor, redundanţa minimă şi controlată a datelor, accesul eficient şi, nu în ultimul rând, integritatea, securitatea şi siguranţa datelor.
Controlul centralizat . Posibilitatea de a realiza un control centralizat asupra resurselor informaţionale ale unei întreprinderi sau structuri organizatorice a fost considerată una din cele mai puternice motivaţii pentru introducerea BD. Funcţia fundamentală a administratorului BD este de a garanta protecţia şi siguranţa datelor; datele în sine fiind recunoscute ca o investiţie importantă a întreprinderilor care necesită un control centralizat.
În cazul BDD ideea controlului centralizat este puţin mai accentuată. Acest lucru depinde şi de arhitectură. În general, putem să identificăm o structură de control ierarhic bazată pe un administrator global care are responsabilitatea centrală a întregii BDD şi pe administratorii locali cărora le revin responsabilităţi legate de BD locale. Administratorii locali pot avea un grad înalt de autonomie care poate merge până la realizarea coordonării între staţii. BDD diferă foarte mult în ceea ce priveşte autonomia staţiilor de la autonomia completă a staţiilor, fără existenţa administratorului global, până la cel mai complet control centralizat.
Independenţa datelor. Reprezintă imunitatea aplicaţiilor utilizatorilor la schimbările în definirea şi organizarea datelor şi vice versa. Definirea datelor se face prin definirea structurii logice şi fizice a datelor, şi deci vom avea două tipuri de independenţă a datelor: independenţa logică şi independenţa fizică.
Independenţa logică a datelor reprezintă imunitatea aplicaţiilor utilizatorilor la schimbările în structura logică a datelor.
Independenţa fizică a datelor se referă la ascunderea detaliilor structurii de stocare a datelor, care pot fi organizate diferit (cu acces secvenţial sau aleator) sau stocate pe diferite tipuri de discuri. În scrierea aplicaţiilor utilizatorii nu ar trebui, deci să se preocupe de organizarea fizică a datelor.

CUPRINS

1. Introducere 3
2. Noţiuni generale despre bazele de date distribuite 6
2.1. Bazele de date distribuite 6
2.1.1. Avantajele şi dezavantajele bazelor de date 
Distribuite 10
2.2. Sisteme de gestiune a bazelor de date distribuite 12
2.2.1. Definiţii, funcţii, caracteristici 12
                    2.2.2. Arhitectura de referinţă a SGBDD 14
3. Proiectarea bazelor de date distribuite 15
3.1. Modelarea Top-Down 15
3.2. Modelarea Bottom-Up 18
          3.3.    Fragmentarea 18
                    3.3.1. Reguli de corectitudine ale fragmnetării 23
                    3.3.2. Fragmentarea orizontală 24
                              3.3.2.1. Fragmentarea orizontală primară 27
                              3.3.2.2. Fragmentarea orizontală derivată 34
                    3.3.3. Fragmentarea verticală 38
                    3.3.4. Alocarea 48
4.       Descrierea aplicaţiei 53
4.1.    Diagrama entitate-relaţie, formularea problemei 53
          4.2.    Diagrama conceptuală 56
Bibliografie 62
Descarca lucrare