大家好,關(guān)于數(shù)據(jù)庫的基本概念很多朋友都還不太明白,今天小編就來為大家分享關(guān)于基礎(chǔ)數(shù)據(jù)庫是什么意思的知識,希望對各位有所幫助!
數(shù)據(jù)庫的定義
數(shù)據(jù)庫是用來存放數(shù)據(jù)的倉庫,它的存儲空間很大,可以存放大量數(shù)據(jù)。用戶可以對文件中的數(shù)據(jù)進(jìn)行新增、查詢、更新、刪除等操作。數(shù)據(jù)庫先后經(jīng)歷了多個階段的發(fā)展,數(shù)據(jù)庫技術(shù)在各個方面快速的發(fā)展。數(shù)據(jù)庫也有很多種類型,有最常見的存儲數(shù)據(jù)的表格和能夠進(jìn)行大量數(shù)據(jù)存儲的大數(shù)據(jù)庫系統(tǒng),都在很多方面得到了比較多的應(yīng)用。數(shù)據(jù)庫技術(shù)是各類信息系統(tǒng)的核心部分,是研究和管理的重要技術(shù)手段。常用關(guān)系型數(shù)據(jù)庫產(chǎn)品有Oracle和微軟公司的SQL。
什么是數(shù)據(jù),數(shù)據(jù)庫,數(shù)據(jù)庫管理系統(tǒng),數(shù)據(jù)庫管理員,數(shù)據(jù)庫系統(tǒng)
數(shù)據(jù)是數(shù)據(jù)庫存儲的對象。種類很多,文本、圖形、圖像、音頻、視頻等都是數(shù)據(jù)。數(shù)據(jù)庫是指長期存儲在計算機(jī)內(nèi)的,有組織的,可共享的數(shù)據(jù)集合。數(shù)據(jù)庫管理系統(tǒng)是一類重要的的系統(tǒng)軟件,有一組程序構(gòu)成,其主要功能是完成對數(shù)據(jù)庫中數(shù)據(jù)的定義,數(shù)據(jù)操縱,提供給用戶一個簡明的應(yīng)用接口,實現(xiàn)事務(wù)處理等。數(shù)據(jù)庫系統(tǒng)是由數(shù)據(jù)庫及其管理軟件組成的系統(tǒng)。它是為適應(yīng)數(shù)據(jù)處理的需要而發(fā)展起來的一種較為理想的數(shù)據(jù)處理的核心機(jī)構(gòu)。它是一個實際可運行的存儲、維護(hù)和應(yīng)用系統(tǒng)提供數(shù)據(jù)的軟件系統(tǒng),是存儲介質(zhì)、處理對象和管理系統(tǒng)的集合體。
數(shù)據(jù)庫概念
數(shù)據(jù)庫是用來存放數(shù)據(jù)的倉庫,它的存儲空間很大,可以存放大量數(shù)據(jù)。用戶可以對文件中的數(shù)據(jù)進(jìn)行新增、查詢、更新、刪除等操作。
數(shù)據(jù)庫先后經(jīng)歷了多個階段的發(fā)展,數(shù)據(jù)庫技術(shù)在各個方面快速的發(fā)展。數(shù)據(jù)庫也有很多種類型,有最常見的存儲數(shù)據(jù)的表格和能夠進(jìn)行大量數(shù)據(jù)存儲的大數(shù)據(jù)庫系統(tǒng),都在很多方面得到了比較多的應(yīng)用。數(shù)據(jù)庫技術(shù)是各類信息系統(tǒng)的核心部分,是研究和管理的重要技術(shù)手段。
常用關(guān)系型數(shù)據(jù)庫產(chǎn)品有Oracle和微軟公司的SQL。
什么是數(shù)據(jù)庫信息的概念
數(shù)據(jù)庫信息的概念簡而言之可視為電子化的文件柜——存儲電子文件的處所,用戶可以對文件中的數(shù)據(jù)運行新增、截取、更新、刪除等操作。所謂“數(shù)據(jù)庫”是以一定方式儲存在一起、能與多個用戶共享、具有盡可能小的冗余度、與應(yīng)用程序彼此獨立的數(shù)據(jù)集合。
數(shù)據(jù)庫名詞解釋
數(shù)據(jù)庫的概念:
數(shù)據(jù)庫(Database)是按照數(shù)據(jù)結(jié)構(gòu)來組織、存儲和管理數(shù)據(jù)的倉庫,它產(chǎn)生于距今六十多年前,隨著信息技術(shù)和市場的發(fā)展,特別是二十世紀(jì)九十年代以后,
數(shù)據(jù)管理不再僅僅是存儲和管理數(shù)據(jù),而轉(zhuǎn)變成用戶所需要的各種數(shù)據(jù)管理的方式。數(shù)據(jù)庫有很多種類型,從最簡單的存儲有各種數(shù)據(jù)的表格到能夠進(jìn)行海量數(shù)據(jù)存儲的大型數(shù)據(jù)庫系統(tǒng)都在各個方面得到了廣泛的應(yīng)用。
在信息化社會,充分有效地管理和利用各類信息資源,是進(jìn)行科學(xué)研究和決策管理的前提條件。數(shù)據(jù)庫技術(shù)是管理信息系統(tǒng)、辦公自動化系統(tǒng)、決策支持系統(tǒng)等各類信息系統(tǒng)的核心部分,是進(jìn)行科學(xué)研究和決策管理的重要技術(shù)手段。
數(shù)據(jù)庫的定義:
定義1:數(shù)據(jù)庫(Database)是按照數(shù)據(jù)結(jié)構(gòu)來組織、存儲和管理數(shù)據(jù)的建立在計算機(jī)存儲設(shè)備上的倉庫。
簡單來說是本身可視為電子化的文件柜——存儲電子文件的處所,用戶可以對文件中的數(shù)據(jù)進(jìn)行新增、截取、更新、刪除等操作。
在經(jīng)濟(jì)管理的日常工作中,常常需要把某些相關(guān)的數(shù)據(jù)放進(jìn)這樣的“倉庫”,并根據(jù)管理的需要進(jìn)行相應(yīng)的處理。
例如,企業(yè)或事業(yè)單位的人事部門常常要把本單位職工的基本情況(職工號、姓名、年齡、性別、籍貫、工資、簡歷等)存放在表中,這張表就可以看成是一個數(shù)據(jù)庫。有了這個"數(shù)據(jù)倉庫"我們就可以根據(jù)需要隨時查詢某職工的基本情況,也可以查詢工資在某個范圍內(nèi)的職工人數(shù)等等。這些工作如果都能在計算機(jī)上自動進(jìn)行,那我們的人事管理就可以達(dá)到極高的水平。此外,在財務(wù)管理、倉庫管理、生產(chǎn)管理中也需要建立眾多的這種"數(shù)據(jù)庫",使其可以利用計算機(jī)實現(xiàn)財務(wù)、倉庫、生產(chǎn)的自動化管理。
定義2:
嚴(yán)格來說,數(shù)據(jù)庫是長期儲存在計算機(jī)內(nèi)、有組織的、可共享的數(shù)據(jù)集合。數(shù)據(jù)庫中的數(shù)據(jù)指的是以一定的數(shù)據(jù)模型組織、描述和儲存在一起、具有盡可能小的冗余度、較高的數(shù)據(jù)獨立性和易擴(kuò)展性的特點并可在一定范圍內(nèi)為多個用戶共享。
這種數(shù)據(jù)集合具有如下特點:盡可能不重復(fù),以最優(yōu)方式為某個特定組織的多種應(yīng)用服務(wù),其數(shù)據(jù)結(jié)構(gòu)獨立于使用它的應(yīng)用程序,對數(shù)據(jù)的增、刪、改、查由統(tǒng)一軟件進(jìn)行管理和控制。從發(fā)展的歷史看,數(shù)據(jù)庫是數(shù)據(jù)管理的高級階段,它是由文件管理系統(tǒng)發(fā)展起來的。[1][2]
數(shù)據(jù)庫的處理系統(tǒng):
數(shù)據(jù)庫是一個單位或是一個應(yīng)用領(lǐng)域的通用數(shù)據(jù)處理系統(tǒng),它存儲的是屬于企業(yè)和事業(yè)部門、團(tuán)體和個人的有關(guān)數(shù)據(jù)的集合。數(shù)據(jù)庫中的數(shù)據(jù)是從全局觀點出發(fā)建立的,按一定的數(shù)據(jù)模型進(jìn)行組織、描述和存儲。其結(jié)構(gòu)基于數(shù)據(jù)間的自然聯(lián)系,從而可提供一切必要的存取路徑,且數(shù)據(jù)不再針對某一應(yīng)用,而是面向全組織,具有整體的結(jié)構(gòu)化特征。
數(shù)據(jù)庫中的數(shù)據(jù)是為眾多用戶所共享其信息而建立的,已經(jīng)擺脫了具體程序的限制和制約。不同的用戶可以按各自的用法使用數(shù)據(jù)庫中的數(shù)據(jù);多個用戶可以同時共享數(shù)據(jù)庫中的數(shù)據(jù)資源,即不同的用戶可以同時存取數(shù)據(jù)庫中的同一個數(shù)據(jù)。數(shù)據(jù)共享性不僅滿足了各用戶對信息內(nèi)容的要求,同時也滿足了各用戶之間信息通信的要求。
數(shù)據(jù)庫的基本結(jié)構(gòu):
數(shù)據(jù)庫的基本結(jié)構(gòu)分三個層次,反映了觀察數(shù)據(jù)庫的三種不同角度。
以內(nèi)模式為框架所組成的數(shù)據(jù)庫叫做物理數(shù)據(jù)庫;以概念模式為框架所組成的數(shù)據(jù)叫概念數(shù)據(jù)庫;以外模式為框架所組成的數(shù)據(jù)庫叫用戶數(shù)據(jù)庫。
⑴物理數(shù)據(jù)層。
它是數(shù)據(jù)庫的最內(nèi)層,是物理存貯設(shè)備上實際存儲的數(shù)據(jù)的集合。這些數(shù)據(jù)是原始數(shù)據(jù),是用戶加工的對象,由內(nèi)部模式描述的指令操作處理的位串、字符和字組成。
⑵概念數(shù)據(jù)層。
它是數(shù)據(jù)庫的中間一層,是數(shù)據(jù)庫的整體邏輯表示。指出了每個數(shù)據(jù)的邏輯定義及數(shù)據(jù)間的邏輯聯(lián)系,是存貯記錄的集合。它所涉及的是數(shù)據(jù)庫所有對象的邏輯關(guān)系,而不是它們的物理情況,是數(shù)據(jù)庫管理員概念下的數(shù)據(jù)庫。
⑶用戶數(shù)據(jù)層。
它是用戶所看到和使用的數(shù)據(jù)庫,表示了一個或一些特定用戶使用的數(shù)據(jù)集合,即邏輯記錄的集合。
數(shù)據(jù)庫不同層次之間的聯(lián)系是通過映射進(jìn)行轉(zhuǎn)換的。
數(shù)據(jù)庫的主要特點:
⑴實現(xiàn)數(shù)據(jù)共享
數(shù)據(jù)共享包含所有用戶可同時存取數(shù)據(jù)庫中的數(shù)據(jù),也包括用戶可以用各種方式通過接口使用數(shù)據(jù)庫,并提供數(shù)據(jù)共享。
⑵減少數(shù)據(jù)的冗余度
同文件系統(tǒng)相比,由于數(shù)據(jù)庫實現(xiàn)了數(shù)據(jù)共享,從而避免了用戶各自建立應(yīng)用文件。減少了大量重復(fù)數(shù)據(jù),減少了數(shù)據(jù)冗余,維護(hù)了數(shù)據(jù)的一致性。
⑶數(shù)據(jù)的獨立性
數(shù)據(jù)的獨立性包括邏輯獨立性(數(shù)據(jù)庫中數(shù)據(jù)庫的邏輯結(jié)構(gòu)和應(yīng)用程序相互獨立)和物理獨立性(數(shù)據(jù)物理結(jié)構(gòu)的變化不影響數(shù)據(jù)的邏輯結(jié)構(gòu))。
⑷數(shù)據(jù)實現(xiàn)集中控制
文件管理方式中,數(shù)據(jù)處于一種分散的狀態(tài),不同的用戶或同一用戶在不同處理中其文件之間毫無關(guān)系。利用數(shù)據(jù)庫可對數(shù)據(jù)進(jìn)行集中控制和管理,并通過數(shù)據(jù)模型表示各種數(shù)據(jù)的組織以及數(shù)據(jù)間的聯(lián)系。
⑸數(shù)據(jù)一致性和可維護(hù)性,以確保數(shù)據(jù)的安全性和可靠性
主要包括:①安全性控制:以防止數(shù)據(jù)丟失、錯誤更新和越權(quán)使用;②完整性控制:保證數(shù)據(jù)的正確性、有效性和相容性;③并發(fā)控制:使在同一時間周期內(nèi),允許對數(shù)據(jù)實現(xiàn)多路存取,又能防止用戶之間的不正常交互作用。
⑹故障恢復(fù)
由數(shù)據(jù)庫管理系統(tǒng)提供一套方法,可及時發(fā)現(xiàn)故障和修復(fù)故障,從而防止數(shù)據(jù)被破壞。數(shù)據(jù)庫系統(tǒng)能盡快恢復(fù)數(shù)據(jù)庫系統(tǒng)運行時出現(xiàn)的故障,可能是物理上或是邏輯上的錯誤。比如對系統(tǒng)的誤操作造成的數(shù)據(jù)錯誤等。
數(shù)據(jù)庫的數(shù)據(jù)種類:
數(shù)據(jù)庫通常分為層次式數(shù)據(jù)庫、網(wǎng)絡(luò)式數(shù)據(jù)庫和關(guān)系式數(shù)據(jù)庫三種。而不同的數(shù)據(jù)庫是按不同的數(shù)據(jù)結(jié)構(gòu)來聯(lián)系和組織的。
1.數(shù)據(jù)結(jié)構(gòu)模型
⑴數(shù)據(jù)結(jié)構(gòu)
所謂數(shù)據(jù)結(jié)構(gòu)是指數(shù)據(jù)的組織形式或數(shù)據(jù)之間的聯(lián)系。
如果用D表示數(shù)據(jù),用R表示數(shù)據(jù)對象之間存在的關(guān)系集合,則將DS=(D,R)稱為數(shù)據(jù)結(jié)構(gòu)。
例如,設(shè)有一個電話號碼簿,它記錄了n個人的名字和相應(yīng)的電話號碼。為了方便地查找某人的電話號碼,將人名和號碼按字典順序排列,并在名字的后面跟隨著對應(yīng)的電話號碼。這樣,若要查找某人的電話號碼(假定他的名字的第一個字母是Y),那么只須查找以Y開頭的那些名字就可以了。該例中,數(shù)據(jù)的集合D就是人名和電話號碼,它們之間的聯(lián)系R就是按字典順序的排列,其相應(yīng)的數(shù)據(jù)結(jié)構(gòu)就是DS=(D,R),即一個數(shù)組。
⑵數(shù)據(jù)結(jié)構(gòu)類型
數(shù)據(jù)結(jié)構(gòu)又分為數(shù)據(jù)的邏輯結(jié)構(gòu)和數(shù)據(jù)的物理結(jié)構(gòu)。
數(shù)據(jù)的邏輯結(jié)構(gòu)是從邏輯的角度(即數(shù)據(jù)間的聯(lián)系和組織方式)來觀察數(shù)據(jù),分析數(shù)據(jù),與數(shù)據(jù)的存儲位置無關(guān);數(shù)據(jù)的物理結(jié)構(gòu)是指數(shù)據(jù)在計算機(jī)中存放的結(jié)構(gòu),即數(shù)據(jù)的邏輯結(jié)構(gòu)在計算機(jī)中的實現(xiàn)形式,所以物理結(jié)構(gòu)也被稱為存儲結(jié)構(gòu)。
這里只研究數(shù)據(jù)的邏輯結(jié)構(gòu),并將反映和實現(xiàn)數(shù)據(jù)聯(lián)系的方法稱為數(shù)據(jù)模型。
比較流行的數(shù)據(jù)模型有三種,即按圖論理論建立的層次結(jié)構(gòu)模型和網(wǎng)狀結(jié)構(gòu)模型以及按關(guān)系理論建立的關(guān)系結(jié)構(gòu)模型。
2.層次、網(wǎng)狀和關(guān)系數(shù)據(jù)庫系統(tǒng)
⑴層次結(jié)構(gòu)模型
層次結(jié)構(gòu)模型實質(zhì)上是一種有根結(jié)點的定向有序樹(在數(shù)學(xué)中"樹"被定義為一個無回的連通圖)。下圖是一個高等學(xué)校的組織結(jié)構(gòu)圖。這個組織結(jié)構(gòu)圖像一棵樹,校部就是樹根(稱為根結(jié)點),各系、專業(yè)、教師、學(xué)生等為枝點(稱為結(jié)點),樹根與枝點之間的聯(lián)系稱為邊,樹根與邊之比為1:N,即樹根只有一個,樹枝有N個。
按照層次模型建立的數(shù)據(jù)庫系統(tǒng)稱為層次模型數(shù)據(jù)庫系統(tǒng)。IMS(InformationManagementSystem)是其典型代表。
⑵網(wǎng)狀結(jié)構(gòu)模型
按照網(wǎng)狀數(shù)據(jù)結(jié)構(gòu)建立的數(shù)據(jù)庫系統(tǒng)稱為網(wǎng)狀數(shù)據(jù)庫系統(tǒng),其典型代表是DBTG(DatabaseTaskGroup)。用數(shù)學(xué)方法可將網(wǎng)狀數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)化為層次數(shù)據(jù)結(jié)構(gòu)。
⑶關(guān)系結(jié)構(gòu)模型
關(guān)系式數(shù)據(jù)結(jié)構(gòu)把一些復(fù)雜的數(shù)據(jù)結(jié)構(gòu)歸結(jié)為簡單的二元關(guān)系(即二維表格形式)。例如某單位的職工關(guān)系就是一個二元關(guān)系。
由關(guān)系數(shù)據(jù)結(jié)構(gòu)組成的數(shù)據(jù)庫系統(tǒng)被稱為關(guān)系數(shù)據(jù)庫系統(tǒng)。
在關(guān)系數(shù)據(jù)庫中,對數(shù)據(jù)的操作幾乎全部建立在一個或多個關(guān)系表格上,通過對這些關(guān)系表格的分類、合并、連接或選取等運算來實現(xiàn)數(shù)據(jù)的管理。
dBASEⅡ就是這類數(shù)據(jù)庫管理系統(tǒng)的典型代表。對于一個實際的應(yīng)用問題(如人事管理問題),有時需要多個關(guān)系才能實現(xiàn)。用dBASEⅡ建立起來的一個關(guān)系稱為一個數(shù)據(jù)庫(或稱數(shù)據(jù)庫文件),而把對應(yīng)多個關(guān)系建立起來的多個數(shù)據(jù)庫稱為數(shù)據(jù)庫系統(tǒng)。dBASEⅡ的另一個重要功能是通過建立命令文件來實現(xiàn)對數(shù)據(jù)庫的使用和管理,對于一個數(shù)據(jù)庫系統(tǒng)相應(yīng)的命令序列文件,稱為該數(shù)據(jù)庫的應(yīng)用系統(tǒng)。
因此,可以概括地說,一個關(guān)系稱為一個數(shù)據(jù)庫,若干個數(shù)據(jù)庫可以構(gòu)成一個數(shù)據(jù)庫系統(tǒng)。數(shù)據(jù)庫系統(tǒng)可以派生出各種不同類型的輔助文件和建立它的應(yīng)用系統(tǒng)。
數(shù)據(jù)庫的發(fā)展簡史:
1數(shù)據(jù)庫的技術(shù)發(fā)展
使用計算機(jī)后,隨著數(shù)據(jù)處理量的增長,產(chǎn)生了數(shù)據(jù)管理技術(shù)。數(shù)據(jù)管理技術(shù)的發(fā)展與計算機(jī)硬件(主要是外部存儲器)系統(tǒng)軟件及計算機(jī)應(yīng)用的范圍有著密切的聯(lián)系。數(shù)據(jù)管理技術(shù)的發(fā)展經(jīng)歷了以下四個階段:人工管理階段、文件系統(tǒng)階段、數(shù)據(jù)庫階段和高級數(shù)據(jù)庫技術(shù)階段。
2數(shù)據(jù)管理的誕生
數(shù)據(jù)庫的歷史可以追溯到五十年前,那時的數(shù)據(jù)管理非常簡單。通過大量的分類、比較和表格繪制的機(jī)器運行數(shù)百萬穿孔卡片來進(jìn)行數(shù)據(jù)的處理,其運行結(jié)果在紙上打印出來或者制成新的穿孔卡片。而數(shù)據(jù)管理就是對所有這些穿孔卡片進(jìn)行物理的儲存和處理。然而,1950年雷明頓蘭德公司(RemingtonRandInc)的一種叫做UnivacI的計算機(jī)推出了一種一秒鐘可以輸入數(shù)百條記錄的磁帶驅(qū)動器,從而引發(fā)了數(shù)據(jù)管理的革命。1956年IBM生產(chǎn)出第一個磁盤驅(qū)動器——theModel305RAMAC。此驅(qū)動器有50個盤片,每個盤片直徑是2英尺,可以儲存5MB的數(shù)據(jù)。使用磁盤最大的好處是可以隨機(jī)存取數(shù)據(jù),而穿孔卡片和磁帶只能順序存取數(shù)據(jù)。
1951:Univac系統(tǒng)使用磁帶和穿孔卡片作為數(shù)據(jù)存儲。
數(shù)據(jù)庫系統(tǒng)的萌芽出現(xiàn)于二十世紀(jì)60年代。當(dāng)時計算機(jī)開始廣泛地應(yīng)用于數(shù)據(jù)管理,對數(shù)據(jù)的共享提出了越來越高的要求。傳統(tǒng)的文件系統(tǒng)已經(jīng)不能滿足人們的需要,能夠統(tǒng)一管理和共享數(shù)據(jù)的數(shù)據(jù)庫管理系統(tǒng)(DBMS)應(yīng)運而生。數(shù)據(jù)模型是數(shù)據(jù)庫系統(tǒng)的核心和基礎(chǔ),各種DBMS軟件都是基于某種數(shù)據(jù)模型的。所以通常也按照數(shù)據(jù)模型的特點將傳統(tǒng)數(shù)據(jù)庫系統(tǒng)分成網(wǎng)狀數(shù)據(jù)庫、層次數(shù)據(jù)庫和關(guān)系數(shù)據(jù)庫三類。
最早出現(xiàn)的網(wǎng)狀DBMS,是美國通用電氣公司Bachman等人在1961年開發(fā)的IDS(IntegratedDataStore)。1964年通用電氣公司(GeneralElectricCo.)的CharlesBachman成功地開發(fā)出世界上第一個網(wǎng)狀DBMS也即第一個數(shù)據(jù)庫管理系統(tǒng)——集成數(shù)據(jù)存儲(IntegratedDataStoreIDS),奠定了網(wǎng)狀數(shù)據(jù)庫的基礎(chǔ),并在當(dāng)時得到了廣泛的發(fā)行和應(yīng)用。IDS具有數(shù)據(jù)模式和日志的特征,但它只能在GE主機(jī)上運行,并且數(shù)據(jù)庫只有一個文件,數(shù)據(jù)庫所有的表必須通過手工編碼生成。之后,通用電氣公司一個客戶——BFGoodrichChemical公司最終不得不重寫了整個系統(tǒng),并將重寫后的系統(tǒng)命名為集成數(shù)據(jù)管理系統(tǒng)(IDMS)。
網(wǎng)狀數(shù)據(jù)庫模型對于層次和非層次結(jié)構(gòu)的事物都能比較自然的模擬,在關(guān)系數(shù)據(jù)庫出現(xiàn)之前網(wǎng)狀DBMS要比層次DBMS用得普遍。在數(shù)據(jù)庫發(fā)展史上,網(wǎng)狀數(shù)據(jù)庫占有重要地位。
層次型DBMS是緊隨網(wǎng)絡(luò)型數(shù)據(jù)庫而出現(xiàn)的,最著名最典型的層次數(shù)據(jù)庫系統(tǒng)是IBM公司在1968年開發(fā)的IMS(InformationManagementSystem),一種適合其主機(jī)的層次數(shù)據(jù)庫。這是IBM公司研制的最早的大型數(shù)據(jù)庫系統(tǒng)程序產(chǎn)品。從60年代末產(chǎn)生起,如今已經(jīng)發(fā)展到IMSV6,提供群集、N路數(shù)據(jù)共享、消息隊列共享等先進(jìn)特性的支持。這個具有30年歷史的數(shù)據(jù)庫產(chǎn)品在如今的WWW應(yīng)用連接、商務(wù)智能應(yīng)用中扮演著新的角色。
1973年Cullinane公司(也就是后來的Cullinet軟件公司),開始出售Goodrich公司的IDMS改進(jìn)版本,并且逐漸成為當(dāng)時世界上最大的軟件公司。
數(shù)據(jù)庫的關(guān)系由來:
網(wǎng)狀數(shù)據(jù)庫和層次數(shù)據(jù)庫已經(jīng)很好地解決了數(shù)據(jù)的集中和共享問題,但是在數(shù)據(jù)獨立性和抽象級別上仍有很大欠缺。用戶在對這兩種數(shù)據(jù)庫進(jìn)行存取時,仍然需要明確數(shù)據(jù)的存儲結(jié)構(gòu),指出存取路徑。而后來出現(xiàn)的關(guān)系數(shù)據(jù)庫較好地解決了這些問題。
1970年,IBM的研究員E.F.Codd博士在刊物《CommunicationoftheACM》上發(fā)表了一篇名為“ARelationalModelofDataforLargeSharedDataBanks”的論文,提出了關(guān)系模型的概念,奠定了關(guān)系模型的理論基礎(chǔ)。盡管之前在1968年Childs已經(jīng)提出了面向集合的模型,然而這篇論文被普遍認(rèn)為是數(shù)據(jù)庫系統(tǒng)歷史上具有劃時代意義的里程碑。Codd的心愿是為數(shù)據(jù)庫建立一個優(yōu)美的數(shù)據(jù)模型。后來Codd又陸續(xù)發(fā)表多篇文章,論述了范式理論和衡量關(guān)系系統(tǒng)的12條標(biāo)準(zhǔn),用數(shù)學(xué)理論奠定了關(guān)系數(shù)據(jù)庫的基礎(chǔ)。關(guān)系模型有嚴(yán)格的數(shù)學(xué)基礎(chǔ),抽象級別比較高,而且簡單清晰,便于理解和使用。但是當(dāng)時也有人認(rèn)為關(guān)系模型是理想化的數(shù)據(jù)模型,用來實現(xiàn)DBMS是不現(xiàn)實的,尤其擔(dān)心關(guān)系數(shù)據(jù)庫的性能難以接受,更有人視其為當(dāng)時正在進(jìn)行中的網(wǎng)狀數(shù)據(jù)庫規(guī)范化工作的嚴(yán)重威脅。為了促進(jìn)對問題的理解,1974年ACM牽頭組織了一次研討會,會上開展了一場分別以Codd和Bachman為首的支持和反對關(guān)系數(shù)據(jù)庫兩派之間的辯論。這次著名的辯論推動了關(guān)系數(shù)據(jù)庫的發(fā)展,使其最終成為現(xiàn)代數(shù)據(jù)庫產(chǎn)品的主流。
1969年EdgarF.“Ted”Codd發(fā)明了關(guān)系數(shù)據(jù)庫。
1970年關(guān)系模型建立之后,IBM公司在SanJose實驗室增加了更多的研究人員研究這個項目,這個項目就是著名的SystemR。其目標(biāo)是論證一個全功能關(guān)系DBMS的可行性。該項目結(jié)束于1979年,完成了第一個實現(xiàn)SQL的DBMS。然而IBM對IMS的承諾阻止了SystemR的投產(chǎn),一直到1980年SystemR才作為一個產(chǎn)品正式推向市場。IBM產(chǎn)品化步伐緩慢的三個原因:IBM重視信譽,重視質(zhì)量,盡量減少故障;IBM是個大公司,官僚體系龐大,IBM內(nèi)部已經(jīng)有層次數(shù)據(jù)庫產(chǎn)品,相關(guān)人員不積極,甚至反對。
然而同時,1973年加州大學(xué)伯克利分校的MichaelStonebraker和EugeneWong利用SystemR已發(fā)布的信息開始開發(fā)自己的關(guān)系數(shù)據(jù)庫系統(tǒng)Ingres。他們開發(fā)的Ingres項目最后由Oracle公司、Ingres公司以及硅谷的其他廠商所商品化。后來,SystemR和Ingres系統(tǒng)雙雙獲得ACM的1988年“軟件系統(tǒng)獎”。
1976年霍尼韋爾公司(Honeywell)開發(fā)了第一個商用關(guān)系數(shù)據(jù)庫系統(tǒng)——MulticsRelationalDataStore。關(guān)系型數(shù)據(jù)庫系統(tǒng)以關(guān)系代數(shù)為堅實的理論基礎(chǔ),經(jīng)過幾十年的發(fā)展和實際應(yīng)用,技術(shù)越來越成熟和完善。其代表產(chǎn)品有Oracle、IBM公司的DB2、微軟公司的MSSQLServer以及Informix、ADABASD等等。
數(shù)據(jù)庫的發(fā)展階段:
數(shù)據(jù)庫發(fā)展階段大致劃分為如下的幾個階段:人工管理階段、文件系統(tǒng)階段、數(shù)據(jù)庫系統(tǒng)階段、高級數(shù)據(jù)庫階段。
人工管理階段
20世紀(jì)50年代中期之前,計算機(jī)的軟硬件均不完善。硬件存儲設(shè)備只有磁帶、卡片和紙帶,軟件方面還沒有操作系統(tǒng),當(dāng)時的計算機(jī)主要用于科學(xué)計算。這個階段由于還沒有軟件系統(tǒng)對數(shù)據(jù)進(jìn)行管理,程序員在程序中不僅要規(guī)定數(shù)據(jù)的邏輯結(jié)構(gòu),還要設(shè)計其物理結(jié)構(gòu),包括存儲結(jié)構(gòu)、存取方法、輸入輸出方式等。當(dāng)數(shù)據(jù)的物理組織或存儲設(shè)備改變時,用戶程序就必須重新編制。由于數(shù)據(jù)的組織面向應(yīng)用,不同的計算程序之間不能共享數(shù)據(jù),使得不同的應(yīng)用之間存在大量的重復(fù)數(shù)據(jù),很難維護(hù)應(yīng)用程序之間數(shù)據(jù)的一致性。
這一階段的主要特征可歸納為如下幾點:
(1)計算機(jī)中沒有支持?jǐn)?shù)據(jù)管理的軟件,計算機(jī)系統(tǒng)不提供對用戶數(shù)據(jù)的管理功能,應(yīng)用程序只包含自己要用到的全部數(shù)據(jù)。用戶編制程序,必須全面考慮好相關(guān)的數(shù)據(jù),包括數(shù)據(jù)的定義、存儲結(jié)構(gòu)以即存取方法等。程序和數(shù)據(jù)是一個不可分割的整體。數(shù)據(jù)脫離了程序極具無任何存在的價值,數(shù)據(jù)無獨立性。
(2)數(shù)據(jù)不能共享。不同的程序均有各自的數(shù)據(jù),這些數(shù)據(jù)對不同的程序通常是不相同的,不可共享;即使不同的程序使用了相同的一組數(shù)據(jù),這些數(shù)據(jù)也不能共享,程序中仍然需要各自加入這組數(shù)據(jù),哪個部分都不能省略。基于這種數(shù)據(jù)的不可共享性,必然導(dǎo)致程序與程序之間存在大量的重復(fù)數(shù)據(jù),浪費存儲空間。
(3)不能單獨保存數(shù)據(jù)。在程序中要規(guī)定數(shù)據(jù)的邏輯結(jié)構(gòu)和物理結(jié)構(gòu),數(shù)據(jù)與程序不獨立。基于數(shù)據(jù)與程序是一個整體,數(shù)據(jù)只為本程序所使用,數(shù)據(jù)只有與相應(yīng)的程序一起保存才有價值,否則毫無用處。所以,所有程序的數(shù)據(jù)不單獨保存。數(shù)據(jù)處理的方式是批處理。
文件系統(tǒng)階段:
這一階段的主要標(biāo)志是計算機(jī)中有了專門管理數(shù)據(jù)庫的軟件——操作系統(tǒng)(文件管理)。
上世紀(jì)50年代中期到60年代中期,由于計算機(jī)大容量直接存儲設(shè)備如硬盤、磁鼓的出現(xiàn),
推動了軟件技術(shù)的發(fā)展,軟件的領(lǐng)域出現(xiàn)了操作系統(tǒng)和高級軟件,操作系統(tǒng)中的文件系統(tǒng)是專門管理外存的數(shù)據(jù)管理軟件,操作系統(tǒng)為用戶使用文件提供了友好界面。操作系統(tǒng)的出現(xiàn)標(biāo)志著數(shù)據(jù)管理步入一個新的階段。在文件系統(tǒng)階段,數(shù)據(jù)以文件為單位存儲在外存,且由操作系統(tǒng)統(tǒng)一管理,文件是操作系統(tǒng)管理的重要資源。
文件系統(tǒng)階段的數(shù)據(jù)管理具有一下幾個特點:
優(yōu)點
(1)數(shù)據(jù)以“文件”形式可長期保存在外部存儲器的磁盤上。由于計算機(jī)的應(yīng)用轉(zhuǎn)向信息管理,因此對文件要進(jìn)行大量的查詢、修改和插入等操作。
(2)數(shù)據(jù)的邏輯結(jié)構(gòu)與物理結(jié)構(gòu)有了區(qū)別,程序和數(shù)據(jù)分離,使數(shù)據(jù)與程序有了一定的獨立性,但比較簡單。數(shù)據(jù)的邏輯結(jié)構(gòu)是指呈現(xiàn)在用戶面前的數(shù)據(jù)結(jié)構(gòu)形式。數(shù)據(jù)的物理結(jié)構(gòu)是指數(shù)據(jù)在計算機(jī)存儲設(shè)備上的實際存儲結(jié)構(gòu)。程度與數(shù)據(jù)之間具有“設(shè)備獨立性”,即程序只需用文件名就可與數(shù)據(jù)打交道,不必關(guān)心數(shù)據(jù)的物理位置。由操作系統(tǒng)的文件系統(tǒng)提供存取方法(讀/寫)。
(3)文件組織已多樣化。有索引文件、鏈接文件和直接存取文件等。但文件之間相互獨立、缺乏聯(lián)系。數(shù)據(jù)之間的聯(lián)系需要通過程序去構(gòu)造。
(4)數(shù)據(jù)不再屬于某個特定的程序,可以重復(fù)使用,即數(shù)據(jù)面向應(yīng)用。但是文件結(jié)構(gòu)的設(shè)計仍是基于特定的用途,程序基于特定的物理結(jié)構(gòu)和存取方法,因此程度與數(shù)據(jù)結(jié)構(gòu)之間的依賴關(guān)系并未根本改變。
(5)用戶的程序與數(shù)據(jù)可分別存放在外存儲器上,各個應(yīng)用程序可以共享一組數(shù)據(jù),實現(xiàn)了以文件為單位的數(shù)據(jù)共享文件系統(tǒng)。
(6)對數(shù)據(jù)的操作以記錄為單位。這是由于文件中只存儲數(shù)據(jù),不存儲文件記錄的結(jié)構(gòu)描述信息。文件的建立、存取、查詢、插入、刪除、修改等操作,都要用程序來實現(xiàn)。
(7)數(shù)據(jù)處理方式有批處理,也有聯(lián)機(jī)實時處理。
缺點
文件系統(tǒng)對計算機(jī)數(shù)據(jù)管理能力的提高雖然起了很大的作用,但隨著數(shù)據(jù)管理規(guī)模的擴(kuò)大,數(shù)據(jù)量急劇增加,文價系統(tǒng)顯露出一些缺陷,問題表現(xiàn)在:
(1)數(shù)據(jù)文件是為了滿足特定業(yè)務(wù)領(lǐng)域某一部門的專門需要而設(shè)計,數(shù)據(jù)和程序相互依賴,數(shù)據(jù)缺乏足夠的獨立性。
(2)數(shù)據(jù)沒有集中管理的機(jī)制,其安全性和完整性無法保障,數(shù)據(jù)維護(hù)業(yè)務(wù)仍然由應(yīng)用程序來承擔(dān);
(3)數(shù)據(jù)的組織仍然是面向程序,數(shù)據(jù)與程序的依賴性強(qiáng),數(shù)據(jù)的邏輯結(jié)構(gòu)不能方便地修改和擴(kuò)充,數(shù)據(jù)邏輯結(jié)構(gòu)的每一點微小改變都會影響到應(yīng)用程序;而且文件之間的缺乏聯(lián)系,因而它們不能反映現(xiàn)實世界中事物之間的聯(lián)系,加上操作系統(tǒng)不負(fù)責(zé)維護(hù)文件之間的聯(lián)系,信息造成每個應(yīng)用程序都有相對應(yīng)的文件。如果文件之間有內(nèi)容上的聯(lián)系,那也只能由應(yīng)用程序去處理,有可能同樣的數(shù)據(jù)在多個文件中重復(fù)儲存。這兩者造成了大量的數(shù)據(jù)冗余。
(4)對現(xiàn)有數(shù)據(jù)文件不易擴(kuò)充,不易移植,難以通過增、刪數(shù)據(jù)項來適應(yīng)新的應(yīng)用要求。
數(shù)據(jù)庫系統(tǒng)階段:
20世紀(jì)60年代后期,隨著計算機(jī)在數(shù)據(jù)管理領(lǐng)域的普遍應(yīng)用,人們對數(shù)據(jù)管理技術(shù)提出了更高的要求:希望面向企業(yè)或部門,以數(shù)據(jù)為中心組織數(shù)據(jù),減少數(shù)據(jù)的冗余,提供更高的數(shù)據(jù)共享能力,同時要求程序和數(shù)據(jù)具有較高的獨立性,當(dāng)數(shù)據(jù)的邏輯結(jié)構(gòu)改變時,不涉及數(shù)據(jù)的物理結(jié)構(gòu),也不影響應(yīng)用程序,以降低應(yīng)用程序研制與維護(hù)的費用。數(shù)據(jù)庫技術(shù)正是在這樣一個應(yīng)用需求的基礎(chǔ)上發(fā)展起來的。
概括起來,數(shù)據(jù)庫系統(tǒng)階段的數(shù)據(jù)管理具有以下幾個特點:
(1)采用數(shù)據(jù)模型表示復(fù)雜的數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)模型不僅描述數(shù)據(jù)本身的特征,還要描述數(shù)據(jù)之間的聯(lián)系,這種聯(lián)系通過所有存取路徑。通過所有存儲路徑表示自然的數(shù)據(jù)聯(lián)系是數(shù)據(jù)庫與傳統(tǒng)文件的根本區(qū)別。這樣,數(shù)據(jù)不再面向特定的某個或多個應(yīng)用,而是面對整個應(yīng)用系統(tǒng)。如面向企業(yè)或部門,以數(shù)據(jù)為中心組織數(shù)據(jù),形成綜合性的數(shù)據(jù)庫,為各應(yīng)用共享。
(2)由于面對整個應(yīng)用系統(tǒng)使得,數(shù)據(jù)冗余小,易修改、易擴(kuò)充,實現(xiàn)了數(shù)據(jù)貢獻(xiàn)。不同的應(yīng)用程序根據(jù)處理要求,從數(shù)據(jù)庫中獲取需要的數(shù)據(jù),這樣就減少了數(shù)據(jù)的重復(fù)存儲,也便于增加新的數(shù)據(jù)結(jié)構(gòu),便于維護(hù)數(shù)據(jù)的一致性。
(3)對數(shù)據(jù)進(jìn)行統(tǒng)一管理和控制,提供了數(shù)據(jù)的安全性、完整性、以及并發(fā)控制。
(4)程序和數(shù)據(jù)有較高的獨立性。數(shù)據(jù)的邏輯結(jié)構(gòu)與物理結(jié)構(gòu)之間的差別可以很大,用戶以簡單的邏輯結(jié)構(gòu)操作數(shù)據(jù)而無須考慮數(shù)據(jù)的物理結(jié)構(gòu)。
(5)具有良好的用戶接口,用戶可方便地開發(fā)和使用數(shù)據(jù)庫。
從文件系統(tǒng)發(fā)展到數(shù)據(jù)庫系統(tǒng),這在信息領(lǐng)域中具有里程碑的意義。在文件系統(tǒng)階段,人們在信息處理中關(guān)注的中心問題是系統(tǒng)功能的設(shè)計,因此程序設(shè)計占主導(dǎo)地位;而在數(shù)據(jù)庫方式下,數(shù)據(jù)開始占據(jù)了中心位置,數(shù)據(jù)的結(jié)構(gòu)設(shè)計成為信息系統(tǒng)首先關(guān)心的問題,而應(yīng)用程序則以既定的數(shù)據(jù)結(jié)構(gòu)為基礎(chǔ)進(jìn)行設(shè)計。
數(shù)據(jù)庫發(fā)展趨勢:
隨著信息管理內(nèi)容的不斷擴(kuò)展,出現(xiàn)了豐富多樣的數(shù)據(jù)模型(層次模型,網(wǎng)狀模型,關(guān)系模型,面向?qū)ο竽P?,半結(jié)構(gòu)化模型等),新技術(shù)也層出不窮(數(shù)據(jù)流,Web數(shù)據(jù)管理,數(shù)據(jù)挖掘等)。每隔幾年,國際上一些資深的數(shù)據(jù)庫專家就會聚集一堂,探討數(shù)據(jù)庫研究現(xiàn)狀,存在的問題和未來需要關(guān)注的新技術(shù)焦點。過去已有的幾個類似報告包括:1989年FutureDirectionsinDBMSResearch-TheLagunaBeachParticipants;1990年DatabaseSystems:AchievementsandOpportunities;1991年W.H.Inmon發(fā)表的《構(gòu)建數(shù)據(jù)倉庫》;1995年Database。
常見數(shù)據(jù)庫廠商:
1.SQLServer
只能在windows上運行,沒有絲毫的開放性,操作系統(tǒng)的系統(tǒng)的穩(wěn)定對數(shù)據(jù)庫是十分重要的。Windows9X系列產(chǎn)品是偏重于桌面應(yīng)用,NTserver只適合中小型企業(yè)。而且windows平臺的可靠性,安全性和伸縮性是非常有限的。它不象unix那樣久經(jīng)考驗,尤其是在處理大數(shù)據(jù)庫。
2.Oracle
能在所有主流平臺上運行(包括windows)。完全支持所有的工業(yè)標(biāo)準(zhǔn)。采用完全開放策略??梢允箍蛻暨x擇最適合的解決方案。對開發(fā)商全力支持。
3.SybaseASE
能在所有主流平臺上運行(包括windows)。但由于早期Sybase與OS集成度不高,因此VERSION11.9.2以下版本需要較多OS和DB級補(bǔ)丁。在多平臺的混合環(huán)境中,會有一定問題。
4.DB2
能在所有主流平臺上運行(包括windows)。最適于海量數(shù)據(jù)。DB2在企業(yè)級的應(yīng)用最為廣泛,在全球的500家最大的企業(yè)中,幾乎85%以上用DB2數(shù)據(jù)庫服務(wù)器,而國內(nèi)到97年約占5%。
OK,關(guān)于數(shù)據(jù)庫的基本概念和基礎(chǔ)數(shù)據(jù)庫是什么意思的內(nèi)容到此結(jié)束了,希望對大家有所幫助。