《數(shù)據(jù)采集技術(shù)》課件-MongoDB 數(shù)據(jù)庫簡介_第1頁
《數(shù)據(jù)采集技術(shù)》課件-MongoDB 數(shù)據(jù)庫簡介_第2頁
《數(shù)據(jù)采集技術(shù)》課件-MongoDB 數(shù)據(jù)庫簡介_第3頁
《數(shù)據(jù)采集技術(shù)》課件-MongoDB 數(shù)據(jù)庫簡介_第4頁
《數(shù)據(jù)采集技術(shù)》課件-MongoDB 數(shù)據(jù)庫簡介_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

MongoDB數(shù)據(jù)庫庫概述Contents知識目標掌握MongoDB數(shù)據(jù)庫使用方法技能目標提高數(shù)據(jù)采集和處理能力素養(yǎng)目標培養(yǎng)良好的信息素養(yǎng)和道德意識數(shù)據(jù)存儲簡介爬蟲的數(shù)據(jù)存儲可分為兩種方式:1.文件存儲對于中小規(guī)模的爬蟲,可以將爬蟲結(jié)果匯合到一個文件進行持久化存儲。數(shù)據(jù)存儲簡介爬蟲的數(shù)據(jù)存儲可分為兩種方式:2.數(shù)據(jù)庫存儲抓取的數(shù)據(jù)種類豐富、數(shù)量龐大的大規(guī)模爬蟲,可以將這些爬蟲結(jié)果存入數(shù)據(jù)庫中。方便存儲方便進一步整理數(shù)據(jù)存儲簡介Python中常用的數(shù)據(jù)庫系統(tǒng)主要包括如下兩種:一種開源的關(guān)系型數(shù)據(jù)庫,使用最常用的數(shù)據(jù)庫管理語言(結(jié)構(gòu)化查詢語言SQL)進行數(shù)據(jù)庫管理。會將數(shù)據(jù)保存到不同的表中。1.MySQL一個基于分布式文件存儲的數(shù)據(jù)庫,是當前NoSQL(非關(guān)系型的數(shù)據(jù)庫)數(shù)據(jù)庫中比較熱門的一種。面向集合存儲,易存儲對象類型的數(shù)據(jù)。2.MongoDB速度快,靈活性高特點高性能、易部署、易使用等特點MongoDB旨在為Web應(yīng)用提供可擴展的高性能數(shù)據(jù)存儲解決方案。免費、操作簡單、面向文檔存儲等特點基于分布式文件存儲的NoSQL數(shù)據(jù)庫MongoDB功能特性模式自由完全索引復(fù)制與故障回復(fù)高效二進制數(shù)據(jù)存儲自動處理碎片支持多種語言可通過網(wǎng)絡(luò)訪問面向集合存儲動態(tài)查詢Windows平臺安裝MongoDB數(shù)據(jù)庫1打開MongoDB下載網(wǎng)站,單擊【CommunityServer】選項查看當前可用于下載的數(shù)據(jù)庫版本,這里下載3.6.3版本。Windows平臺安裝MongoDB數(shù)據(jù)庫2單擊【DOWNLOAD(msi)】按鈕,下載msi文件。當下載完成以后,雙擊剛剛下載的文件。Windows平臺安裝MongoDB數(shù)據(jù)庫3單擊【Next】按鈕,開始安裝程序,之后直接按照提示安裝即可。Windows平臺安裝MongoDB數(shù)據(jù)庫4取消對【InstallMongoDBCompass】的勾選,即不安裝MongoDBCompass。當下次打開電腦時,無需再次輸入配置和啟動命令,可以直接進入MongoDB安裝目錄下的bin目錄下,雙擊“mongo.exe”打開數(shù)據(jù)庫的交互窗口(mongoshell)即可。注意比較MongoDB和MySQL的術(shù)語MongoDB是非關(guān)系型數(shù)據(jù)庫沒有表的概念,數(shù)據(jù)庫的基本組成單元是集合。MySQL是關(guān)系型數(shù)據(jù)庫管理系統(tǒng)使用SQL作為其主要的數(shù)據(jù)庫查詢語言。比較MongoDB和MySQL的術(shù)語SQL術(shù)語/概念MongoDB術(shù)語/概念解釋/說明databasedatabase數(shù)據(jù)庫tablecollection數(shù)據(jù)庫表/集合rowdocument數(shù)據(jù)記錄行/文檔columnfield數(shù)據(jù)字段/域indexindex索引tablejoins

表連接/MongoDB不支持primarykeyprimarykey主鍵,MongoDB自動將_id字段設(shè)置為主鍵MongoDBMongoDB的三個組成元素:數(shù)據(jù)庫集合文檔數(shù)據(jù)存儲簡介數(shù)據(jù)庫(DataBase):表示一個集合的物理容器。一個MongoDB中可以建立多個數(shù)據(jù)庫,默認的數(shù)據(jù)庫為“db”,它存儲在data目錄中。數(shù)據(jù)存儲簡介文檔(Document):一組由鍵/值對組成的對象,對應(yīng)著關(guān)系型數(shù)據(jù)庫的行。{"name":"liming","age":30}文檔中的鍵/值對是有順序的,文檔中的值:可以是字符串類型可以是其它數(shù)據(jù)類型數(shù)據(jù)存儲簡介集合(Collection):集合是一組文檔,類似于關(guān)系數(shù)據(jù)庫中的表。{'name':'zhangsan','gender':'man'}{'name':'zhangsan','age':30}沒有固定的結(jié)構(gòu),可以往集合中插入不同格式和類型的數(shù)據(jù)。MongoDB常用命令創(chuàng)建數(shù)據(jù)庫:usedatabase創(chuàng)建集合:db.createCollection(“col”)查看集合:showcollections/showtables插入文檔:db.col.insert({“name”:”zhangsan”})查詢文檔:db.col.find()刪除文檔:db.col.remove({“name”:”zhangsan”})刪除集合:db.col.drop()刪除數(shù)據(jù)庫:db.dropDatabase()查看數(shù)據(jù)庫:showdbs本講小結(jié)1爬蟲的最后一個步驟—存儲爬蟲數(shù)據(jù)數(shù)據(jù)存儲的一些方法MongoDB數(shù)據(jù)庫的相關(guān)知識在Windows平臺安裝MongoDBMongoDB和MySQL的比較2MongoDB庫的常用命令課后作業(yè)在電腦中安裝MongoDB,并

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論