![基于Python的嗶哩嗶哩視頻網(wǎng)視頻熱度分析_第1頁](http://file4.renrendoc.com/view12/M07/2C/2A/wKhkGWX1TnKAPq8aAAITa7bGrqE109.jpg)
![基于Python的嗶哩嗶哩視頻網(wǎng)視頻熱度分析_第2頁](http://file4.renrendoc.com/view12/M07/2C/2A/wKhkGWX1TnKAPq8aAAITa7bGrqE1092.jpg)
![基于Python的嗶哩嗶哩視頻網(wǎng)視頻熱度分析_第3頁](http://file4.renrendoc.com/view12/M07/2C/2A/wKhkGWX1TnKAPq8aAAITa7bGrqE1093.jpg)
![基于Python的嗶哩嗶哩視頻網(wǎng)視頻熱度分析_第4頁](http://file4.renrendoc.com/view12/M07/2C/2A/wKhkGWX1TnKAPq8aAAITa7bGrqE1094.jpg)
![基于Python的嗶哩嗶哩視頻網(wǎng)視頻熱度分析_第5頁](http://file4.renrendoc.com/view12/M07/2C/2A/wKhkGWX1TnKAPq8aAAITa7bGrqE1095.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
摘要在21世紀(jì)的今天,網(wǎng)絡(luò)發(fā)展越來越快,網(wǎng)上的娛樂方式也越來越多樣化,而如今在網(wǎng)上觀看視頻消遣時(shí)間越來越受到大眾的青睞。Bilibili視頻網(wǎng)站是現(xiàn)當(dāng)下年輕人最受歡迎的一個視頻網(wǎng)站。有調(diào)查顯示,直到2019年的10月份,Bilibili視頻網(wǎng)站的用戶在總體網(wǎng)絡(luò)視頻用戶占比高達(dá)90%。它與其他的視頻網(wǎng)站用戶相比較,其用戶忠實(shí)度更高,據(jù)其招募報(bào)告稱,其成員的12個月保留率達(dá)79%,而2009年注冊的用戶中60%的今天仍然活躍。Bilibili是目前國內(nèi)最受歡迎的綜合用戶網(wǎng)站,分析其視頻熱度可以從側(cè)面分析15-45歲群體的愛好,有著重要研究意義。本論文為基于Python的“嗶哩嗶哩視頻網(wǎng)”視頻熱度分析。首先講解本文使用的相關(guān)技術(shù),包括Scrapy框架,Pandas庫和pyecharts庫。然后根據(jù)頁面分析使用基于Scrapy的方法對嗶哩嗶哩視頻網(wǎng)數(shù)據(jù)抓取,并展示了部分?jǐn)?shù)據(jù)結(jié)果,還對數(shù)據(jù)進(jìn)行了預(yù)處理,接著為數(shù)據(jù)分析分別對分區(qū)占比、平均播放量、平均三連情況、各區(qū)平均播放和熱門標(biāo)簽進(jìn)行可視化,最后總結(jié)本論文所做的工作以及展望。關(guān)鍵詞:Scrapy;Pandas;嗶哩嗶哩視頻網(wǎng)AbstractInthe21stcentury,thedevelopmentoftheInternetisfasterandfaster,theonlineentertainmentismoreandmorediversified,andnowwatchingvideosontheInternetforleisuretimeismoreandmorepopular.Bilibiliisoneofthemostpopularvideowebsitesforyoungpeopletoday.AsofOctober2019,Bilibiliaccountsfor90percentofallonlinevideousers,accordingtoasurvey.Bilibilibilihashigheruserloyaltythanotherplatforms,witha12-monthretentionrateof79%accordingtoitsrecruitmentreport,comparedwith60%ofusersregisteredin2009whoarestillactivetoday.BilibilibiliisthemostpopularcomprehensiveuserwebsiteinChina.Analyzingitsvideopopularitycananalyzethehobbiesofthe15-45-year-oldgroupfromtheside,whichhasimportantresearchsignificance.ThispaperisbasedonPython"BiliBilivideonetwork"videoheatanalysis.Firstofall,itintroducestherelatedtechnologiesusedinthispaper,includingthescrapyframework,pandaslibraryandpyechartslibrary.Then,accordingtothepageanalysis,weusethemethodbasedonscratchtocapturethedataofbilibilibilivideonetwork,andshowsomedataresults,andpreprocessthedata.Thenwevisualizethepartitionproportion,theaverageplaybackvolume,theaveragetripleconnection,theaverageplaybackofeachareaandthehottagsforthedataanalysis.Finally,wesummarizetheworkandProspectofthispaper.Keywords:Scrapy;Pandas;BiliBili目錄第一章緒論 第一章緒論1.1研究背景與以前我國信息交流不發(fā)達(dá)的時(shí)代相比,如今我國學(xué)會上網(wǎng)的人也越來越多,而國家對互聯(lián)網(wǎng)的普及率也越來越高。導(dǎo)致與2018年相比較,如今中國的上網(wǎng)人數(shù)已經(jīng)比那時(shí)提高了2%。而如今隨著手機(jī)的更新?lián)Q代,手機(jī)上網(wǎng)比用電腦上網(wǎng)更加便捷,有數(shù)據(jù)顯示,如今使用手機(jī)上網(wǎng)的人數(shù)比使用電腦上網(wǎng)人數(shù)多3000萬。在21世紀(jì)的今天,網(wǎng)絡(luò)發(fā)展越來越快,網(wǎng)上的娛樂方式也越來越多樣化,而如今在網(wǎng)上觀看視頻消遣時(shí)間越來越受到大眾的青睞。Bilibili視頻網(wǎng)站是現(xiàn)當(dāng)下年輕人最受歡迎的一個視頻網(wǎng)站。有調(diào)查顯示,直到2019年的10月份,Bilibili視頻網(wǎng)站的用戶在總體網(wǎng)絡(luò)視頻用戶占比高達(dá)90%。而如今不僅是Bilibili,就連像優(yōu)酷、騰訊、愛奇藝、樂視等的視頻網(wǎng)站都以電視劇、電影、動漫等的一些視頻類型向游戲、音樂、電競等當(dāng)代年輕人喜愛的娛樂類型進(jìn)行擴(kuò)展聯(lián)動。正是有了這些視頻網(wǎng)站專業(yè)的生產(chǎn)和運(yùn)營,我國的網(wǎng)絡(luò)視頻行業(yè)才慢慢不停地發(fā)展起來,逐步形成網(wǎng)絡(luò)視頻的內(nèi)容與各領(lǐng)域協(xié)同的娛樂生態(tài)內(nèi)容。Bilibili視頻網(wǎng)站于2009年創(chuàng)立,最開始的時(shí)候這個視頻網(wǎng)站只是類似于今天的A站一樣,分享一些精美圖片和視頻。但隨著中國近十多年來互聯(lián)網(wǎng)的快速發(fā)展,該視頻網(wǎng)站也慢慢地?cái)U(kuò)展了其他的業(yè)務(wù),例如一些電子商務(wù)和手機(jī)游戲等。但其特殊之處還不止這些,與優(yōu)酷和騰訊等其他視頻網(wǎng)站不同,Bilibili在ACG文化以及彈幕文化方面上顯得獨(dú)樹一幟。隨著Bilibili游客數(shù)量的快速增長,它的內(nèi)容也越來越豐富,除了占主導(dǎo)地位的主題之外,現(xiàn)在的Bilibili還提供了各個領(lǐng)域的視頻,包括音樂、舞蹈、科學(xué)、技術(shù)、娛樂、電影、戲劇、時(shí)裝、日常生活以及廣告電影。此外,Bilibili還提供實(shí)時(shí)流媒體服務(wù),觀眾可以與流媒體進(jìn)行互動。通常這些主題都是關(guān)于動畫、內(nèi)容創(chuàng)建與游戲策略等。Bilibili與其他平臺相比,其用戶忠實(shí)度更高,據(jù)其招募報(bào)告稱,其成員的12個月保留率高達(dá)79%,而2009年注冊的用戶中有60%今天仍然活躍。此外,年齡在15-45歲之間的用戶占平臺總體用戶基礎(chǔ)的78%。Bilibili的平均用戶每天在該平臺上花費(fèi)超過78分鐘,觀看每月上傳的240萬個視頻中的一些。Bilibili憑借其獨(dú)特而活躍的內(nèi)容社區(qū)吸引用戶,也是該網(wǎng)站用戶數(shù)量激增的原因。而自2018年9月以來,它在12個月內(nèi)獲得了3500萬的MAU。Bilibili是目前國內(nèi)最受歡迎的綜合用戶網(wǎng)站,分析其視頻熱度可以從側(cè)面分析15-45歲群體的愛好,有著重要研究意義。1.2國內(nèi)外研究現(xiàn)狀作為當(dāng)代網(wǎng)民最重要的娛樂方式之一的網(wǎng)絡(luò)視頻已經(jīng)成為當(dāng)今互聯(lián)網(wǎng)世界的第五大應(yīng)用。而在這個互聯(lián)網(wǎng)數(shù)據(jù)的時(shí)代,網(wǎng)絡(luò)視頻擁有大量的用戶數(shù)據(jù),對網(wǎng)絡(luò)視頻的分析研究能夠知道當(dāng)代網(wǎng)民對視頻的喜愛類型,對今后網(wǎng)絡(luò)視頻的可持續(xù)發(fā)展有著重要的意義。馬翔[1]為了能夠?qū)崿F(xiàn)視頻網(wǎng)站分析平臺的用戶數(shù)據(jù)可視化應(yīng)用模型,他從人機(jī)交互和可視化等綜合視角出發(fā),帶領(lǐng)視頻制作團(tuán)隊(duì)實(shí)現(xiàn)把用戶的數(shù)據(jù)向節(jié)目形式和內(nèi)容的轉(zhuǎn)化,也提出了用可視化的數(shù)據(jù)挖掘以及分析用戶的愛好習(xí)慣的觀點(diǎn)。崔楠,郭俞,張會雄[2]使用Python網(wǎng)絡(luò)蜘蛛作為工具對嗶哩嗶哩視頻網(wǎng)獲取了大量的彈幕數(shù)據(jù),并這些數(shù)據(jù)進(jìn)行了挖掘分析,由此間接地評價(jià)了視頻的內(nèi)容,最終結(jié)果展示了流行短視頻的獨(dú)特評價(jià),對短視頻的作者和平臺都具有一定的參考價(jià)值。他們基于這種彈幕的研究方法也為視頻內(nèi)容的自動識別與評價(jià)提供了新的思路。徐璐[3]使用獲得的Web用戶日志分析出觀看視頻用戶的一些選擇和觀看的視頻評分之間的矩陣關(guān)系。通俗來講就是建立用戶的興趣模型來發(fā)現(xiàn)觀看視頻用戶的喜好,在此過程中,她還對協(xié)同過濾算法中一些計(jì)算方法進(jìn)行了改進(jìn),使其模型能夠主動向用戶提供他們喜好觀看的一些的視頻。顧軍華,高星,王守彬,等[4]以新媒體等視頻大數(shù)據(jù)為基礎(chǔ)在Spark上建立了BP神經(jīng)網(wǎng)絡(luò)視頻評估模型。還以傳統(tǒng)媒體等視頻方面的影響度為基礎(chǔ)不斷地去完善其評估體系。最后還建立了基于IPTV的大數(shù)據(jù),并且能夠反映其用戶群體的喜好類型評分策略的BP神經(jīng)網(wǎng)絡(luò)評估模型。1.3章節(jié)安排本篇論文總共有5個章節(jié),每一個章節(jié)的主要內(nèi)容如下:第1章是緒論章節(jié),主要介紹研究背景和國內(nèi)外的一些研究現(xiàn)狀,接著介紹本文的結(jié)構(gòu)。第2章主要介紹了本文使用的相關(guān)技術(shù),包括有Scrapy框架、Pandas庫和pyecharts庫。第3章為基于Scrapy的數(shù)據(jù)抓取,首先介紹了如何根據(jù)頁面分析對網(wǎng)頁數(shù)據(jù)進(jìn)行抓取,然后展示了部分?jǐn)?shù)據(jù)結(jié)果,并對數(shù)據(jù)進(jìn)行了預(yù)處理。第4章主要為數(shù)據(jù)分析,分別對分區(qū)占比、平均播放量、平均三連情況、各區(qū)平均播放以及熱門標(biāo)簽進(jìn)行數(shù)據(jù)分析并可視化。第5章是結(jié)論,總結(jié)本論文所做的工作以及展望。第二章相關(guān)技術(shù)介紹2.1Scrapy框架Scrapy框架在Python語言中處理復(fù)雜情況的一種工具。它是一種強(qiáng)大的網(wǎng)頁蜘蛛框架,不僅能夠輕松構(gòu)建請求,并且能輕松解析響應(yīng)。它的性能非常高甚至還可以將網(wǎng)頁蜘蛛這種程序工程化以及模塊化。Scrapy框架主要包括:(1)引擎:主要工作負(fù)責(zé)項(xiàng)目管道、網(wǎng)頁蜘蛛、下載器、調(diào)度器中間的通訊、信號分析以及相關(guān)數(shù)據(jù)信息傳遞等。(2)調(diào)度器:主要負(fù)責(zé)接收來自引擎發(fā)送的請求,并組織和布置以某種方式入隊(duì),當(dāng)被需要時(shí)返回到引擎。(3)下載器:主要工作負(fù)責(zé)下載引擎發(fā)送的所有請求,并將其獲取到的響應(yīng)交還給引擎,并由相關(guān)引擎交給網(wǎng)頁蜘蛛來處理。(4)網(wǎng)頁蜘蛛:主要負(fù)責(zé)處理所有響應(yīng),從中分析提取數(shù)據(jù)并獲得項(xiàng)目字段所需的數(shù)據(jù),向引擎提交需要跟蹤的URL并又一次進(jìn)入到調(diào)度器之中。(5)項(xiàng)目管道:從爬行器中獲取的項(xiàng)目進(jìn)行處理和后處理的地方。Scrapy的運(yùn)行流程基本如下:(1)首先,引擎從調(diào)度程序中檢索的URL作為初始目標(biāo)的檢索程序,并開始從此URL抓取。(2)其次,URL被引擎封裝為請求并且傳送給下載器,下載器把資源下載到本機(jī)后再封裝為響應(yīng)。(3)網(wǎng)頁蜘蛛接收響應(yīng)同時(shí)調(diào)用回調(diào)函數(shù)。2.2Pandas庫Pandas庫的創(chuàng)始人是一位名叫WesMcKinney的開發(fā)人員開發(fā)出來的,其開發(fā)Pandas庫的目的在于能夠?qū)λ玫降臄?shù)據(jù)進(jìn)行更加精準(zhǔn)的操作分析以及建模等。而在此出現(xiàn)之前,Python只能夠簡單的對數(shù)據(jù)進(jìn)行處理以及作出一些準(zhǔn)備,而對于如今的數(shù)據(jù)分析的貢獻(xiàn)并不是很大。而目前作為一個開源的Pandas,已經(jīng)能夠利用其強(qiáng)大的功能為數(shù)據(jù)處理提供高性能的處理和分析了。而如今帶有Pandas庫的Python語言已經(jīng)在廣泛的領(lǐng)域中使用,其中就包括有學(xué)術(shù)、商業(yè)、金融、經(jīng)濟(jì)學(xué)、統(tǒng)計(jì)和分析等。Pandas庫的主要特點(diǎn):(1)具有快速高效的數(shù)據(jù)框架對象,具有默認(rèn)和自定義索引。(2)處理數(shù)據(jù)對齊和丟失數(shù)據(jù)。(3)將不同文件格式的數(shù)據(jù)加載到內(nèi)存中的數(shù)據(jù)對象工具。(4)可以把日期一期重新塑造以及設(shè)置。(5)可以刪除或插入數(shù)據(jù)結(jié)構(gòu)中的列。(6)基于標(biāo)簽的切片,大數(shù)據(jù)集的索引和子集。2.3pyecharts庫Pyecharts庫作為Python中一個圖表的庫,使用它生成的圖表的可觀程度非常的高,對數(shù)據(jù)進(jìn)行分析起來十分的方便,通過圖表數(shù)據(jù)與數(shù)據(jù)的比較更容易得出數(shù)據(jù)分析的結(jié)果。Pyecharts庫的主要特點(diǎn):(1)能夠支持鏈?zhǔn)降恼{(diào)用,并且能夠?qū)崿F(xiàn)簡單干凈的API設(shè)計(jì)。(2)能提供三十多種的常用圖表。(3)帶有JupyterNotebook和JupyterLab并支持當(dāng)下的Notebook環(huán)境。(4)可輕松集成到Flask和Django等主流的Web框架。(5)擁有四百個以上的地圖文件,也能夠支持地理數(shù)據(jù)的可視化實(shí)現(xiàn)。(6)為新手開發(fā)項(xiàng)目提供更多的文檔支持。第三章基于Scrapy的數(shù)據(jù)抓取3.1頁面分析如圖3.1為Bilibili排行榜頁面,在對網(wǎng)頁的數(shù)據(jù)抓取前首先需要分析其頁面結(jié)構(gòu)。如圖3.2為網(wǎng)頁的html結(jié)構(gòu),排行榜頁面僅有題目,作者,觀看量,評論數(shù),綜合得分等數(shù)據(jù),更多數(shù)據(jù)需要進(jìn)入視頻詳情頁面進(jìn)行抓取。如圖3.3為視頻詳情的html結(jié)構(gòu),視頻詳情頁面可以獲取與播放視頻相關(guān)的一些播放量、三連量、轉(zhuǎn)發(fā)量、熱門標(biāo)簽等信息,我們都可以通過xpath方法來抓取這些在div標(biāo)簽的信息。圖3.1排行榜頁面圖3.2排行榜頁面代碼圖3.3視頻詳情代碼3.2數(shù)據(jù)結(jié)果表3.1為本文獲取數(shù)據(jù)格式,表3.1展示了其中的九行數(shù)據(jù),包括了作者、投幣數(shù)、彈幕數(shù)、三連數(shù)、作品id、點(diǎn)贊數(shù)、類別,回復(fù)數(shù)、得分、分享數(shù)、觀看數(shù)、題目以及標(biāo)簽十三列的數(shù)據(jù)內(nèi)容。表3.1原始數(shù)據(jù)表作者投幣數(shù)彈幕三連id點(diǎn)贊數(shù)類別快樂的Ler5125423319648384695473051611191全站飛魚不在天2588171182754928891835249279854全站落桑西4590019464117605190609023858630全站翹課遲到4395295294836403289558467582909全站奶糕成精檔案社22907634179582291675841268103全站維C永不加班426321111372349445952356127動畫可口的紅糖126985994110739891060138208720國創(chuàng)相關(guān)是珍珍又是希希23322498052914943605292舞蹈明月莊主moon5027616087920828311030858720游戲續(xù)表3.1原始數(shù)據(jù)表回復(fù)數(shù)得分分享觀看數(shù)題目標(biāo)簽1515812345441524674887831“?????????????”“??????????”MAD.AMV,天氣之子,全能打卡挑戰(zhàn),宮崎駿,你的名字,新海誠,MAD,影視剪輯,BGM,多素材,純音樂936812771440230623123675這十個軟件,讓你的電腦舒適度提升1400%數(shù)碼,Windows,電腦,軟件,演示,推薦,微軟1180986413057679258418668B站現(xiàn)狀搞笑,全能打卡挑戰(zhàn),B站,惡搞,BILIBILI,嗶哩嗶哩,搞笑視頻4248267599592479315520288處處零搞笑,翻唱,處處吻,全民音樂UP主,搞笑翻唱,惡搞45723202361464641602855孩子要出道了,《被迫營業(yè)》MV正式首發(fā)?。∶葘?宅家vlog挑戰(zhàn),可愛,動物圈,日常,搞笑87811710174153337412【全員踩點(diǎn)】JO廚興奮劑MAD.AMV,JOJO的奇妙冒險(xiǎn),AMV,JOJO,MAD,燃,踩點(diǎn),腦洞搞笑,熱血,搞笑61513287288317962246312看的我熱血沸騰,看完你可能要重新認(rèn)識喜羊羊童年回憶殺,喜羊羊與灰太狼,國產(chǎn)動畫,bilibili新星計(jì)劃,童年,熱血,催淚向,動漫,動畫,剪輯435367972490215874【希?!縎enorita穿襯衫的小老虎明星舞蹈,街舞,舞蹈,全能打卡挑戰(zhàn),性感,爵士舞123110773236984554399我的世界基巖版從零開始學(xué)紅石《合集》by明月莊主手機(jī)游戲,紅石教程,沙盒游戲,明月莊主,教程,我的世界紅石,我的世界手機(jī)版,我的世界PE,我的世界基巖版3.3數(shù)據(jù)預(yù)處理數(shù)據(jù)清理主要是通過刪除或修改不正確、不完整、不相關(guān)、重復(fù)或者格式不正確的數(shù)據(jù)來準(zhǔn)備要分析的數(shù)據(jù)的過程。在分析數(shù)據(jù)時(shí),此數(shù)據(jù)通常不是必需的或無用的,因?yàn)樗赡軙璧K過程或提供不準(zhǔn)確的結(jié)果。有幾種清理數(shù)據(jù)的方法,具體取決于數(shù)據(jù)的存儲方式以及所尋求的答案。數(shù)據(jù)清理不僅涉及擦除信息以為新數(shù)據(jù)騰出空間,還在于尋找一種方法來最大化數(shù)據(jù)集的準(zhǔn)確性而不必刪除信息。一方面,數(shù)據(jù)清除包括比刪除數(shù)據(jù)更多的操作,例如修復(fù)拼寫和語法錯誤,標(biāo)準(zhǔn)化數(shù)據(jù)集以及更正錯誤,例如空字段,缺少代碼以及識別重復(fù)的數(shù)據(jù)點(diǎn)。另一方面,數(shù)據(jù)清理被認(rèn)為是數(shù)據(jù)科學(xué)基礎(chǔ)的基礎(chǔ)要素,因?yàn)樗诜治鲞^程中扮演著重要角色,并能夠找到可靠的答案。最重要的是,數(shù)據(jù)清理的目的是創(chuàng)建標(biāo)準(zhǔn)化且統(tǒng)一的數(shù)據(jù)集,以允許商業(yè)智能和數(shù)據(jù)分析工具輕松訪問并為每個查詢找到正確的數(shù)據(jù)。從本次采集到的數(shù)據(jù)中發(fā)現(xiàn)并缺失值,而且采取數(shù)據(jù)有1300行和13列。由于全站榜包含在各分區(qū)靠前的視頻中,而在rank_tab中有一個全站榜的數(shù)據(jù),所以這里就要把全站榜除外,避免重復(fù)計(jì)算。df_without_all=df[~df['rank_tab'].isin(['全站'])]由上面的一行代碼可把“全站”這個元素整行進(jìn)行排除,這樣就能夠得到一個名為df_without_all的Dataframe,由此一來便能夠簡單地把收集來的數(shù)據(jù)進(jìn)行了一個預(yù)清洗。第四章數(shù)據(jù)分析4.1分區(qū)占比可視化首先對預(yù)處理好的數(shù)據(jù)按照綜合評分進(jìn)行降序排序,然后再對其進(jìn)行切片處理,接著獲取分區(qū)名列的前100項(xiàng)的數(shù)據(jù),最后再統(tǒng)計(jì)每一個分區(qū)出現(xiàn)次數(shù)進(jìn)行返回處理。得到的分區(qū)占比可視化由下圖所示。圖4.1分區(qū)占比可視化從圖4.1中可以看出,在綜合評分top100當(dāng)中,代表當(dāng)代年輕人喜愛的二次元動畫所占比例為21%,僅排名第二。但是生活類的視頻卻超過動畫類視頻并占且據(jù)第一位。根據(jù)對二次元的定義,整體看的話完全屬于二次元的視頻比例占24%,二次元至今依然是B站的主力軍。在2018年的B站資料數(shù)據(jù)中顯示,所有頻道中播放量TOP5的分別是娛樂、生活、游戲、動畫和科技區(qū)。與我們數(shù)據(jù)相比較,生活、動畫類視頻的排名分別提升到了第1名和第2名,而娛樂、游戲、科技類視頻則跌出榜單,位列倒數(shù),但時(shí)尚、鬼畜、音樂類的視頻則成為了新秀。4.2平均播放量可視化在對綜合評分top100視頻的平均播放量進(jìn)行可視化的時(shí)候,這里選擇了用柱形圖來對獲取的數(shù)據(jù)進(jìn)行進(jìn)一步的可視化。把綜合評分top100的視頻平均播放量作為指標(biāo),而視頻類型的名稱作為維度,然后生成柱形圖。由于Pyecharts起初生成的圖表為html的格式,這里為了方便就利用snapshot_selenium把html直接轉(zhuǎn)為png格式。圖4.2平均播放量可視化4.3平均三連情況可視化雖然前面已經(jīng)初步可視化出top100綜合評分視頻的平均播放量,但是由于平均播放量的單位是人次而不是人數(shù),為了更加全面的反映出在B站用戶的具體喜愛的視頻類型。這里還需要對B站用戶在top100綜合評分視頻中的點(diǎn)贊、投幣和收藏的三連情況進(jìn)行可視化操作。圖4.1-圖4.6是綜合評分top100中各分區(qū)平均三連情況分析,這里依舊是用snapshot_selenium把html直接轉(zhuǎn)為png格式,但是選擇的是雷達(dá)圖來對獲取的數(shù)據(jù)進(jìn)行進(jìn)一步的可視化。具體如下圖所示。圖4.3點(diǎn)贊情況可視化圖4.4投幣情況可視化圖4.5收藏情況可視化圖4.6三連情況可視化由以上三張雷達(dá)圖可以看出,在點(diǎn)贊人數(shù)里,影視區(qū)的視頻擁有最高的點(diǎn)贊量,其次為生活區(qū);在投幣人數(shù)里,生活區(qū)的視頻擁有最高的投幣量,其次為動畫區(qū);在收藏人數(shù)里,時(shí)尚區(qū)的視頻擁有最高的收藏量,其次為影視區(qū)。4.4各區(qū)平均播放可視化為了進(jìn)一步對B站用戶喜愛視頻類型全面了解,若僅是對全站中的top100綜合評分視頻的數(shù)據(jù)分析可能還不足達(dá)到比較全面的效果。所以下面我將對所有視頻分區(qū)的top100綜合評分的視頻的平均播放量進(jìn)一步進(jìn)行分析。首先對前面提及的df_without_all按照分區(qū)名來進(jìn)行分類,其次再統(tǒng)計(jì)出各個分區(qū)情況數(shù)據(jù)的平均值,最后完成后存入csv文件中。如此一來便完成簡單的數(shù)據(jù)預(yù)處理。之后這里選擇折線圖對視頻平均播放量的數(shù)據(jù)進(jìn)行可視化,用前面所提及的方法轉(zhuǎn)化為以下的圖表。圖4.7各區(qū)播放量可視化由圖4.7可以看出,在各視頻分區(qū)的top100綜合評分之中,鬼畜區(qū)的平均播放量為最高,其次為生活區(qū),第三為動畫區(qū),相比于以往的生活區(qū)和動畫區(qū),相比于其它網(wǎng)站沒有而作為B站獨(dú)有特色的鬼畜區(qū)的平均播放量在這次有所上升。4.4熱門標(biāo)簽可視化在對視頻進(jìn)行了平均播放量的可視化分析之后,最后可以再對視頻的熱門標(biāo)簽進(jìn)行可視化的分析。因?yàn)樵贐站的視頻之中,每一個視頻都有不同的標(biāo)簽,而數(shù)量眾多的視頻的標(biāo)簽加起來就會出現(xiàn)標(biāo)簽重復(fù)的情況。所以接下來需要對視頻標(biāo)簽進(jìn)行一個去重的工作,求出唯一的標(biāo)簽,再去計(jì)算每一個標(biāo)簽出現(xiàn)的次數(shù)。該過程稍微比較復(fù)雜,首先要在tag_name得到所得數(shù)據(jù),然后創(chuàng)建一個特定規(guī)格的Dataframe,命名后遍歷df_without_all[‘tag_name’],如果與tag_df的columns對應(yīng),則將tag_df中對應(yīng)的columns*index單元格賦值為1,最后對每一列的1進(jìn)行求和。以上方法雖然比較復(fù)雜,但是Pandas庫里有更加簡便的方法能夠去實(shí)現(xiàn)這種復(fù)雜的操作。該方法在df_without_all的tag_name列提取熱門的標(biāo)簽,然后把熱門的標(biāo)簽數(shù)據(jù)作為一維的列表,再轉(zhuǎn)化為之后,調(diào)用方法進(jìn)行賦值。其熱門可視化如下圖。圖4.8熱門標(biāo)簽可視化由圖4.8可以看出,今年的熱門視頻標(biāo)簽與之前B站所統(tǒng)計(jì)的熱門視頻標(biāo)簽相對比,在B站熱門視頻標(biāo)簽出現(xiàn)最多的仍然是搞笑標(biāo)簽,而鬼畜和Bilibili新星計(jì)劃等幾個標(biāo)簽作為B站獨(dú)有的文化仍然比較顯眼,而且在今年的視頻標(biāo)簽中能夠發(fā)現(xiàn)挺多與生活相關(guān)的標(biāo)簽,這說明每一年的視頻標(biāo)簽都在不停地變化。第五章總結(jié)與展望5.1工作總結(jié)此次的畢業(yè)設(shè)計(jì)雖然耗時(shí)三四個月,但是作為對自己四年大學(xué)的一個總結(jié),還是經(jīng)過不懈努力把它完成了。從選題到開題報(bào)告,再從開題報(bào)告到畢業(yè)設(shè)計(jì)的實(shí)現(xiàn)以及論文的撰寫都需要查閱大量的課題資料與實(shí)現(xiàn)該設(shè)計(jì)的涉及的相關(guān)技術(shù)的文檔和書籍。通過這三四個月的不斷學(xué)習(xí)與動手實(shí)踐,也以這種一邊學(xué)習(xí)一邊動手的方式逐漸熟悉了基于Python對網(wǎng)站中網(wǎng)絡(luò)視頻的數(shù)據(jù)爬取和數(shù)據(jù)分析。在21世紀(jì)的今天,網(wǎng)絡(luò)發(fā)展越來越快,網(wǎng)上的娛樂方式也越來越多樣化,而如今在網(wǎng)上觀看視頻消遣時(shí)間越來越受到大眾的青睞。Bilibili視頻網(wǎng)站是現(xiàn)當(dāng)下年輕人最受歡迎的一個視頻網(wǎng)站。有調(diào)查顯示,直到2019年的10月份,Bilibili視頻網(wǎng)站的用戶在總體網(wǎng)絡(luò)視頻用戶占比高達(dá)90%。它與其他的視頻網(wǎng)站用戶相比較,其用戶忠實(shí)度更高,據(jù)其招募報(bào)告稱,其成員的12個月保留率達(dá)79%,而2009年注冊的用戶中60%的今天仍然活躍。Bilibili是目前國內(nèi)最受歡迎的綜合用戶網(wǎng)站,分析其視頻熱度可以從側(cè)面分析15-45歲群體的愛好,有著重要研究意義。本次論文所進(jìn)行的工作得出的總結(jié)主要有以下幾個方面:(1)通過分析B站綜合評分top100的視頻分類占比中,我們可以發(fā)現(xiàn)生活區(qū)的占比最高,其次為動畫區(qū),可見目前B站主流視頻類型為生活類和動畫類。(2)通過分析B站綜合評分top100的視頻平均播放量情況時(shí),我們可以發(fā)現(xiàn)動畫類型的視頻平均播放量最高,其次為時(shí)尚類的視頻,可見在B站用戶里最受歡迎的還是動畫類的視頻,也從進(jìn)一步判斷出B站用戶的年齡總體比較年輕。(3)通過分析B站用戶在top100視頻各分區(qū)的平均三連情況,我們可以發(fā)現(xiàn)點(diǎn)贊較多的視頻類型分別為影視、生活、動畫類型,投幣較多的視頻類型分別為動畫、生活、游戲類型,收藏較多的視頻類型分別為時(shí)尚、影視、動畫類型,其中最高的為時(shí)尚類型??偨Y(jié)平均三連情況可得知在點(diǎn)贊人數(shù)里,影視區(qū)的視頻擁有最高的點(diǎn)贊量,其次為生活區(qū);在投幣人數(shù)里,生活區(qū)的視頻擁有最高的投幣量,其次為動畫區(qū);在收藏人數(shù)里,時(shí)尚區(qū)的視頻擁有最高的收藏量,其次為影視區(qū)。由此可知B站用戶更喜歡把數(shù)量有限的幣投給動畫和生活類型的視頻,而相對于比較實(shí)用的時(shí)尚和科技類型的視頻他們就更偏向于收藏了。(4)通過分析B站視頻的熱門標(biāo)簽,我們可以知道今年的熱門視頻標(biāo)簽與之前B站所統(tǒng)計(jì)的熱門視頻標(biāo)簽相對比,在B站熱門視頻標(biāo)簽出現(xiàn)最多的仍然是搞笑標(biāo)簽,可見B站用戶多數(shù)都喜歡能給人帶來快樂的視頻類型。而鬼畜和Bilibili新星計(jì)劃等幾個標(biāo)簽作為B站獨(dú)有的文化仍然比較顯眼,而且在今年的視頻標(biāo)簽中能夠發(fā)現(xiàn)挺多與生活相關(guān)的標(biāo)簽,結(jié)合往年B站的熱門視頻標(biāo)簽分析,這說明在B站可能每一年的視頻標(biāo)簽都在不停地變化。5.2展望這個時(shí)代是被數(shù)據(jù)支配的時(shí)代,而數(shù)據(jù)分析毋庸置疑是當(dāng)今互聯(lián)網(wǎng)發(fā)展的必由之路。而網(wǎng)絡(luò)視頻作為當(dāng)下社會的精神文化產(chǎn)品,得到越來越多人的喜愛。所以對網(wǎng)絡(luò)視頻進(jìn)行數(shù)據(jù)分析顯得十分重要,它能幫助人們進(jìn)行判斷。而本文是基于Python對“嗶哩嗶哩視頻網(wǎng)”不同類型視頻進(jìn)行數(shù)據(jù)分析,能進(jìn)一步分析其視頻熱度,方便了解如今B站15-45歲群體的愛好。雖然本次通過對“嗶哩嗶哩視頻網(wǎng)”不同視頻類型的數(shù)據(jù)分析得到一定的成果,但是在此過程中仍然存在一些不足需要在以后的分析中得以完善。參考文獻(xiàn)[1]馬翔.視頻網(wǎng)站數(shù)據(jù)分析平臺中自制節(jié)目數(shù)據(jù)可視化應(yīng)用研究[D].湖南大學(xué),2015.[2]崔楠,郭俞,張會雄.基于彈幕數(shù)據(jù)分析的熱門短視頻評價(jià)研究[J].實(shí)驗(yàn)科學(xué)與技術(shù),2019,17(3).[3]徐璐.基于Web挖掘的視頻推薦系統(tǒng)分析與實(shí)現(xiàn)[D].2016.[4]顧軍華,高星,王守彬,等.基于大數(shù)據(jù)的IPTV視頻評估模型[J].計(jì)算機(jī)應(yīng)用與軟件,2018,35(8):231r237.[5]舒德華.基于Scrapy爬取電商平臺數(shù)據(jù)及自動問答系統(tǒng)的構(gòu)建[D].華中師范大學(xué),2016.[6]CamilaLange,AnaMariaGracianoFigueiredo,JacintaEnzweiler.EVALUATIONOFCoANDCrMOBILITYINSOILPROFILESCOLLECTEDINASCRAPYARDOFIMPOUNDEDVEHICLES[C]//InternationalNuclearAtlanticConference.2015.[7]高鴻斌,申肖陽.Python數(shù)據(jù)分析技術(shù)綜述[J].邯鄲職業(yè)技術(shù)學(xué)院學(xué)報(bào),2018,31(04):49-51.[8]王芳.基于Python的招聘網(wǎng)站信息爬取與數(shù)據(jù)分析[J].信息技術(shù)與網(wǎng)絡(luò)安全,2019,38(08):42-46,57.[9]徐勤亞,蔡繼鵬,王星.基于Python的影片數(shù)據(jù)分析[J].信息技術(shù)與信息化,2019(08):113-115.[10]趙綠草,饒佳冬.基于python的二手房數(shù)據(jù)爬取及分析[J].電腦知識與技術(shù),2019,15(19):1-3.[11]許素,許新華,柏瑤,張盼,黃瑾.基于python的微信公眾號關(guān)注者數(shù)據(jù)分析[J].電腦與信息技術(shù),2019,27(05):61-63.[12]陳華慶,冼遠(yuǎn)清,賴建明.網(wǎng)站彈幕視頻數(shù)據(jù)的挖掘與分析[J].福建電腦,2019,35(08):102-103.[13]鄭飏飏,徐健,肖卓.情感分析及可視化方法在網(wǎng)絡(luò)視頻彈幕數(shù)據(jù)分析中的應(yīng)用[J].現(xiàn)代圖書情報(bào)技術(shù),2015(11):82-90.
致謝轉(zhuǎn)眼間,我在美麗的東軟學(xué)院已經(jīng)度過了四年。四年,這是我人生中非常重要的四年,我很幸運(yùn)能夠接觸到這些不僅傳授我的知識,還能從更高的層次來指導(dǎo)我的人生和追求價(jià)值的導(dǎo)師。它們使我堅(jiān)定了人生的方向,獲得了追求前進(jìn)的動力,留下了大學(xué)生活的完美記憶。在這篇論文的設(shè)計(jì)過程中,從一開始接到論文題目到項(xiàng)目的實(shí)現(xiàn),最后到論文的完成,總共花費(fèi)了三個月時(shí)間。這其中我經(jīng)歷了很多的困難,但我最終克服了它們。我要感謝我的畢業(yè)論文導(dǎo)師范波老師,在學(xué)習(xí)過程中,老師給了我詳細(xì)的指導(dǎo),從選題指導(dǎo),論文框架到詳細(xì)修改,并提出了許多有價(jià)值的建議和建議。當(dāng)我在論文中期遇到難題的時(shí)候,他指導(dǎo)了我論文寫作的思路和方向。感謝給我論文提供了幫助和意見的朋友和同學(xué)們和參考文獻(xiàn)中的作者們,他們的幫助讓我在論文的編寫中有了很大的啟發(fā)。此外,感謝各位老師的辛勤工作。感謝廣東東軟學(xué)院給了我一個良好的學(xué)習(xí)和生活平臺,在這里我不但學(xué)習(xí)到了很多專業(yè)知識,結(jié)識了許多良師益友,也明白了“學(xué)無止境,氣有浩然”的真諦,也希望即將離開的我能在今后的道路上多為母校增光添彩。最后,我特別的感謝我的父母,他們不僅支持我完成學(xué)業(yè),同時(shí)也給予我很多寬容和愛,謹(jǐn)以此文回報(bào)父母。在此,我要向所有在百忙之中審閱論文并參加答辯的專家教授們表示衷心的感謝!附錄
怎樣提高電腦系統(tǒng)運(yùn)行速度WindowsXP的啟動速度比Windows2000要快30%左右,但相對于Windows98仍然要慢了不少,不過,我們可以通過優(yōu)化設(shè)置,來大大提高WindowsXP的啟動速度。加快系統(tǒng)啟動速度主要有以下方法:盡量減少系統(tǒng)在啟動時(shí)加載的程序與服務(wù);對磁盤及CPU等硬件進(jìn)行優(yōu)化設(shè)置;修改默認(rèn)設(shè)置,減少啟動等待時(shí)間等。這些方法大部分既可減少系統(tǒng)啟動的時(shí)間,又可以節(jié)省系統(tǒng)資源,加快電腦運(yùn)行速度。1.加快系統(tǒng)啟動速度WindowsXP的啟動速度比Windows2000要快30%左右,但相對于Windows98仍然要慢了不少,不過,我們可以通過優(yōu)化設(shè)置,來大大提高WindowsXP的啟動速度。加快系統(tǒng)啟動速度主要有以下方法:盡量減少系統(tǒng)在啟動時(shí)加載的程序與服務(wù);對磁盤及CPU等硬件進(jìn)行優(yōu)化設(shè)置;修改默認(rèn)設(shè)置,減少啟動等待時(shí)間等。這些方法大部分既可減少系統(tǒng)啟動的時(shí)間,又可以節(jié)省系統(tǒng)資源,加快電腦運(yùn)行速度。(1)MsconfigWindowsXP的啟動速度在系統(tǒng)安裝初期還比較快,但隨著安裝的軟件不斷增多,系統(tǒng)的啟動速度會越來越慢,這是由于許多軟件把自己加在了啟動程序中,這樣開機(jī)即需運(yùn)行,大大降低了啟動速度,而且也占用了大量的系統(tǒng)資源。對于這樣一些程序,我們可以通過系統(tǒng)配置實(shí)用程序Msconfig將它們從啟動組中排除出去。選擇“開始”菜單中的“運(yùn)行”命令,在“運(yùn)行”對話框中鍵入“Msconfig”,回車后會彈出“系統(tǒng)配置實(shí)用程序”對話框,選擇其中的“啟動”選項(xiàng)卡(如圖1),該選項(xiàng)卡中列出了系統(tǒng)啟動時(shí)加載的項(xiàng)目及來源,仔細(xì)查看每個項(xiàng)目是否需要自動加載,否則清除項(xiàng)目前的復(fù)選框,加載的項(xiàng)目越少,啟動的速度就越快。設(shè)置完成后需要重新啟動方能生效。(2)BootvisBootvis是微軟提供的一個啟動優(yōu)化工具,可提高WindowsXP的啟動速度。用BootVis提升WindowsXP的啟動速度必須按照正確的順序進(jìn)行操作,否則將不會起到提速的效果。其正確的操作方法如下:啟動Bootvis,從其主窗口(如圖2)中選擇“工具”菜單下的“選項(xiàng)”命令,在“符號路徑”處鍵入Bootvis的安裝路徑,如“C:\ProgramFiles\Bootvis”,單擊“保存”退出。從“跟蹤”菜單中選擇“下次引導(dǎo)”命令,會彈出“重復(fù)跟蹤”對話框,單擊“確定”按鈕,BootVis將引導(dǎo)WindowsXP重新啟動,默認(rèn)的重新啟動時(shí)間是10秒。系統(tǒng)重新啟動后,BootVis自動開始運(yùn)行并記錄啟動進(jìn)程,生成啟動進(jìn)程的相關(guān)BIN文件,并把這個記錄文件自動命名為TRACE_BOOT_1_1。程序記錄完啟動進(jìn)程文件后,會重新啟動BootVis主界面,在“文件”菜單中選擇剛剛生成的啟動進(jìn)程文件“TRACE_BOOT_1_1”。窗口中即會出現(xiàn)“CPU>使用”、“磁盤I/O”、“磁盤使用”、“驅(qū)動程序延遲”等幾項(xiàng)具體圖例供我們分析,不過最好還是讓BootVis程序來自動進(jìn)行分析:從“跟蹤”菜單中選擇“系統(tǒng)優(yōu)化”命令,程序會再次重新啟動計(jì)算機(jī),并分析啟動進(jìn)程文件,從而使計(jì)算機(jī)啟動得更快。(3)禁用多余的服務(wù)WindowsXP在啟動時(shí)會有眾多程序或服務(wù)被調(diào)入到系統(tǒng)的內(nèi)存中,它們往往用來控制Windows系統(tǒng)的硬件設(shè)備、內(nèi)存、文件管理或者其他重要的系統(tǒng)功能。但這些服務(wù)有很多對我們用途不大甚至根本沒有用,它們的存在會占用內(nèi)存和系統(tǒng)資源,所以應(yīng)該將它們禁用,這樣最多可以節(jié)省70MB的內(nèi)存空間,系統(tǒng)速度自然也會有很大的提高。選擇“開始”菜單中的“運(yùn)行”命令,在“運(yùn)行”對話框鍵入“services.msc”后回車,即可打開“服務(wù)”窗口。窗口的服務(wù)列表中列出了系統(tǒng)提供的所有服務(wù)的名稱、狀態(tài)及啟動類型。要修改某個服務(wù),可從列表雙擊它,會彈出它的屬性對話框(如圖3),你可從“常規(guī)”選項(xiàng)卡對服務(wù)進(jìn)行修改,通過單擊“啟動”、“停止”、“暫?!?、“恢復(fù)”四個按鈕來修改服務(wù)的狀態(tài),并可從“啟動類型”下拉列表中修改啟動類型,啟動類型有“自動”、“手動”、“已禁用”三種。如果要禁止某個服務(wù)在啟動自動加載,可將其啟動類型改為“已禁用”。WindowsXP提供的所有服務(wù)有36個默認(rèn)是自動啟動的,實(shí)際上,其中只有8個是必須保留的(見下表),其他的則可根據(jù)自己的需要進(jìn)行設(shè)置,每種服務(wù)的作用在軟件中有提示。4)修改注冊表來減少預(yù)讀取,減少進(jìn)度條等待時(shí)間WindowsXP在啟動過程中會出現(xiàn)一個進(jìn)度條,我們可以通過修改注冊表,讓進(jìn)度條只跑一圈就進(jìn)入登錄畫面。選擇“開始”菜單中的“運(yùn)行”命令,在“運(yùn)行”對話框鍵入“regedit”命令后回車,即可啟動注冊表編輯器,在注冊表中找HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\SessionManager\MemoryManagement\PrefetchParameters,選擇其下的EnablePrefetcher鍵,把它的鍵值改為“1”即可。(5)減少開機(jī)磁盤掃描等待時(shí)間當(dāng)Windows日志中記錄有非正常關(guān)機(jī)、死機(jī)引起的重新啟動,系統(tǒng)就會自動在啟動的時(shí)候運(yùn)行磁盤掃描程序。在默認(rèn)情況下,掃描每個分區(qū)前會等待10秒鐘,如果每個分區(qū)都要等上10秒才能開始進(jìn)行掃描,再加上掃描本身需要的時(shí)間,會耗費(fèi)相當(dāng)長的時(shí)間才能完成啟動過程。對于這種情況我們可以設(shè)置取消磁盤掃描的等待時(shí)間,甚至禁止對某個磁盤分區(qū)進(jìn)行掃描。選擇“開始→運(yùn)行”,在運(yùn)行對話框中鍵入“chkntfs/t:0”,即可將磁盤掃描等待時(shí)間設(shè)置為0;如果要在計(jì)算機(jī)啟動時(shí)忽略掃描某個分區(qū),比如C盤,可以輸入“chkntfs/xc:”命令;如果要恢復(fù)對C盤的掃描,可使用“chkntfs/dc:”命令,即可還原所有chkntfs默認(rèn)設(shè)置,除了自動文件檢查的倒計(jì)時(shí)之外。2.提高系統(tǒng)運(yùn)行速度提升系統(tǒng)運(yùn)行速度的思路與加快啟動的速度類似:盡量優(yōu)化軟硬件設(shè)置,減輕系統(tǒng)負(fù)擔(dān)。以下是一些常用的優(yōu)化手段。(1)設(shè)置處理器二級緩存容量WindowsXP無法自動檢測處理器的二級緩存容量,需要我們自己在注冊表中手動設(shè)置,首先打開注冊表,找到“HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\SessionManager\MemoryManagement\”,選擇其下的“SecondLevelDataCache”,根據(jù)自己所用的處理器設(shè)置即可,例如PIIICoppermine/P4Willamette是“256”,AthlonXP是“384”,P4Northwood是“512”。(2)提升系統(tǒng)緩存同樣也是在“HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\SessionManager\MemoryManagement\”位置,把其下的“LargeSystemCache”鍵值從0改為1,WindowsXP就會把除了4M之外的系統(tǒng)內(nèi)存全部分配到文件系統(tǒng)緩存中,這樣XP的內(nèi)核能夠在內(nèi)存中運(yùn)行,大大提高系統(tǒng)速度。通常來說,該優(yōu)化會使系統(tǒng)性能得到相當(dāng)?shù)奶嵘?,但也有可能會使某些?yīng)用程序性能降低。需要注意的是必須有256M以上的內(nèi)存,激活LargeSystemCache才可起到正面的作用,否則不要輕易改動它。(3)改進(jìn)輸入/輸出性能這個優(yōu)化能夠提升系統(tǒng)進(jìn)行大容量文件傳輸時(shí)的性能,不過這只對服務(wù)器用戶才有實(shí)在意義。我們可在中新建一個DWORD(雙字節(jié)值)鍵值,命名為IOPageLockLimit。一般情況下把數(shù)據(jù)設(shè)置8~16MB之間性能最好,要記住這個值是用字節(jié)來計(jì)算的,例如你要分配10MB的話,就是10×?1024×1024,也就是10485760。這里的優(yōu)化也需要你的機(jī)器擁有大于256M的內(nèi)存。(4)禁用內(nèi)存頁面調(diào)度在正常情況下,XP會把內(nèi)存中的片斷寫入硬盤,我們可以阻止它這樣做,讓數(shù)據(jù)保留在內(nèi)存中,從而提升系統(tǒng)性能。在注冊表中找到“HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\SessionManager\MemoryManagement\”下的“DisablePagingExecutive”鍵,把它的值從0改為1即可禁止內(nèi)存頁面調(diào)度了。(5)關(guān)閉自動重新啟動功能當(dāng)WindowsXP遇到嚴(yán)重問題時(shí)便會突然重新開機(jī),可從注冊表將此功能取消。打開注冊表編輯器,找到“HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\CrashControl\”將AutoReboot鍵的Dword值更改為0,重新啟動后設(shè)置即可生效。(6)改變視覺效果WindowsXP在默認(rèn)情況下啟用了幾乎所有的視覺效果,如淡入淡出、在菜單下顯示陰影。這些視覺效果雖然漂亮,但對系統(tǒng)性能會有一定的影響,有時(shí)甚至造成應(yīng)用軟件在運(yùn)行時(shí)出現(xiàn)停頓。一般情況下建議少用或者取消這些視覺效果。選擇桌面上“我的電腦”圖標(biāo),單擊鼠標(biāo)右鍵,在彈出的快捷菜單中選擇“屬性”命令,打開“系統(tǒng)屬性”對話框。選擇“高級”選項(xiàng)卡,在其中的“性能”欄中單擊“設(shè)置”按鈕,會彈出“性能選項(xiàng)”對話框(如圖4),可選擇“調(diào)整為最佳性能”單選框來關(guān)閉所有的視覺效果,也可選擇“自定義”然后選擇自己需要的視覺效果。(7)合理設(shè)置頁面虛擬內(nèi)存同樣也是在“性能選項(xiàng)”對話框中,選擇“高級”選項(xiàng)卡,在其中的“虛擬內(nèi)存”欄中單擊“更改”按鈕,接下來選擇虛擬內(nèi)存為“自定義大小”,然后設(shè)置其數(shù)值。一般情況下,把虛擬設(shè)為不小于256M,不大于382M比較合適,而且最大值和最小值最好一樣。(8)修改外觀方案WindowsXP默認(rèn)的外觀方案雖然漂亮,但對系統(tǒng)資源的占用也多,可將其改為經(jīng)典外觀以獲得更好的性能。在桌面空白位置單擊鼠標(biāo)右鍵,從彈出的快捷菜單中選擇“屬性”命令,會打開“顯示屬性”對話框,在“主題”選項(xiàng)卡選擇主題為“Windows經(jīng)典”,即可將外觀修改為更為經(jīng)濟(jì)的Windows經(jīng)典外觀。(9)取消XP對ZIP支持WindowsXP在默認(rèn)情況下打開了對zip文件支持,這要占用一定的系統(tǒng)資源,可選擇“開始→運(yùn)行”,在“運(yùn)行”對話框中鍵入“regsvr32/uzipfldr.dll”,回車確認(rèn)即可取消XP對ZIP解壓縮的支持,從而節(jié)省系統(tǒng)資源。(10)關(guān)閉Dr.WatsonDr.Watson是WindowsXP的一個崩潰分析工具,它會在應(yīng)用程序崩潰的時(shí)候自動彈出,并且在默認(rèn)情況下,它會將與出錯有關(guān)的內(nèi)存保存為DUMP文件以供程序員分析。不過,記錄DUMP文件對普通用戶則毫無幫助,反而會帶來很大的不便:由于Dr.Watson在應(yīng)用程序崩潰時(shí)會對內(nèi)存進(jìn)行DUMP記錄,將出現(xiàn)長時(shí)間硬盤讀寫操作,要很長一斷時(shí)間程序才能關(guān)閉,并且DUMP文件還會占用大量磁盤空間。要關(guān)閉Dr.Watson可打開注冊表編輯器,找到“HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\WindowsNT\CurrentVersion\AeDebug”分支,雙擊其下的Auto鍵值名稱,將其“數(shù)值數(shù)據(jù)”改為0,最后按F5刷新使設(shè)置生效,這樣就取消它的運(yùn)行了。同樣,我們可以把所有具備調(diào)試功能的選項(xiàng)取消,比如藍(lán)屏?xí)r出現(xiàn)的memory.dmp,可在“系統(tǒng)屬性”對話框中選擇“高級”選項(xiàng)卡,單擊“啟動和故障恢復(fù)”欄中的“設(shè)置”按鈕,并在彈出的“啟動和故障恢復(fù)”對話框中選擇“寫入調(diào)試信息”為“無”(如圖5)。(11)啟動硬盤/光驅(qū)DMA模式打開“系統(tǒng)屬性”對話框,選擇“硬件”選擇卡中的“設(shè)備管理器”按鈕,打開“設(shè)備管理器”窗口,在設(shè)備列表中選擇“IDEATA/ATAPI控制器”,雙擊“主要IDE通道”或“次要IDE通過”,在其屬性對話框的“高級設(shè)置”選項(xiàng)卡中檢查DMA模式是否已啟動,一般來說如果設(shè)備支持,系統(tǒng)就會自動打開DMA功能,如果沒有打開可將“傳輸模式”設(shè)為“DMA(若可用)”。(12)關(guān)掉不用的設(shè)備WindowsXP總是盡可能為電腦的所有設(shè)備安裝驅(qū)動程序并進(jìn)行管理,這不僅會減慢系統(tǒng)啟動的速度,同時(shí)也造成了系統(tǒng)資源的大量占用。針對這一情況,你可在設(shè)備管理器中,將PCMCIA卡、調(diào)制解調(diào)器、紅外線設(shè)備、打印機(jī)端口(LPT1)或者串口(COM1)等不常用的設(shè)備停用,方法是雙擊要停用的設(shè)備,在其屬性對話框中的“常規(guī)”選項(xiàng)卡中選擇“不要使用這個設(shè)備(停用)”。在重新啟動設(shè)置即可生效,當(dāng)需要使用這些設(shè)備時(shí)再從設(shè)備管理器中啟用它們。(13)關(guān)閉錯誤報(bào)告當(dāng)應(yīng)用程序出錯時(shí),會彈出發(fā)送錯誤報(bào)告的窗口,其實(shí)這樣的錯誤報(bào)告對普通用戶而言幾乎沒有任何意義,關(guān)閉它是明智的選擇。在“系統(tǒng)屬性”對話框中選擇“高級”選項(xiàng)卡,單擊“錯誤報(bào)告”按鈕,在彈出的“錯誤匯報(bào)”對話框中,選擇“禁用錯誤匯報(bào)”單選項(xiàng),最后單擊“確定”即可。另外我們也可以從組策略中關(guān)閉錯誤報(bào)告:從“運(yùn)行”中鍵入“gpedit.msc”,運(yùn)行“組策略編輯器”,展開“計(jì)算機(jī)配置→管理模板→系統(tǒng)→錯誤報(bào)告功能”,雙擊右邊設(shè)置欄中的“報(bào)告錯誤”,在彈出的“屬性”對話框中選擇“已禁用”單選框即可將“報(bào)告錯誤”禁用。(14)關(guān)閉自動更新“自動更新”功能對許多WindowsXP用戶而言并不是必需的,可將其關(guān)閉以節(jié)省系統(tǒng)資源。在“我的電腦”上單擊鼠標(biāo)右鍵,從快捷菜單中選擇“屬性”命令,選擇“系統(tǒng)屬性”對話框中的“自動更新”選項(xiàng)卡,勾選“關(guān)閉自動更新,我將手動更新計(jì)算機(jī)”單選框,單擊“確定”按鈕即可關(guān)閉自動更新功能。如果在“服務(wù)”已經(jīng)將“AutomaticUpdates”服務(wù)關(guān)閉,“系統(tǒng)屬性”對話框中的“自動更新”選項(xiàng)卡就不能進(jìn)行任何設(shè)置了。(15)去掉菜單延遲去掉菜單彈出時(shí)的延遲,可以在一定程度上加快XP。要修改的鍵值位置在“HKEY_CURRENT_USER\ControlPanel\Desktop”。修改其下的“MenuShowDelay”鍵,把默認(rèn)的400修改為0,按F5刷新注冊表即可生效。(16)清除預(yù)讀文件WindowsXP的預(yù)讀設(shè)置雖然可以提高系統(tǒng)速度,但是使用一段時(shí)間后,預(yù)讀文件夾里的文件數(shù)量會變得相當(dāng)龐大,導(dǎo)致系統(tǒng)搜索花費(fèi)的時(shí)間變長。而且有些應(yīng)用程序會產(chǎn)生死鏈接文件,更加重了系統(tǒng)搜索的負(fù)擔(dān)。所以,應(yīng)該定期刪除這些預(yù)讀文件。預(yù)計(jì)文件存放在WindowsXP系統(tǒng)文件夾的Prefetch文件夾中,該文件夾下的所有文件均可刪除。(17)關(guān)閉自動播放功能在WindowsXP中,當(dāng)往光驅(qū)中放入光盤或?qū)SB硬盤接上電腦時(shí),系統(tǒng)都會自動將光驅(qū)或USB硬盤掃描一遍,同時(shí)提示你是否播放里面的圖片、視頻、音樂等文件,如果是擁有多個分區(qū)的大容量的USB硬盤,掃描會耗費(fèi)很長的時(shí)間,而且你得多次手動關(guān)閉提示窗口,非常麻煩。這種情況下我們可以將WindowsXP的自動播放功能關(guān)閉。運(yùn)行“組策略”程序。在組策略窗口左邊欄中,打開“計(jì)算機(jī)配置”,選擇“管理模板”下的“系統(tǒng)”,然后在右邊的配置欄中找到“關(guān)閉自動播放”并雙擊它,會彈出“關(guān)閉自動播放屬性”對話框。在其中“設(shè)置”選項(xiàng)卡中選擇“已啟用”,“關(guān)閉自動播放”下拉列表中選擇“所有驅(qū)動器”(如圖6)。這樣以后就不用擔(dān)心WindowsXP的“自動播放”功能帶來的麻煩了。如果你只是想禁止系統(tǒng)掃描某個驅(qū)動器(如USB硬盤)上的文件,可采用下面的方法。先連上你的USB硬盤,讓系統(tǒng)將它識別出來。然后打開“我的電腦”,選擇USB硬盤上的某個分區(qū),按鼠標(biāo)右鍵,會彈出磁盤屬性窗口,選取“自動播放”選項(xiàng)卡,將所有內(nèi)容的類型都選擇為不執(zhí)行操作。如果USB硬盤有多個分區(qū),對所有分區(qū)都進(jìn)行同樣的操作,這樣當(dāng)你將USB驅(qū)動器拔掉再重新接上時(shí),系統(tǒng)會將USB硬盤識別出來,而不會反復(fù)問你是否播放USB硬盤中的文件了。3.加快關(guān)機(jī)速度WindowsXP的關(guān)機(jī)速度要慢于啟動速度,特別有些任務(wù)還需要手工結(jié)束,更加延緩了關(guān)機(jī)速度。因此,要加快關(guān)機(jī)速度,首先要開啟WindowsXP的自動結(jié)束任務(wù)功能。具體步驟是:從注冊表中找到“HKEY_CURRENT_USER\ControlPanel\Desktop”,把“AutoEndTasks”的鍵值設(shè)置為1即可。然后再修改“HungAppTimeout”為“4000(或更小)”(預(yù)設(shè)為5000),該鍵值同樣也在“HKEY_CURRENT_USER\ControlPanel\Desktop”下;最后一步再找到“HKEY_LOCAL_MACHINE\System\CurrentControlSet\Control\”,同樣把WaitToKillServiceTimeout設(shè)置為“4000”;通過這樣設(shè)置后的關(guān)機(jī)速度明顯要加快了。夠全面吧~~◆二、硬件優(yōu)化設(shè)置◆1、關(guān)掉不用的設(shè)備
在設(shè)備管理器中,將PCMCIA卡、調(diào)制解調(diào)器、紅外線設(shè)備、打印機(jī)端口(LPT1)或者串口(COM1)等不常用的設(shè)備停用,在要停用設(shè)備屬性對話框中的“常規(guī)”選項(xiàng)卡中選擇“不要使用這個設(shè)備(停用)”。當(dāng)需要使用這些設(shè)備時(shí)再從設(shè)備管理器中啟用它們?!?、內(nèi)存性能優(yōu)化
WindowsXP中有幾個選項(xiàng)可以優(yōu)化內(nèi)存性能,它們?nèi)荚谧员硐旅嫖恢茫篐KEY_LOCAL_MACHINESYSTEMCurrentControlSetControlSession
ManagerMemory
Management
1)禁用內(nèi)存頁面調(diào)度(Paging
Executive)
XP會把內(nèi)存中的片斷寫入硬盤,我們可以阻止它這樣做,讓數(shù)據(jù)保留在內(nèi)存中,從而提升系統(tǒng)性能。256M以上內(nèi)存才使用這個設(shè)置。把“DisablePagingExecutive”的值從0改為1就可以禁止內(nèi)存頁面調(diào)度了。
2)提升系統(tǒng)緩存
必須有256M以上的內(nèi)存,才激活它。把LargeSystemCache鍵值從0改為1,一般來說,這項(xiàng)優(yōu)化會使系統(tǒng)性能得到相當(dāng)?shù)奶嵘?,但也有可能會使某些?yīng)用程序性能降低。
3)輸入/輸出性能
內(nèi)存大于256M才更改這里的值,這個優(yōu)化只對server(服務(wù)器)用戶才有實(shí)在意義,它能夠提升系統(tǒng)進(jìn)行大容量文件傳輸時(shí)的性能。建一個DWORD(雙字節(jié)值)鍵值,命名為IOPageLockLimit,數(shù)值設(shè)8M-16M字節(jié)之間性能最好,具體設(shè)什么值,可試試哪個值可獲得最佳性能。這個值是用字節(jié)來計(jì)算的,比如你要分配12M,就是12×1024×1024,也就是12582912?!?、啟動硬盤/光驅(qū)DMA模式
“系統(tǒng)屬性”-“硬件”-“設(shè)備管理器”,在設(shè)備列表中選擇“IDE
ATA/ATAPI控制器”,雙擊“主要
IDE
通道”或“次要
IDE
通道”,在其屬性對話框的“高級設(shè)置”選項(xiàng)卡中檢查DMA模式是否已啟動,一般來說如果設(shè)備支持,系統(tǒng)就會自動打開DMA功能,如果沒有打開可將“傳輸模式”設(shè)為“DMA(若可用)”(在BIOS里也應(yīng)該要先設(shè)為支持DMA)。
◆4、關(guān)閉自動播放功能
運(yùn)行“組策略”程序,在組策略窗口左邊欄中打開“計(jì)算機(jī)配置”,選擇“管理模板”下的“系統(tǒng)”,然后在右邊的配置欄中找到“關(guān)閉自動播放”并雙擊它,會彈出“關(guān)閉自動播放屬性”對話框,在其中“設(shè)置”選項(xiàng)卡中選擇“已啟用”,“關(guān)閉自動播放”下拉列表中選擇“所有驅(qū)動器”。
◆5、設(shè)置二級緩存容量
WindowsXP有時(shí)無法自動檢測處理器的二級緩存容量,需要我們手動設(shè)置。運(yùn)行注冊表編輯器,找到HKCU_LOCAL_MACHINESYSTEMCurrentControlSetControlSession
ManagerMemory
Management,選擇Dword值SecondLevelDataCache(如果沒有就新建這個值),修改這個值(填時(shí)使用10進(jìn)制)為你的CPU的二級緩存的大小,比如你的CPU的二級緩存是256KB,就修改Dword值SecondLevelDataCache為10進(jìn)制的256即可。二級緩存大小介紹AMD系列Duron
64KB
K6-3
Thunderbird
AthlonXP
256KB
K6-2
Athlon
512KB;Intel系列CeleronA
Celeron2
128KB
P2
Mobile
P3E(EB)
P4
Willamette
256KB
P2
P3(katmai)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年自動平滑門項(xiàng)目可行性研究報(bào)告
- 2025年竹纖維家居服項(xiàng)目可行性研究報(bào)告
- 2025至2031年中國電池專用材料行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025年水管手推車項(xiàng)目可行性研究報(bào)告
- 2025年顯微(細(xì)胞)電泳系統(tǒng)項(xiàng)目可行性研究報(bào)告
- 2025至2031年中國尋像器行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025至2031年中國商業(yè)印刷票據(jù)表格行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025至2031年中國兒童多用臺行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025年免維護(hù)閥控式鉛酸電池項(xiàng)目可行性研究報(bào)告
- 2025年U型收音機(jī)項(xiàng)目可行性研究報(bào)告
- NB-T 47013.1-2015 承壓設(shè)備無損檢測 第1部分-通用要求
- 初中歷史 教材分析與教學(xué)策略 課件
- (完整word版)手卡模板
- GB/T 13912-2020金屬覆蓋層鋼鐵制件熱浸鍍鋅層技術(shù)要求及試驗(yàn)方法
- 統(tǒng)編教學(xué)小學(xué)語文課外閱讀《細(xì)菌世界歷險(xiǎn)記》導(dǎo)讀課課件
- 幼兒剪紙-打印版
- 中小學(xué)2021年秋季開學(xué)第一課手心班會圖文精品
- 高三英語閱讀專項(xiàng)訓(xùn)練之說明文(含答案及部分解析)
- 中國移動CHBN試題題庫大全(含答案)
- 醫(yī)學(xué)課件:介入放射學(xué)(全套課件328張)
- 2022年同等學(xué)力人員申請碩士學(xué)位日語水平統(tǒng)一考試真題
評論
0/150
提交評論