版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
評(píng)委一評(píng)分,簽名及備注隊(duì)號(hào):20024評(píng)委三評(píng)分,簽名及備注評(píng)委二評(píng)分,簽名及備注選題:B評(píng)委四評(píng)分,簽名及備注題目:網(wǎng)上書(shū)店圖書(shū)推薦摘要在如今大數(shù)據(jù)時(shí)代,信息過(guò)載已成為購(gòu)書(shū)者與擇書(shū)之間的主要矛盾。針對(duì)這一問(wèn)題,結(jié)合spss,excel,matlab,yaahp等軟件,研究用戶與書(shū)籍、書(shū)籍與標(biāo)簽之間的關(guān)系,本文構(gòu)建對(duì)購(gòu)書(shū)者進(jìn)行書(shū)籍推薦的模型算法。本文要求根據(jù)給出數(shù)據(jù),先需要解決三方面問(wèn)題。首先,通過(guò)user_social.txt,book_tag.txt,user_book_score.txt分析出影響用戶對(duì)書(shū)籍評(píng)分的因素,再用excel表格處理已知數(shù)據(jù)后,從而得到具體的影響數(shù)值。然后,根據(jù)得出的影響數(shù)值推測(cè)用戶評(píng)分的計(jì)算公式,再對(duì)公式進(jìn)行檢驗(yàn)其正確性,從而計(jì)算出評(píng)分結(jié)果。根據(jù)評(píng)分公式計(jì)算出用戶所喜愛(ài)類書(shū)籍中書(shū)籍的分?jǐn)?shù),依照分?jǐn)?shù)高低進(jìn)行推薦。針對(duì)問(wèn)題一,用excel表格對(duì)用戶的社會(huì)關(guān)系、書(shū)籍與標(biāo)簽關(guān)系、用戶對(duì)書(shū)籍評(píng)分處理分析得出用戶對(duì)書(shū)籍的評(píng)價(jià)。從而,假設(shè)出影響因素分別是用戶所感興趣的書(shū)籍、書(shū)籍受歡迎程度、其他用戶對(duì)該書(shū)的評(píng)價(jià)。用yaahp軟件處理用戶對(duì)書(shū)籍的評(píng)分與書(shū)籍的受歡迎程度、用戶的興趣愛(ài)好、及書(shū)的綜合評(píng)分的關(guān)系,得出各影響因素的權(quán)重,從而證明假設(shè)的成立,得到用戶對(duì)書(shū)籍評(píng)分的影響因素。針對(duì)問(wèn)題二,根據(jù)問(wèn)題一中得到的影響因素,用excel表格處理書(shū)籍ID與標(biāo)簽的數(shù)據(jù)、用戶ID與關(guān)系好友數(shù)據(jù)和用戶ID與用戶評(píng)分?jǐn)?shù)據(jù)三種數(shù)據(jù),從而得到具體的影響數(shù)值。根據(jù)得出的影響數(shù)值推測(cè)用戶評(píng)分的計(jì)算公式,運(yùn)用user_score.txt中的評(píng)分?jǐn)?shù)據(jù)檢驗(yàn)用戶評(píng)分公式的正確性。針對(duì)問(wèn)題三,運(yùn)用問(wèn)題二中所建立的模型,在用戶所感興趣的書(shū)籍分類中篩選出一部分書(shū)籍,綜合書(shū)籍受歡迎程度、其他用戶對(duì)該書(shū)的評(píng)價(jià)兩項(xiàng)因素,根據(jù)公式計(jì)算所篩選書(shū)籍的分?jǐn)?shù),將篩選出的書(shū)籍的評(píng)分最高的三本書(shū)書(shū)推薦給用戶。關(guān)鍵字:聚類分析法,隨機(jī)抽樣法網(wǎng)上書(shū)店圖書(shū)推薦1問(wèn)題重述在大數(shù)據(jù)時(shí)代,信息過(guò)載已成讀者最重要的問(wèn)題。針對(duì)這一問(wèn)題我們?yōu)榫W(wǎng)上購(gòu)買(mǎi)書(shū)籍的讀者進(jìn)行書(shū)籍推薦。隨著信息技術(shù)和互聯(lián)網(wǎng)的發(fā)展,已經(jīng)是消費(fèi)者和生產(chǎn)者日益頭疼的事情。推薦,就是解決這一矛盾的重要工具,在互聯(lián)網(wǎng)的產(chǎn)品及其應(yīng)用中被廣泛采用,包括大家經(jīng)常使用的相關(guān)搜索、話題推薦、電子商務(wù)的各種產(chǎn)品推薦、社交網(wǎng)絡(luò)上的交友推薦等。我們獲得了一個(gè)著名網(wǎng)上書(shū)店的用戶行為信息,包括對(duì)于書(shū)籍的評(píng)分?jǐn)?shù)據(jù),書(shū)籍的標(biāo)簽信息以及用戶的社交關(guān)系,根據(jù)數(shù)據(jù)完成以下問(wèn)題。1.1問(wèn)題一分析影響用戶對(duì)書(shū)籍評(píng)分的因素;1.2問(wèn)題二建立一個(gè)模型,預(yù)測(cè)predict.txt附件中的用戶對(duì)未看過(guò)書(shū)籍的評(píng)分;1.3問(wèn)題三針對(duì)predict.txt附件中的用戶,給每個(gè)用戶推薦3本沒(méi)看過(guò)的書(shū)籍。2問(wèn)題分析隨著信息技術(shù)和互聯(lián)網(wǎng)的不斷發(fā)展,信息過(guò)剩已成為生產(chǎn)者和消費(fèi)者的主要矛盾。然而,推薦是可以解決這種問(wèn)題的優(yōu)良工具,在互聯(lián)網(wǎng)的產(chǎn)品和消費(fèi)中被廣泛應(yīng)用。但是,在使用過(guò)程中還需要不斷的優(yōu)化。對(duì)于問(wèn)題一,本文通過(guò)book_tag.txt中的已知數(shù)據(jù)書(shū)籍ID和標(biāo)簽,進(jìn)行標(biāo)簽數(shù)量統(tǒng)計(jì)和處理,最終得到了一份準(zhǔn)確的書(shū)籍和書(shū)籍受歡迎程度的關(guān)系圖,得出影響用戶對(duì)書(shū)籍評(píng)價(jià)的影響因素,建立影響因素和評(píng)分的層次分析法模型,并且運(yùn)用yaahp軟件判斷影響因素和評(píng)分的一致性,得到各影響因素的權(quán)值。對(duì)于問(wèn)題二,根據(jù)模型一已經(jīng)確定的影響因素,用excel表格對(duì)user_social.txt分析處理用戶ID和關(guān)系好友ID數(shù)據(jù),得到用戶的好友數(shù)量與其興趣愛(ài)好準(zhǔn)確數(shù)值關(guān)系,用excel表格對(duì)book_tag.txt分析處理書(shū)籍ID和標(biāo)簽這兩個(gè)數(shù)據(jù),得到書(shū)籍的受歡迎程度與書(shū)籍的標(biāo)簽個(gè)數(shù)的準(zhǔn)確數(shù)值關(guān)系,用excel表格對(duì)user_book_score.txt處理score數(shù)據(jù),用戶對(duì)該書(shū)籍的評(píng)價(jià),總結(jié)出了用戶在這些因素下評(píng)價(jià)所占的比例,得到用戶對(duì)未看過(guò)書(shū)籍的評(píng)分關(guān)系式,需要用戶對(duì)未看過(guò)書(shū)籍的預(yù)測(cè)評(píng)價(jià)較多,根據(jù)分析和處理出的評(píng)價(jià)因素,在Matlab中依據(jù)確定的用戶ID和書(shū)籍ID建立預(yù)測(cè)用戶評(píng)分模型。最終,計(jì)算出用戶對(duì)未書(shū)籍的評(píng)分。對(duì)于問(wèn)題三,運(yùn)用聚類分析法對(duì)書(shū)籍及用戶的興趣愛(ài)好進(jìn)行分類,以確定用戶興趣所屬類別。根據(jù)問(wèn)題二所建立的模型,考慮三種因素,對(duì)書(shū)籍進(jìn)行評(píng)分,因素一,分?jǐn)?shù)較高的書(shū)籍;因素二,書(shū)籍所屬類別是否是用戶所喜愛(ài)書(shū)籍的類別;因素三,書(shū)籍的受歡迎程度。根據(jù)這三個(gè)因素確定比重,運(yùn)用加權(quán)的思想來(lái)對(duì)書(shū)籍進(jìn)行最終評(píng)分,選擇評(píng)分高的三本書(shū)籍推薦給用戶。模型的假設(shè)假設(shè)這一網(wǎng)站的數(shù)據(jù)具有一定的可信度。2.假設(shè)在大量具有相同標(biāo)簽的用戶中,無(wú)論隨機(jī)選取那幾個(gè)進(jìn)行分析,篩選,研究,對(duì)最終的結(jié)果都沒(méi)有影響。3.假設(shè)在處理預(yù)測(cè)predict.txt附件中的用戶對(duì)未看過(guò)書(shū)籍評(píng)分時(shí),帶入建立的模型求解時(shí)無(wú)數(shù)據(jù)遺漏。4符號(hào)說(shuō)明R書(shū)籍受歡迎程度P標(biāo)簽個(gè)數(shù)Q為標(biāo)簽的總個(gè)數(shù)N用戶對(duì)該書(shū)的評(píng)價(jià)M其他用戶對(duì)該書(shū)籍的評(píng)分K加權(quán)興趣愛(ài)好L該用戶好友數(shù)量O所有好友數(shù)量5模型的建立與求解5.1模型一:應(yīng)用層次分析法對(duì)影響因素的分析5.1.1模型的建立用excel表格分別對(duì)user_social.tx中的好友數(shù)量數(shù)據(jù),對(duì)user_score.txt中的用戶對(duì)書(shū)籍的評(píng)分?jǐn)?shù)據(jù),對(duì)book_tag.txt中的標(biāo)簽個(gè)數(shù)的數(shù)據(jù)統(tǒng)計(jì)處理,得到下圖的關(guān)系:用戶好友數(shù)量越多用戶好友數(shù)量越多興趣愛(ài)好越廣對(duì)書(shū)籍評(píng)分影響書(shū)籍所對(duì)應(yīng)標(biāo)簽的個(gè)數(shù)該書(shū)籍受歡迎程度對(duì)書(shū)籍評(píng)分影響其他用戶對(duì)書(shū)籍評(píng)分的均值對(duì)書(shū)籍評(píng)分影響在進(jìn)一步分析所給數(shù)據(jù),將書(shū)籍受歡迎程度與標(biāo)簽的個(gè)數(shù)(附錄1)兩者進(jìn)行對(duì)比,規(guī)定:極不受歡迎書(shū)籍(標(biāo)簽個(gè)數(shù)為1~10),一般受歡迎書(shū)籍(標(biāo)簽個(gè)數(shù)為11~30),很受歡迎書(shū)籍(標(biāo)簽個(gè)數(shù)為31~40),非常受歡迎書(shū)籍(標(biāo)簽個(gè)數(shù)為41~50)的數(shù)據(jù),excel表格部分?jǐn)?shù)據(jù)示例如表2表2標(biāo)簽個(gè)數(shù)(不受歡迎)書(shū)籍ID標(biāo)簽個(gè)數(shù)(很受歡迎)書(shū)籍ID標(biāo)簽個(gè)數(shù)(一般受歡迎)書(shū)籍ID標(biāo)簽個(gè)數(shù)(非常受歡迎)書(shū)籍ID6163860345778391298661241274044616592434614043129870654130810361668343465716912988748413448466168268346859061498895141494356616855934692757149917794164225661726443469689914992258423469356174218347376271499226342743366617863634741844149924544281853161806663476292414993711428910726188994348770641499964042917092619314934906498151029864297985861934713511001415106465431792784195382351530551510649143231082可以準(zhǔn)確得出影響用戶對(duì)書(shū)籍評(píng)價(jià)的因素主要有:書(shū)籍受歡迎程度、用戶的興趣愛(ài)好、其他用戶對(duì)某書(shū)的評(píng)價(jià)這三個(gè)因素。因此用yaahp軟件處理評(píng)分與書(shū)籍受歡迎度、興趣愛(ài)好、其他用戶對(duì)該書(shū)的評(píng)價(jià)之間關(guān)系如圖2所示。圖2影響因素與最終評(píng)分的關(guān)系圖5.1.2模型的求解模型優(yōu)化后通過(guò)運(yùn)用yaahp軟件對(duì)評(píng)分與書(shū)籍受歡迎度、用戶興趣愛(ài)好、其他用戶對(duì)該書(shū)的評(píng)價(jià)三者之間關(guān)系做層析分析處理得到影響因素的權(quán)重如表3所示:表3權(quán)重的影響因素表影響因素權(quán)重其他用戶對(duì)該書(shū)籍的評(píng)分0.1085書(shū)籍受歡迎度0.3445用戶興趣愛(ài)好0.5469 表3直接說(shuō)明書(shū)籍受歡迎程度、用戶興趣愛(ài)好、其他用戶對(duì)該書(shū)籍的評(píng)價(jià)這三方面中用戶對(duì)書(shū)籍評(píng)價(jià)這一因素對(duì)評(píng)分影響最大。5.2模型二:預(yù)測(cè)用戶對(duì)書(shū)籍評(píng)分模型5.2.1模型的建立在模型一中已經(jīng)得到用戶對(duì)書(shū)籍的評(píng)分與書(shū)籍受歡迎程度、用戶興趣愛(ài)好、其他用戶對(duì)該書(shū)籍的評(píng)價(jià)三個(gè)影響因素有關(guān),分別對(duì)這三個(gè)因素進(jìn)行分析,過(guò)程如下:用戶的興趣愛(ài)好:用excel表格對(duì)user_sociaI.txt中的用戶ID和關(guān)系好友ID個(gè)數(shù)兩個(gè)數(shù)據(jù)整理分析,發(fā)現(xiàn)用戶的好友數(shù)量越多,用戶興趣愛(ài)好越廣泛,對(duì)用戶評(píng)分的影響越大,具體關(guān)系如表4所示。計(jì)算關(guān)系式:其中K為加權(quán)興趣愛(ài)好,L為該用戶好友數(shù)量,O為所有好友的數(shù)量表4用戶和興趣愛(ài)好的關(guān)系圖用戶ID6363474865086173401421572977655371627962221048694興趣愛(ài)好3.3%16.3%45.6%22.8%9.8%39.1%32.6%用戶ID4980857183513265537251002088996160170780814325398興趣愛(ài)好9.8%19.5%26.0%6.5%3.3%13.0%13.0%2.書(shū)籍受歡迎程度:用excel表格對(duì)book_tag.txt中書(shū)籍ID與標(biāo)簽數(shù)量統(tǒng)計(jì)處理,由前兩者之間的關(guān)系不難看出,標(biāo)簽越多,書(shū)籍受歡迎程度越高,對(duì)書(shū)籍評(píng)分影響越大。書(shū)籍ID與書(shū)籍受歡迎程度的關(guān)系如下表5表5書(shū)籍的受歡迎程度書(shū)籍ID169509264062420913868975240941659378954484書(shū)籍受歡迎程度1.06%1.06%1.58%1.36%1.89%1.81%1.28%書(shū)籍ID568717809022758331234149792521366825449772書(shū)籍受歡迎程度1.21%0.83%2.04%0.83%2.34%1.06%1.21%其中R為書(shū)籍受歡迎程度,P為標(biāo)簽個(gè)數(shù),Q為標(biāo)簽總個(gè)數(shù)。3.其他用戶對(duì)該書(shū)籍的評(píng)價(jià)M:用excel對(duì)user_book_score.txt中用戶ID、評(píng)分兩個(gè)數(shù)據(jù)進(jìn)行整理分析過(guò)程如下:1)利用excel對(duì)第一個(gè)用戶篩選2)將用戶對(duì)評(píng)分求取平均值3)對(duì)每一個(gè)用戶重復(fù)上述操作。發(fā)現(xiàn)所有用戶的評(píng)分均近似為4,其他用戶對(duì)書(shū)的評(píng)分為M,所以4.用戶評(píng)分在三種影響因素中用戶的興趣愛(ài)好占的比例較大,經(jīng)分析后其他兩個(gè)影響因素在用戶對(duì)書(shū)籍的評(píng)價(jià)的過(guò)程可以抽象的表示出來(lái),用matlab軟件建立用戶、書(shū)籍、標(biāo)簽三者關(guān)系的數(shù)據(jù)庫(kù),由計(jì)算過(guò)程:N=5F×0.3445R×0.1085M×0.5469K其中R為書(shū)籍受歡迎程度,N為評(píng)分,M為其他用戶對(duì)該書(shū)的評(píng)分,K為加權(quán)興趣愛(ài)好,F為系數(shù)。將user_score.txt中的評(píng)分?jǐn)?shù)據(jù)、用戶ID、書(shū)籍ID代入matlab程序,從而得出F的近似值F=177778。5.2.1模型的求解:用excel表格處理Predict.txt中的用戶ID.書(shū)籍ID數(shù)據(jù)帶入matlab程序中可以預(yù)測(cè)predict.txt附件中的用戶對(duì)書(shū)籍的評(píng)分近似值為:表5用戶ID書(shū)籍ID預(yù)測(cè)評(píng)分用戶ID書(shū)籍ID預(yù)測(cè)評(píng)分76252254736903762522542469137625225929118476252259164694762522523533847625225793936576252254246913415665817503147625225916469441566584227113762522579393654156658585783441566581750314415665841299024156658422711341566581340032415665858578344156658443948141566584129902599783434693524156658134003259978341447183415665844394815997834827305476252254736903599783421956027625225929118459978342420573762522523533845.3模型三:對(duì)用戶進(jìn)行書(shū)籍推薦模型5.3.1模型的建立問(wèn)題三中要求針對(duì)predict.txt附件中的用戶,給每個(gè)用戶推薦3本沒(méi)看過(guò)的書(shū)籍,據(jù)題意確立聚類分析模型:根據(jù)spss軟件的功能,運(yùn)用分析工具中的系統(tǒng)聚類工具將題所給附件book_tag.txt中的書(shū)籍ID、標(biāo)簽數(shù)據(jù)進(jìn)行處理,將書(shū)籍ID類型處理為字符串,書(shū)籍標(biāo)簽的類型處理為數(shù)值,運(yùn)行系統(tǒng)聚類程序,得到的數(shù)據(jù)及圖表,(由于數(shù)據(jù)量較大,所以圖片其中一部分舉例進(jìn)行說(shuō)明)運(yùn)行圖書(shū)推薦程序得到三本推薦書(shū)籍:聚類表6案例處理匯總a案例有效缺失總計(jì)N百分比N百分比N百分比1271.5824298.58369100.0a.平均聯(lián)結(jié)(組之間)平均聯(lián)結(jié)(組之間)表7聚類表階群集組合系數(shù)首次出現(xiàn)階群集下一階群集1群集2群集1群集2157716192147242923.0000062244396815161340446.000005731162552164166115.0000016452675282168006424.0000011518774708169471026.000005668055093177916221.0000074717596503179102451.0000055819017984181309867.000006198303778184692578.00000631048107030186547317.00000271152676516194516107.00040471249427180196511468.00000381345897821199639761.000003114216275201565531.00000691523815737202021686.0000072圖3圖3群集類數(shù)圖圖1圖1圖4圖4聚類樹(shù)狀圖5.3.2模型的求解根據(jù)聚類樹(shù)狀圖4中書(shū)籍分為八類,運(yùn)用從八類書(shū)籍隨機(jī)抽取得出下表:(說(shuō)明:表中數(shù)字為書(shū)籍ID,下表中數(shù)據(jù)僅為所有書(shū)籍分類中的一部分,以這些隨機(jī)樣本代替總樣本數(shù)據(jù)。)表8第一類第二類第三類第四類第五類第六類第七類第八類884743101745102986551643688187426364754767589998100009103782129881820784223691355073787684590146102706104237134305231082770141229939198312196951102725110658143586722671234942131744690361754189105962121087157550560582131872590521493772819779106524134003199101921583525258754413397065928548107332135549200059987277263412328814659891932942114170143060215360331959775739165179562050918448114362175523252244528760165274787907169073448022120925176010256409725510329141229187660723689336122820191971265634234262475428755214421442689680131620219766302667824572526197788626431614264062134100244004316087235338723083625361431616394874136436267990317957242462535649429982529928886668138892283989350675400664428853790439857871886726138979285950366773368136197094921652497692690124144718307516368034171996724071102794208596231821147432310747403836991905199801463355825795100916151357319219406318468251560404627501268745821844154093326576408945337843855350999640170547494481156825338076429153305472986612912354826008854951173339342102430748830061135305103496847643593008175368357403444506207515168093595026301819691672175598358808448779339247331989955890629687298462177508369249472122651953921863923530307021265832186718379543499604930066233832858105269545921213186722385074522532766799823758859106499231921289189056385819535384373630758341531592761443823006194667393789538665603182168785171218827275954211196630408656540544537695496726138518569349856054206953412572548210243094103535864171172132594081207095415774568348308966693536237464760796692757按照問(wèn)題二中所建立的模型,推薦書(shū)籍考慮用戶的興趣、大眾對(duì)書(shū)籍的評(píng)分和書(shū)籍的受歡迎程度。根據(jù)以上因素,依據(jù)用戶的興趣喜好,找到用戶喜愛(ài)書(shū)籍所在類,在類中查找書(shū)籍,對(duì)用戶進(jìn)行書(shū)籍推薦。根據(jù)模型推測(cè),得書(shū)籍推薦如表8所示。用戶ID書(shū)籍ID72454814057852475748088393762522542915368303773090141566582310827433669798585997834429153891072307078892140783214499163773194612515537226571709644139769表96模型的評(píng)價(jià)6.1模型的優(yōu)點(diǎn)根據(jù)要求解的問(wèn)題,從已知數(shù)據(jù)book_tag.txt中書(shū)籍的受歡迎程度作為出發(fā)點(diǎn),并且建立了層次分析法模型來(lái)驗(yàn)證,更加準(zhǔn)確的描述了影響因素的準(zhǔn)確度,從而增加了人們?cè)谠u(píng)價(jià)時(shí)的準(zhǔn)確度。根據(jù)各因素抽象出評(píng)價(jià)時(shí)所占的比例具有一定的可信度。6.2模型的缺點(diǎn)從給予的大量數(shù)據(jù)中只是進(jìn)行了相應(yīng)的篩選.處理后,得到最終的影響因素,沒(méi)有從多角度出發(fā)來(lái)分析這個(gè)問(wèn)題的因素,表現(xiàn)的有點(diǎn)片面,得到的影響因素可能在某種程度上不能達(dá)到每個(gè)人都想要的結(jié)果。未對(duì)數(shù)據(jù)進(jìn)行檢驗(yàn)、篩除,所執(zhí)行模型的結(jié)果存在一定誤差。7參考文獻(xiàn)[1]鄧雪,李家銘,曾浩健,陳俊羊,趙俊峰.層次分析法權(quán)重計(jì)算方法分析及其應(yīng)用研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2012,07:93-100.[2]宋媛.聚類分析中確定最佳聚類數(shù)的若干問(wèn)題研究[D].延邊大學(xué),2013.[3]黃杏模.談?wù)労?jiǎn)單隨機(jī)抽樣法及估計(jì)問(wèn)題[J].云南林業(yè)調(diào)查規(guī)劃設(shè)計(jì),1995.[4]胡守信,李柏年.基于MATLAB的數(shù)學(xué)實(shí)驗(yàn).北京:科學(xué)出版社,2004[5]吳禮斌,李柏年.數(shù)學(xué)實(shí)驗(yàn)與建模.北京:高等教育出版社,2006[6]胡良劍,孫曉君.MATLAB與數(shù)學(xué)實(shí)驗(yàn).北京:高等教育出版社,2006[7]龔純,王正林.MALAB語(yǔ)言常用算法程序集.北京:電子工業(yè)出版社,2008[8]江世宏.MATLAB語(yǔ)言與數(shù)學(xué)實(shí)驗(yàn).北京:科學(xué)出版社,20078附錄附錄1.附錄1.1書(shū)籍ID884743851976589835165852327696557075163860196630688152524320196644622630360490753709786479693598688187589884910215786499262213196682917579327764524376524378753761852074458861721007360565491638131191524413950401852102426124196753622747426142458915950437327846464241983210589998890368557244950462書(shū)籍受歡迎程度0.9%11.1%0.9%13.9%20.3%13.9%3.7%26.8%15.7%7.4%13.9%9.2%11.1%12.9%16.6%12.9%12.9%6.5%10.2%19.4%30.5%12.9%12.9%6.5%10.2%12.0%12.0%2.8%16.6%12.0%21.2%18.5%8.3%0.9%11.1%6.5%6.5%12.0%13.9%12.9%18.5%12.0%10.2%19.4%0.9%1.8%12.9%10.2%14.8%附錄1.2用戶ID63634748650861734014215729776553716279622210486943.3%16.3%45.6%22.8%9.8%39.1%32.6%49808571835132655372510020889961601707808143253989.8%19.5%26.0%6.5%3.3%13.0%13.0%附錄2:Biaoqian.xls部分?jǐn)?shù)據(jù)實(shí)例書(shū)籍ID169509264062420913868975240941659378954484568717809022792521366825449772受歡迎程度0.010.010.020.010.020.020.010.010.010.020.010.01用戶ID629145752428825505027707789283886194194320664098491750592359322262147260293458912931興趣愛(ài)好0.490.160.130.200.460.070.160.290.130.070.130.07matable執(zhí)行程序M=xlsread('biaoqian.xls',-1);L=xlsread('biaoqian.xls',-1);a=find(M==169509);a=M(2,a)b=find(L==6291457);b=L(4,b)c=4*1/3;e=a*b*5*c 附錄3:#include<stdio.h>main(){intmax=0;ID=0;biaoqian=0;n=0;%打開(kāi)book_tag.txt和user_book_score.txta[][3]=fopen(g:\數(shù)模\user_book_score.txt);b[][]=fopen(g:\數(shù)模\book_tag.txt);%查找用戶評(píng)分最高的書(shū)籍for(i=0;i>=0;i++){while(a[i][0]==a[i+1][0]){if(a[i][2]>a[i+1][2]){max=a[i][2];ID=a[i][1];}else{max=a[i+1][2];ID=a[i+1][1];}}%調(diào)出與高分書(shū)籍相應(yīng)的標(biāo)簽for(i=0;i>=0;i++){if(ID==a[i][0])biaoqian=a[i][1];}%查找含有此標(biāo)簽的書(shū)籍IDfor(i=0;i>=0;i++){for(j=0;j>=0;j++){While(n<3){%輸出三本書(shū)籍if(b[i][j]=biaoqian)&&if(b[i][j]!=ID)%排除已看過(guò)的書(shū),得到未看過(guò)的書(shū){printf(“%d\n”);n++;}}}}}}平均聯(lián)結(jié)(組之間)聚類表階群集組合系數(shù)首次出現(xiàn)階群集下一階群集1群集2群集1群集2157716192147242923.0000062244396815161340446.000005731162552164166115.0000016452675282168006424.0000011518774708169471026.000005668055093177916221.0000074717596503179102451.0000055819017984181309867.000006198303778184692578.00000631048107030186547317.00000271152676516194516107.00040471249427180196511468.00000381345897821199639761.000003114216275201565531.00000691523815737202021686.0000072161164613203018603.50030471712074899203328586.00000351844845610204248228.00000941918126919205180442.00000492030155185206541327.00000432134707563207911533.0000070225574010208939126.0000050237614348212082691.00000642426674255214451948.00000892516405319214680928.00000592622628268217888726.0000079275454810218927827.500010782839184249219598994.00000762934087955221020638.00000523012837572222411381.00000423130384589224366696.500013833243516410224892017.00000513330647717226284816.00000533417115367228207619.00000633512077836228485357.00017066367218195229087801.00000763731915482229971675.00000443832794942235646981.000012703956295682238971362.00000694051467941239019700.00000804113867627239390677.00000614212832804240754142.500300894330157591244099236.500200904431916668245464110.500370854534497528246856465.00000734611262239248357043.0000092471165267248450846.7781611564830364471252326094.0000084493561812252551460.00001987505576226252913923.000220845142184351253905301.500032805234086332255657622.000290745310883064261308215.00003375541398057262663025.00000775517593118263283222.5007083561161877263533341.333475675744395575264906782.00020905850666002266849064.000001095916405821267490404.0002501066058666757268312641.000001126113861901268641977.00041886625485771270363319.5000192638301711272118893.00093488647615713273679938.500230936540915053276426098.0000091664711207279057505.00003579671167878279942617.875560986816574386280188229.0000010369215629281346893.5001439977032793470281596505.50038211017168877856285128885.000001047223812495285249771.0001501177316733449286119344.500045117748053408289787917.167652947510881378289973264.667530107767213918292021041.000362895771398321292807609.500540114785454508297992604.33327098794712262298030884.2506626998042185146298686328.33351401028144544907301243314.000001138255608189301891468.000001268317593038304557200.444553195845573036304705904.3335048118858093191304727679.667044100861771386304945798.00006199873566811305452283.33349010488444830307466020.2500631008912832667310452092.66742241069030154439312946956.00043571019140918228313295560.000650102925481126315404930.83362469393548761321636985.4009264111948054484323701668.8007418107957211759326860308.83376831099659447791329073760.0000012497215183331956408.25069011298116545334818397.750677810399177471335452137.7008679108100444809336132641.050888510810130153279336467075.733907010510240914218338360907.20091801051031161657347128550.65498681101043566887347396273.250877111310530154091351935186.0
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度2025版木材行業(yè)標(biāo)準(zhǔn)制定合作合同2篇
- 福建省泉州市南安市2024-2025學(xué)年八年級(jí)上學(xué)期期末英語(yǔ)試題(無(wú)答案)
- 創(chuàng)新創(chuàng)業(yè)-職業(yè)核心能力課件
- 絲印精加工在微型電子設(shè)備制造領(lǐng)域的應(yīng)用考核試卷
- 二零二五年度墓地陵園土地租賃與使用權(quán)轉(zhuǎn)讓合同4篇
- 母嬰行業(yè)2025年度母嬰用品環(huán)保認(rèn)證服務(wù)合同2篇
- 二零二五版鋼材貨物流動(dòng)銀行托管運(yùn)輸合同3篇
- 二零二五年度木制品生產(chǎn)與銷(xiāo)售承包合同3篇
- 2025年公司內(nèi)部競(jìng)業(yè)保密協(xié)議
- 2025年太陽(yáng)能光伏電站智能監(jiān)控工程施工合同
- 2024年高純氮化鋁粉體項(xiàng)目可行性分析報(bào)告
- 安檢人員培訓(xùn)
- 山東省濰坊市2024-2025學(xué)年高三上學(xué)期1月期末 英語(yǔ)試題
- 危險(xiǎn)性較大分部分項(xiàng)工程及施工現(xiàn)場(chǎng)易發(fā)生重大事故的部位、環(huán)節(jié)的預(yù)防監(jiān)控措施
- 《榜樣9》觀后感心得體會(huì)四
- 2023事業(yè)單位筆試《公共基礎(chǔ)知識(shí)》備考題庫(kù)(含答案)
- 化學(xué)-廣東省廣州市2024-2025學(xué)年高一上學(xué)期期末檢測(cè)卷(一)試題和答案
- 2025四川中煙招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- EHS工程師招聘筆試題與參考答案(某大型央企)2024年
- 營(yíng)銷(xiāo)策劃 -麗亭酒店品牌年度傳播規(guī)劃方案
- 2025年中國(guó)蛋糕行業(yè)市場(chǎng)規(guī)模及發(fā)展前景研究報(bào)告(智研咨詢發(fā)布)
評(píng)論
0/150
提交評(píng)論