




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第6章個性化推薦:主動滿足你的需求課后習題答案一、考考你 1.下列哪類算法不屬于個性化推薦D。A.協(xié)同推薦 B.基于內(nèi)容的推薦C.關(guān)聯(lián)規(guī)則推薦 D.分類推薦2.基于用戶的協(xié)同推薦算法的特點是B。A.找出用戶的特征 B.基于用戶行為計算用戶相似度C.找出物品的特征 D.計算物品的相似度3.下列哪個方法C不是用于計算相似度的。A.歐式距離 B.皮爾遜相關(guān)系數(shù)C.均方根誤差(RMSE) D.余弦向量4.關(guān)聯(lián)規(guī)則中置信度的含義是B。A.物品頻繁出現(xiàn)的概率 B.一個物品的銷售數(shù)量對另一個物品的影響C.規(guī)則出現(xiàn)的概率 D.兩個物品同時出現(xiàn)的頻次與前一個物品出現(xiàn)頻次的比例5.在關(guān)聯(lián)規(guī)則分析過程中,對原始數(shù)據(jù)集進行事務(wù)型數(shù)據(jù)處理的主要原因是C。A.提高數(shù)據(jù)處理速度 B.節(jié)省存儲空間C.方便算法計算 D.形成商品交易矩陣 二、亮一亮1.協(xié)同過濾推薦與關(guān)聯(lián)規(guī)則推薦的區(qū)別是什么?他們各自適用在哪些場合?參考答案:協(xié)同過濾(Collaborativefiltering),是指通過收集群體用戶的偏好信息,自動化預(yù)測(過濾)個體用戶可能感興趣的內(nèi)容。協(xié)同過濾基于如下基本假設(shè):如果一個人A在一個問題上和另一個人B持相同觀點,那么對于另外一個問題,比起隨機選擇的一個路人C,A更有可能同B持相同觀點。具體包括User-based的協(xié)同過濾和Item-based的協(xié)同過濾技術(shù)。關(guān)聯(lián)規(guī)則分析(AssociationRules,又稱BasketAnalysis)用于從大量數(shù)據(jù)中挖掘出有價值的數(shù)據(jù)項之間的關(guān)聯(lián)關(guān)系。關(guān)聯(lián)規(guī)則解決的常見問題如:“如果一個消費者購買了產(chǎn)品A,那么他有多大機會購買產(chǎn)品B?”以及“如果他購買了產(chǎn)品C和D,那么他還將購買什么產(chǎn)品?”兩者的區(qū)別比較明顯:1)關(guān)聯(lián)規(guī)則面向的是事務(wù)transaction,而協(xié)同過濾面向的是用戶偏好(評分)。2)協(xié)同過濾在計算相似商品的過程中可以使用關(guān)聯(lián)規(guī)則分析,但是在有用戶評分的情況下(非1/0),協(xié)同過濾算法應(yīng)該比傳統(tǒng)的關(guān)聯(lián)規(guī)則更能產(chǎn)生精準的推薦。3)協(xié)同過濾的約束條件沒有關(guān)聯(lián)規(guī)則強,或者說更為靈活,可以考慮更多的商業(yè)實施措施和特殊的商業(yè)規(guī)則。2.在案例1推薦你喜愛的電影中,如何計算兩個用戶之間的相似度?參考答案:任兩位用戶之間的相似度,是基于他倆都觀看過且評論過相同的電影,由于每位用戶評論的電影不完全一樣,所以先要找到兩位用戶共同評論過的電影,然后再計算兩者之間的相似度,相似度用歐式距離公式計算。 三、幫幫我 1.基于案例1的樣本數(shù)據(jù),利用基于物品的協(xié)同推薦算法向用戶推薦他喜歡的電影。 提示:1)給用戶推薦那些和他之前喜歡的電影相似的電影。2)計算物品相似度:首先統(tǒng)計每部電影被哪些人評論過,記為{電影標題:{用戶id:評分}},其次計算兩部電影之間的相關(guān)系數(shù),即計算兩部電影被相同人評價過的差異,記為sim(a,b),然后根據(jù)你擬推薦用戶曾經(jīng)看過的電影評分rating,以及與這些電影相似度最大的m部電影,根據(jù)公式rating×sim(a,b)計算用戶對電影的興趣度,記為{電影標題:興趣度},最后取興趣度最大的TopN部電影推薦給該用戶,從而完成電影推薦工作。參考答案:importpandasaspdfrommathimport*importoperator#構(gòu)建用戶-->物品的字典defloadData(moviesFile,ratingsFile):movies=pd.read_csv(moviesFile)ratings=pd.read_csv(ratingsFile)merge_data=pd.merge(movies,ratings,on='movieId')merge_data=merge_data[['userId','rating','movieId','title']].sort_values('userId')datas=merge_data.values.tolist()data={};forlineindatas:userid,score,item=line[0],line[1],line[3];data.setdefault(userid,{});data[userid][item]=score;returndatadata=loadData('data/movies.csv','data/ratings.csv')#構(gòu)造物品-物品的相似矩陣defsimilarity(data):N={};#喜歡物品i的總?cè)藬?shù)C={};#喜歡物品i也喜歡物品j的人數(shù)foruser,itemindata.items():fori,scoreinitem.items():N.setdefault(i,0);N[i]+=1;C.setdefault(i,{});forj,scoresinitem.items():ifjnotini:C[i].setdefault(j,0);C[i][j]+=1;#計算物品與物品的相似矩陣W={}fori,iteminC.items():W.setdefault(i,{});forj,item2initem.items():W[i].setdefault(j,0);W[i][j]=C[i][j]/sqrt(N[i]*N[j]);returnW#根據(jù)用戶的歷史記錄,給用戶推薦物品defrecommandList(data,W,userid,k=3,N=10):rank={};fori,scoreindata[userid].items():#獲得用戶user歷史記錄,如A用戶的歷史記錄為{'a':'1','b':'1','d':'1'}forj,winsorted(W[i].items(),key=operator.itemgetter(1),reverse=True)[0:k]:#獲得與物品i相似的k個物品ifjnotindata[userid].keys():#該相似的物品不在用戶user的記錄里rank.setdefault(j,0);rank[j]+=float(score)*w;#返回推薦結(jié)果returnsorted(rank.items(),key=operator.itemgetter(1),reverse=True)[0:N]W=similarity(data);#計算物品相似矩陣print(recommandList(data,W,5,3,10));#打印出用戶id=5的最喜歡的3個物品的前10個推薦結(jié)果運行結(jié)果:2.假如某零售超市準備舉辦一場關(guān)于berries(漿果)旺季的促銷活動,請你根據(jù)案例2的購物籃數(shù)據(jù),找出包含berries的所有可行動規(guī)則,據(jù)此為超市提供營銷建議或策略。參考答案:解決本題的主要思路是基于groceries.csv的數(shù)據(jù)設(shè)置合理的置信度,計算出包含所有berries的關(guān)聯(lián)規(guī)則,根據(jù)關(guān)聯(lián)規(guī)則為超市提供營銷策略。將groceries.csv文件轉(zhuǎn)換為事務(wù)型數(shù)據(jù)importpandasaspdimportnumpyasnpimportcsvfrommlxtend.preprocessingimportTransactionEncoderfrommlxtend.frequent_patternsimportapriorifrommlxtend.frequent_patternsimportassociation_rulesls_data=[]withopen(r'data\groceries.csv','r')asf:reader=csv.reader(f)forrowinreader:ls_data.append(row)te=TransactionEncoder()#進行one-hot編碼te_array=te.fit(ls_data).transform(ls_data)df=pd.DataFrame(te_array,columns=te.columns_)利用Apriori找出包含berries的頻繁項集(其中min_support是基于試驗確定的值)freq_item=apriori(df,min_support=0.01,max_len=2,use_colnames=True)freq_item.sort_values(by='support',axis=0,ascending=False)freq_item.loc[freq_item['itemsets'].str.len()>1].sort_values(by='support',axis=0,ascending=False)#查看含有berries頻繁項集set_itemsets=map(set,freq_item.itemsets.values.tolist())freq_item['have-berries']=['berries'iniforiinset_itemsets]freq_item.loc[freq_item['have-berries']==True]3)提取有用的銷售關(guān)聯(lián)規(guī)則pd.set_option('display.max_rows',None)rules=association_rules(freq_item,min_threshold=0.025)rules.sort_values(by='confidence',axis=0,ascending=False)#選擇含有'berries'的前因項的規(guī)則set_rules=map(set,rules.antecedents.value
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第15課《我們不亂扔》教學設(shè)計-2024-2025學年一年級道德與法治上冊統(tǒng)編版
- 展覽館裝修合同
- 2025年度建筑企業(yè)農(nóng)民工勞動合同創(chuàng)新模式試點方案
- 2025年度五星級酒店與VIP客人個性化服務(wù)協(xié)議
- 2025年度房產(chǎn)贈與與可持續(xù)發(fā)展合同
- 2025年度冷鏈物流貨運損壞賠償協(xié)議書
- 二零二五年度人工智能教育平臺合作協(xié)議中的支付及費用分攤細則
- 2025年度帶寵物友好房屋出租協(xié)議電子版
- 2025年度廣告代理合同解除通知期限與費用結(jié)算規(guī)范
- 2025年度報廢車買賣及報廢車輛拆解與環(huán)保設(shè)施投資合同
- 男方欠女方錢離婚協(xié)議書范本
- 《積極心理學(第3版)》 課件 第1章 主觀幸福感
- 2024-2030年中國匹克球市場前景預(yù)判與未來發(fā)展形勢分析研究報告
- 小學二年級新學期開學學生家長會承上啟下的二年級模板
- LY/T 3370-2024草原術(shù)語及分類
- 工程異常處理管理規(guī)定
- 2024軌道交通絕緣配合第1部分:基本要求電工電子設(shè)備的電氣間隙和爬電距離
- 《田間試驗統(tǒng)計》課件-項目二 田間試驗設(shè)計與實施
- 一年級下冊《讀讀童謠和兒歌》試題及答案共10套
- CHZ 3002-2010 無人機航攝系統(tǒng)技術(shù)要求(正式版)
- 免拆底模鋼筋桁架樓承板圖集
評論
0/150
提交評論