2023下醫(yī)學(xué)大數(shù)據(jù)分析與決策學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年_第1頁
2023下醫(yī)學(xué)大數(shù)據(jù)分析與決策學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年_第2頁
2023下醫(yī)學(xué)大數(shù)據(jù)分析與決策學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年_第3頁
2023下醫(yī)學(xué)大數(shù)據(jù)分析與決策學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年_第4頁
免費預(yù)覽已結(jié)束,剩余6頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2023下醫(yī)學(xué)大數(shù)據(jù)分析與決策學(xué)習(xí)通超星期末考試章節(jié)答案2024年2.20某排球隊6名場上隊員的身高(單位:cm)是:180,184,188,190,192,194?,F(xiàn)用一名身高為186cm的隊員換下場上身高192cm的隊員,與換人前相比,場上隊員的身高(

)

答案:平均數(shù)變小,方差變小2.18我國發(fā)現(xiàn)的首例甲型H1N1流感確診病例在某醫(yī)院隔離觀察,要掌握他在一周內(nèi)的體溫是否穩(wěn)定,則醫(yī)生需了解這位病人7天體溫的(

)

答案:方差2.17有一-組數(shù)據(jù)7、11、12、7、7、8、11,下列說法錯誤的是(

)

答案:中位數(shù)是72.16采用默認(rèn)算法計算出的序列12,3,4,56,78,18,46,78,100的第一個四分位數(shù)是(

)

答案:122.15一組數(shù)據(jù)按從小到大排列為1,2,4,x,6,9,這組數(shù)據(jù)中的中位數(shù)為5,那么這組數(shù)據(jù)的眾數(shù)為(

)。

答案:62.13關(guān)于眾數(shù),以下說法正確的是(

)

答案:眾數(shù)在一組數(shù)中會有好幾個2.12na.rm=TRUE,序列3.1,2,5,NA,6.2,4,7的中位數(shù)是(

)

答案:4.52.11序列3.1,2,5,3.8,6.2,4,7的中位數(shù)是(

)

答案:42.10以下不是數(shù)據(jù)離散趨勢度量的是(

)

答案:眾數(shù)2.9以下不是數(shù)據(jù)集中趨勢度量的是(

)

答案:方差2.6屬性對應(yīng)二維表中的(

)。

答案:列2.5數(shù)據(jù)對象也稱實體,用(

)來描述。

答案:屬性2.4數(shù)據(jù)表中第1條記錄為“JohnDoe|john.doe@|123MainStreet”,第5條記錄為“JohnDoe|john.doe@|123MainSt.”,說明數(shù)據(jù)中存在(

)問題

答案:重復(fù)性2.3患者性別輸入時,有的輸入值為F、M,有的輸入值為0、1,這是典型的(

)問題。

答案:數(shù)據(jù)不一致2.2數(shù)據(jù)中存在“年齡=-100”的情況,這說明數(shù)據(jù)中存在(

)問題。

答案:噪聲2.1數(shù)據(jù)預(yù)處理占數(shù)據(jù)分析過程(

)工作量。

答案:60%以上1.20關(guān)于PIC數(shù)據(jù)庫,以下說法錯誤的是(

)。

答案:PIC數(shù)據(jù)庫注冊后就可免費下載。1.19以下不是組學(xué)大數(shù)據(jù)資源的是(

)

答案:MIMIC數(shù)據(jù)庫1.18app數(shù)據(jù)獲取方法,不正確的是(

)。

答案:通過SQL語句獲取1.17以下不是結(jié)構(gòu)化大數(shù)據(jù)采集工具的是(

)

答案:飛機(jī)采集器1.16以下不屬于直接導(dǎo)出結(jié)構(gòu)化數(shù)據(jù)的是(

)

答案:API程序接口1.15醫(yī)學(xué)倫理審查,免除審查的情況有(

)。

答案:使用公開獲取的數(shù)據(jù)庫且受試者的身份不會被直接或間接地識別1.14以下不屬于倫理審查方式的是(

)

答案:普通審查1.13個性化醫(yī)療的基礎(chǔ)是(

)。

答案:基于基因分析的精準(zhǔn)用藥。1.12醫(yī)學(xué)大數(shù)據(jù)用于藥物研發(fā),以下說法不正確的是(

)。

答案:利用藥品研發(fā)大數(shù)據(jù),可以提高臨床診療質(zhì)量。1.11對醫(yī)學(xué)大數(shù)據(jù)進(jìn)行指導(dǎo)性分析,以下說法正確的是(

)。

答案:結(jié)合數(shù)據(jù)、分析模型和領(lǐng)域知識,確定最優(yōu)解決方案。1.10對醫(yī)學(xué)大數(shù)據(jù)進(jìn)行預(yù)測性分析,以下說法正確的是(

)。

答案:利用各種可變數(shù)據(jù)對疾病或健康狀況進(jìn)行預(yù)測。1.9對醫(yī)學(xué)大數(shù)據(jù)進(jìn)行診斷性分析,以下說法正確的是(

)。

答案:根據(jù)結(jié)果去分析產(chǎn)生結(jié)果的原因。1.8對醫(yī)學(xué)大數(shù)據(jù)進(jìn)行描述性分析,以下說法正確的是()。

答案:可以分析患者使用的某種藥物以及治療的效果。1.7大數(shù)據(jù)分析與傳統(tǒng)統(tǒng)計分析的區(qū)別是(

)。

答案:大數(shù)據(jù)分析的數(shù)據(jù)質(zhì)量不高,很多“臟”數(shù)據(jù)。1.6以下不是醫(yī)學(xué)大數(shù)據(jù)的特征的是(

)。

答案:變異性1.5大數(shù)據(jù)的value特性是指(

)。

答案:數(shù)據(jù)價值高,價值密度低;1.4大數(shù)據(jù)的5V特征是在傳統(tǒng)的4V特征上增加了(

)。

答案:Veracity真實性1.3醫(yī)學(xué)大數(shù)據(jù)的種類不包括以下哪項?(

)

答案:自動駕駛研發(fā)數(shù)據(jù)1.2最早提出“bigdata”的是(

)。

答案:BillInmon1.1通常所說的大數(shù)據(jù)的數(shù)據(jù)規(guī)模級別是(

)。

答案:PB級別/star3/origin/a8ae8eb350c60cc837724f6093ed73b5.jpg

答案:45度4.19

當(dāng)特征值大致相等時(

)

答案:PCA將表現(xiàn)不佳4.18

R中實現(xiàn)lasso算法的包有(

)①lars包

②cv.lars包

③glmnet包

④cv.glmnet包

答案:①③4.17

特征選擇模型的評價方法有(

)①交叉驗證法

②CP統(tǒng)計量

③F統(tǒng)計量

④t統(tǒng)計量

答案:①②4.16關(guān)于lasso算法的描述,正確的是(

)①lasso算法是一種變量選擇技術(shù)

②lasso算法用于數(shù)據(jù)降維③lasso算法只適用于線性情況

④lasso算法只適用于非線性情況

答案:①②4.15

R中畫碎石圖的函數(shù)為(

)

答案:screenplot()4.14PCA中,主成分選擇的方法有(

)①計算累計貢獻(xiàn)率,達(dá)到85%以上為主成分

②畫碎石圖,從圖中找出主成分③計算貢獻(xiàn)率,達(dá)到85%以上為主成分

④畫相關(guān)系數(shù)圖,從圖中找出主成分

答案:①②4.13PCA中,相關(guān)系數(shù)矩陣的特征值和特征向量,以下說法正確的是(

)

答案:eigen()函數(shù)用于求矩陣的特征值和特征向量4.12以下關(guān)于相關(guān)系數(shù)矩陣和協(xié)方差矩陣的描述,正確的是(

)

答案:標(biāo)準(zhǔn)化后的矩陣,其相關(guān)系數(shù)矩陣和協(xié)方差矩陣是相同的4.11R中實現(xiàn)主成分分析的函數(shù)為(

)

答案:princomp()4.8以下關(guān)于主成分分析PCA的說法,正確的是(

)①進(jìn)行主成分分析之前要對數(shù)據(jù)進(jìn)行中心化

②要選出方差最大的作為主成分③要選出方差最小的作為主成分

④主成分分析主要用于指標(biāo)綜合評價

答案:①②④4.5數(shù)據(jù)降維的應(yīng)用包括(

)①監(jiān)督學(xué)習(xí)中訓(xùn)練數(shù)據(jù)的降維

②圖像處理中的特征降維③生物技術(shù)中致病基因的發(fā)現(xiàn)

④監(jiān)督學(xué)習(xí)中測試數(shù)據(jù)的降維

答案:①②③4.4數(shù)據(jù)降維的意義包括(

)①便于計算

②便于可視化

③提取有效信息

④防止過擬合

答案:①②③④4.3數(shù)據(jù)降維的本質(zhì)是學(xué)習(xí)一個映射函數(shù),該映射函數(shù)(

)

答案:可以是線性的或非線性的4.1有關(guān)維的概念,以下說法正確的是(

)①維通常被稱作字段或?qū)傩?/p>

②維通常被稱作特征

③維通常被稱作列④維通常被稱作變量

⑤維通常被稱作記錄

⑥維通常被稱作對象⑦維通常被稱作行

⑧維通常被稱作樣本

答案:①②③④3.20在畫兩個變量的散點圖時,下列哪個敘述是正確的(

)

答案:自變量在x軸上,因變量在y軸上3.19在回歸分析中,代表了數(shù)據(jù)點和它在回歸直線上相對應(yīng)的差異的是(

)

答案:殘差平方和3.18兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的決定系數(shù)R2如下,其中擬合效果最好的模型是(

)

答案:模型1的決定系數(shù)R2為0.983.17兩個變量y與x的回歸模型中,通常用R2來刻畫回歸的效果,則正確的敘述是(

)

答案:R2越小,殘差平方和大3.16一位母親記錄了兒子3-9歲的身高,由此建立的身高與年齡的回歸直線方程為y=7.19X+73.93,據(jù)此可以預(yù)測這個孩子10歲時的身高,則正確的敘述是(

)

答案:身高在145.83cm左右3.14對于以下回歸分析的結(jié)論,正確的有(

)個(1)在回歸分析中,可用決定系數(shù)R2的值判斷模型的擬合效果,R2越大,模型的擬合效果越好;(2)在回歸分析中,可用殘差平方和判斷模型的擬合效果,殘差平方和越大,模型的擬合效果越好;(3)在回歸分析中,可用相關(guān)系數(shù)的值判斷模型的擬合效果,r越小,模型的擬合效果越好;(4)在回歸分析中,可用殘差圖判斷模型的擬合效果,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明這樣的模型比較合適,帶狀區(qū)域的寬度越窄,說明模型的擬合精度越高;

答案:23.13下列說法中正確的是(

)

答案:人的知識與其年齡具有相關(guān)關(guān)系3.12

對兩個變量x,y進(jìn)行線性回歸分析時,回歸步驟順序正確的是(

)①對所求出的回歸直線方程作出解釋②收集數(shù)據(jù)(X,Y)③求線性回歸方程④求未知參數(shù)⑤根據(jù)所收集的數(shù)據(jù)繪制散點圖

答案:②⑤④③①3.11非線性回歸的方法有(

)

答案:以上都是3.10

R語言中自動選擇最優(yōu)回歸模型的函數(shù)是(

)

答案:step()3.9關(guān)于校正決定系數(shù),以下說法錯誤的是(

)

答案:校正決定系數(shù)越大,模型越差3.6

以下關(guān)于決定系數(shù)的描述,正確的是(

)

答案:決定系數(shù)越大,回歸模型的擬合效果越好3.5

以下不是線性回歸的假設(shè)檢驗內(nèi)容的是(

)

答案:差分檢驗/star3/origin/3d908a58872f3564e7f524c1c0d8f356.png

答案:截距3.2因變量為二分類變量時,選擇(

)。

答案:logistic回歸3.1關(guān)于回歸,以下說法,不正確的是(

)

答案:回歸用于描述變量間的確定性關(guān)系5.19

R中實現(xiàn)apriori算法需要用到(

)

答案:arules包5.18

(

)描述了關(guān)聯(lián)規(guī)則的最低重要程度

答案:最小支持度5.17

Apriori算法結(jié)束的條件是(

)

答案:候選k-項集為空5.16

FP-growth算法主要步驟有(

)①構(gòu)建FP樹

②產(chǎn)生頻繁項集候選集③從FP樹中挖掘頻繁項集

④對頻繁項集進(jìn)行剪枝

答案:①③5.15

關(guān)于A=>B關(guān)聯(lián)規(guī)則提升度lift,以下說法正確的是(

)

答案:如果lift>1,則A、B的出現(xiàn)是正相關(guān)的5.14

FP-Growth算法和Apriori算法最大的不同是(

)

答案:FP-Growth算法不產(chǎn)生候選集5.13

Apriori算法中k項頻繁項集連接的條件是(

)

答案:前k-1項相同,第k項不同5.12

Apriori算法產(chǎn)生k項頻繁項集候選集的方法是(

)

答案:將k-1項頻繁項集進(jìn)行連接操作5.11

A=>B為強(qiáng)關(guān)聯(lián)規(guī)則的條件是(

)

答案:關(guān)聯(lián)規(guī)則的支持度大于等于最小支持度并且關(guān)聯(lián)規(guī)則的置信度大于等于最小置信度5.9

以下關(guān)于關(guān)聯(lián)規(guī)則(A=>B)支持度的描述,錯誤的是(

)

答案:支持度是指事務(wù)集中同時包含A和B的事務(wù)數(shù)與所有包含A的事務(wù)數(shù)之比5.8

數(shù)據(jù)庫是(

)的集合。

答案:事務(wù)5.6

上題中,若將支持度改為3,則購物籃能夠提取的頻繁1-項集包括的項目為(

)

答案:牛奶,尿布5.5

設(shè)支持度為2,下面購物籃能夠提取的頻繁1-項集包括的項目為(

)ID購買項1牛奶,啤酒,尿布2面包,黃油,牛奶3牛奶,尿布,餅干4啤酒,餅干,尿布

答案:牛奶,啤酒,尿布,餅干5.4考慮下面的頻繁3-項集的集合:{1,2,3},{1,2,4},{1,3,4},{1,3,5},{2,3,4},{2,3,5},采用連接策略,產(chǎn)生候選4-項集不包含(

)

答案:{1,2,3,5}5.3設(shè)X={1,2,3}是頻繁項集,則可由X產(chǎn)生(

)個關(guān)聯(lián)規(guī)則。

答案:65.2Apriori算法的計算復(fù)雜度受(

)影響。

答案:ABC三項的影響5.1

某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據(jù)挖掘的(

)問題

答案:關(guān)聯(lián)規(guī)則發(fā)現(xiàn)7.20

貝葉斯分類所使用的包為(

)

答案:e10717.19

應(yīng)用樸素貝葉斯進(jìn)行分類的條件是(

)

答案:被分類對象各屬性間相互獨立7.18

關(guān)于集成學(xué)習(xí),以下說法不正確的是(

)

答案:決策樹集成一定能提升性能7.17

CART算法選擇(

)的屬性作為分裂屬性

答案:Gini指數(shù)最小7.16

C4.5算法選擇(

)的屬性作為分裂屬性

答案:信息增益率最大7.15

ID3算法選擇(

)的屬性作為分裂屬性

答案:信息增益最大7.14

ID3算法的主要步驟包括構(gòu)建決策樹、剪枝和預(yù)測,其對應(yīng)的函數(shù)分別為(

)

答案:rpart()、prune()、predict()7.13

R中rpart.plot包提供的功能有(

)

答案:決策樹的可視化7.12

以下防止決策樹過擬合的方法是(

)

答案:剪枝7.11

一棵含2個決策節(jié)點,5個葉子節(jié)點的決策樹,能生成(

)個分類規(guī)則

答案:57.10信息熵越大,表示(

)

答案:信息越不確定7.9

二分類問題中,如果所有數(shù)據(jù)均屬于同一類時,則信息熵為(

)

答案:07.8

二分類問題中,如果兩類中數(shù)據(jù)記錄個數(shù)相同,則信息熵為(

)

答案:17.7

(

)用來衡量信息量的大小

答案:信息熵7.6

以下不是基于信息論的決策樹算法的是(

)

答案:CART算法7.5

決策樹中間節(jié)點的特征是(

)

答案:有進(jìn)邊,有出邊,進(jìn)邊一條,出邊多條7.2分類模型準(zhǔn)確率的定義為(

)

答案:正確被模型分類的測試樣本與總的測試樣本的百分比7.1

應(yīng)用分類算法的步驟為(

)①使用類別未知的訓(xùn)練集創(chuàng)建模型

②使用類別已經(jīng)確定的訓(xùn)練集創(chuàng)建模型③用創(chuàng)建的模型預(yù)測未來

④計算模型準(zhǔn)確率

答案:②④③9.20

k-中心點聚類算法的時間復(fù)雜度為(

)(n為樣本數(shù))

答案:0(n2)9.19

K-means算法的不足之處不包括以下(

)項

答案:計算開銷比k中心點算法大9.18

對含n個樣本的數(shù)據(jù)集進(jìn)行K均值聚類,則該聚類算法的時間復(fù)雜度為(

)

答案:0(n)9.17

能終止K均值聚類過程的有(

)

答案:以上都對9.16

以下不是類間距離度量方法的是(

)

答案:平均值點距離9.15

R中實現(xiàn)距離度量的函數(shù)為(

)

答案:dist()9.13

當(dāng)不知道數(shù)據(jù)所屬類別時,可以使用(

)技術(shù)促使類別相同的數(shù)據(jù)與其他類別的數(shù)據(jù)相分離。

答案:聚類9.11

下列算法中,不屬于層次聚類算法的是(

)

答案:SVM算法9.10

下列算法中,不屬于劃分聚類算法的是(

)

答案:決策樹算法9.9

下列不屬于常用聚類方法的是(

)

答案:線性方法9.8

下列選項中說法不正確的是(

)

答案:聚類需要有類別確定的分類屬性9.7

下列度量方式中,不屬于距離度量的是(

)

答案:海明距離9.6

機(jī)器學(xué)習(xí)方式有多種,聚類屬于(

)

答案:無監(jiān)督學(xué)習(xí)/ananas/latex/p/5789291

答案:歐幾里德距離/ananas/latex/p/5789291

答案:曼哈頓距離9.3

相異度矩陣的元素aij表示(

)

答案:第i個對象和第j個對象之間的距離9.2

包含n個對象p個屬性的數(shù)據(jù)矩陣,其相異度矩陣為(

)的矩陣

答案:n行n列9.1

一個好的聚類結(jié)果,應(yīng)該是(

)

答案:組內(nèi)數(shù)據(jù)對象高度似度,組間數(shù)據(jù)對象不相似11.10

對文本進(jìn)行分析處理,一般需要對語料庫創(chuàng)立(

)

答案:詞條-文檔關(guān)系矩陣11.9

以下關(guān)于語料庫的描述,錯誤的是(

)

答案:語料庫都保存在外存中11.8

文本特征提取的步驟是(

)①提取關(guān)鍵詞集

②計算詞頻TF

③計算逆文檔頻率IDF④計算詞的權(quán)重

⑤提取特征

答案:①②③④⑤11.7

對change,changing,changes,changer,changed進(jìn)行詞形還原后的結(jié)果為(

)

答案:change11.6

對change,changing,changes,changer,changed進(jìn)行詞干提取后的結(jié)果為(

)

答案:chang11.5

關(guān)于英文數(shù)據(jù)分析中的標(biāo)準(zhǔn)化,以下說法錯誤的是(

)

答案:標(biāo)準(zhǔn)化就是將所有文本減去其平均值再除以其標(biāo)準(zhǔn)差11.3

常用的分詞工具包有(

)

答案:jiebaR11.2

文本分析的一般流程為(

)①讀取文本

②標(biāo)準(zhǔn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論