版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
青春須早為,豈能長(zhǎng)少年。?解憂書(shū)店,嚴(yán)禁轉(zhuǎn)載,違者必究!2/2python大數(shù)據(jù)分析(山東大學(xué))解憂書(shū)店JieYouBookshop2python數(shù)據(jù)分析概述1.【判斷題】數(shù)據(jù)分析的數(shù)據(jù)一般都是結(jié)構(gòu)化的、半結(jié)構(gòu)化的。正確答案:錯(cuò)誤我的答案:正確2.【單選題】關(guān)于python語(yǔ)言的特點(diǎn),說(shuō)法錯(cuò)誤的是()APython代表了簡(jiǎn)單思想的語(yǔ)言,語(yǔ)法簡(jiǎn)單,容易上手Bpython具有強(qiáng)大的標(biāo)準(zhǔn)庫(kù),完善的基礎(chǔ)代碼庫(kù)。這些庫(kù)覆蓋了網(wǎng)絡(luò)通信、文本處理、數(shù)據(jù)庫(kù)接口、圖形系統(tǒng)、XML處理等大量的內(nèi)容Cpython具有良好的可擴(kuò)展性,有大量的第三方的模塊和他進(jìn)行對(duì)接,而且覆蓋的領(lǐng)域也非常眾多Dpython語(yǔ)言是免費(fèi)開(kāi)源的,但是無(wú)法移植到其他語(yǔ)言中正確答案:D我的答案:A3.【單選題】python中,常見(jiàn)的結(jié)構(gòu)化數(shù)據(jù)不包括()A表格型數(shù)據(jù)B多維數(shù)組C通過(guò)關(guān)鍵列相互聯(lián)系的多個(gè)表D序列E圖像數(shù)據(jù)正確答案:E我的答案:A4.【單選題】下列不是數(shù)據(jù)分析的方法有()A描述性分析B診斷性分析C預(yù)測(cè)型分析D指令型分析E回顧性分析正確答案:E我的答案:A5.【判斷題】分析和建模就是指通過(guò)對(duì)比分析、分組分析、交叉分析、回歸分析等等這些分析方法,以及聚類、分類、關(guān)聯(lián)規(guī)則、智能推薦等模型與算法,最后發(fā)現(xiàn)數(shù)據(jù)中有價(jià)值的信息,然后得出結(jié)論的過(guò)程。正確答案:正確我的答案:正確6.【多選題】下面哪種為可用于python的開(kāi)發(fā)環(huán)境()APyDevBMSvisualstudioCPyCharmDSpyder正確答案:ABCD我的答案:A7.【單選題】下列說(shuō)法錯(cuò)誤的是()APython和R相比速度;B在理論的統(tǒng)計(jì)、理論的研究和一些前沿科學(xué)研究方面是Python比R更勝一籌的;CPython的工程化應(yīng)用是強(qiáng)于R語(yǔ)言的;DPython的應(yīng)用場(chǎng)景也大于R語(yǔ)言正確答案:C我的答案:A8.【單選題】對(duì)以下建模過(guò)程,正確順序?yàn)椋ǎ?評(píng)估2部署3數(shù)據(jù)預(yù)處理4分析5需求分析6優(yōu)化7建模8數(shù)據(jù)獲取A1-5-7-8-3-4-6-2B5-8-3-7-4-1-6-2C5-8-3-4-7-1-6-2D8-5-3-7-4-6-1-2正確答案:B我的答案:A3Numpy基礎(chǔ)1.【多選題】下列哪些不是創(chuàng)建ndarray的函數(shù):()AarrangeBzerosConesDemptyEeyeFfullGlinespaceHlogspace正確答案:EFH我的答案:A2.【單選題】下列切片表達(dá)錯(cuò)誤的是()
A
B
C
D正確答案:C我的答案:A3.【單選題】以下代碼的運(yùn)行結(jié)果錯(cuò)誤的是
A
B
C
D正確答案:C我的答案:A4.【單選題】
A
B
C
D正確答案:B我的答案:A5.【單選題】
A
B
C
D正確答案:A我的答案:A4Pandas基礎(chǔ)介紹1.【判斷題】DataFrame既有行索引也有列索引,它可以被看做由Series組成的字典(共用同一個(gè)索引)。正確答案:正確我的答案:正確2.【判斷題】DataFrame是一個(gè)表格型的數(shù)據(jù)結(jié)構(gòu),它含有一組有序的列,每列可以是不同的值類型(數(shù)值、字符串、布爾值等),每列的類型可以不同。正確答案:錯(cuò)誤我的答案:正確3.【單選題】關(guān)于Seriese的說(shuō)法錯(cuò)誤的是()A如果沒(méi)有為數(shù)據(jù)指定索引,seriese會(huì)自動(dòng)創(chuàng)建一個(gè)0到N-1(N為數(shù)據(jù)的長(zhǎng)度)的整數(shù)型索引,如果指定索引,就不必自動(dòng)創(chuàng)建這個(gè)索引B可以將Series看成是一個(gè)定長(zhǎng)的有序字典,因而可以用在許多原本需要字典參數(shù)的函數(shù)中C如果數(shù)據(jù)被存放在一個(gè)Python字典中,也可以直接通過(guò)這個(gè)字典來(lái)創(chuàng)建SeriesDSeries最重要的一個(gè)功能是,它會(huì)根據(jù)運(yùn)算的索引標(biāo)簽自動(dòng)對(duì)齊數(shù)據(jù),類似于數(shù)據(jù)庫(kù)的join操作正確答案:A我的答案:A4.【判斷題】Series是一種類似于一維數(shù)組的對(duì)象,它由一組數(shù)據(jù)(各種NumPy數(shù)據(jù)類型)以及一組與之相關(guān)的數(shù)據(jù)標(biāo)簽(即索引)組成。正確答案:正確我的答案:正確5數(shù)據(jù)的加載和存儲(chǔ)1.【判斷題】ORM技術(shù)指的是對(duì)象關(guān)系映射技術(shù),它是把關(guān)系數(shù)據(jù)庫(kù)的表結(jié)構(gòu)映射到對(duì)象上,然后通過(guò)使用描述對(duì)象和數(shù)據(jù)庫(kù)之間映射的元數(shù)據(jù),將程序中的對(duì)象自動(dòng)持久化到關(guān)系數(shù)據(jù)庫(kù)中。在Python中,最有名的ORM框架是SQLAlchemy
正確答案:
正確
我的答案:
正確2.【判斷題】Pandas中,read_table語(yǔ)法基本上和read_csv相同,只是它的分隔符的默認(rèn)值是\t,
read_csv默認(rèn)分隔符為逗號(hào)
正確答案:
正確
我的答案:
正確3.【單選題】Pandas提供三種方式來(lái)訪問(wèn)數(shù)據(jù)庫(kù),下列哪個(gè)語(yǔ)句不是訪問(wèn)數(shù)據(jù)庫(kù)的語(yǔ)句(
)
Aread_sql_table
Bread_sql_query
Cread_json
Dread_sql正確答案:C
我的答案:A4.【單選題】關(guān)于json的使用,下列說(shuō)法錯(cuò)誤的是:(
)
APython里面,json基本類型有對(duì)象(字典)、數(shù)組(列表)、字符串、數(shù)值,沒(méi)有布爾值和null。
Bjson對(duì)象中所有的鍵都必須是字符串,通過(guò)json.loads即可將JSON字符串轉(zhuǎn)換成Python形式
C可以將一個(gè)Json字符串先轉(zhuǎn)成字典,再通過(guò)字典來(lái)創(chuàng)建dataframe
Dpandas.read_json可以自動(dòng)將JSON數(shù)據(jù)集轉(zhuǎn)換為Series或DataFrame正確答案:A
我的答案:A5.【單選題】關(guān)于JSON的描述,正確的為(
)
AJSON是JavaObjectNotation的縮寫(xiě)
BJSON是一種復(fù)雜的數(shù)據(jù)交換格式
CJSON已經(jīng)成為了通過(guò)HTTP請(qǐng)求在Web瀏覽器和其他應(yīng)用程序之間發(fā)送數(shù)據(jù)的標(biāo)準(zhǔn)格式之一
DJSON的數(shù)據(jù)格式不如表格型的文本靈活正確答案:C
我的答案:A6數(shù)據(jù)的清洗和準(zhǔn)備1.【判斷題】pandas可以用dropna和fillna來(lái)處理缺省值的函數(shù),前者刪除缺省值的行或者列。后者fillna是填充缺省值
正確答案:
正確
我的答案:
正確2.【判斷題】pandas一般是使用整型的值,叫NAN,就是notanumber的縮寫(xiě)來(lái)表示缺失數(shù)據(jù),所以這種缺失數(shù)據(jù)也叫做哨兵值,它可以非常方便的被檢測(cè)出來(lái)
正確答案:
錯(cuò)誤
我的答案:
正確3.【判斷題】數(shù)據(jù)清洗主要是包括處理重復(fù)的數(shù)據(jù)、缺失的數(shù)據(jù)以及異常的數(shù)據(jù)
正確答案:
正確
我的答案:
正確4.【單選題】不屬于數(shù)據(jù)轉(zhuǎn)換的方法是(
)
A利用函數(shù)或映射
B計(jì)算啞變量來(lái)處理類別型的數(shù)據(jù)轉(zhuǎn)換。
C離散化
D回歸法
正確答案:D
我的答案:A5.【單選題】Python中,不屬于異常值的處理方式的是:(
)
A直接把含有異常的記錄給刪掉。
B將異常值變成缺省值,按照缺省值的處理方法來(lái)處理
C推理法
D把異常值都用某個(gè)值,如平均值來(lái)進(jìn)行修正正確答案:C
我的答案:A6.【單選題】
A
B
C
D正確答案:C
我的答案:A7.【單選題】
A
B
C
D正確答案:B
我的答案:A8.【單選題】下列哪種方法不是常用的異常值檢測(cè)方法(
)
A簡(jiǎn)單統(tǒng)計(jì)分析法,當(dāng)然是通過(guò)我們提供的一些統(tǒng)計(jì)函數(shù)。
B決策樹(shù)法
C3σ原則
D箱線圖分析法正確答案:B
我的答案:A9.【單選題】
A
B
C
D
正確答案:D
我的答案:A10.【單選題】
A
B
C空
D正確答案:A
我的答案:A7數(shù)據(jù)規(guī)整:聚合,合并和重聚1.【單選題】下列說(shuō)法錯(cuò)誤的是(
)
Apandas.merge可根據(jù)一個(gè)或多個(gè)鍵將不同DataFrame中的行連接起來(lái)。
B
pandas.concat可以沿著一條軸將多個(gè)對(duì)象堆疊到一起。
Cpandas.append方法,它也可以實(shí)現(xiàn)縱向堆疊
D重疊合并主要使用DataFbine_first函數(shù)實(shí)現(xiàn)正確答案:C
我的答案:A2.【判斷題】正確答案:
正確
我的答案:
正確8數(shù)據(jù)的可視化1.【多選題】繪制折線圖時(shí),如果要設(shè)定點(diǎn)為star,大小為10,需要設(shè)定rc的哪些參數(shù)(
)
Alines.linewidth
Blines.linestyle
Clines.marker
Dmarkersize
正確答案:
CD
我的答案:
A2.【單選題】繪制箱型圖用函數(shù)___
Ascatter
Bboxplot
Cplot
Dpie正確答案:B
我的答案:A9數(shù)據(jù)的聚合與分組運(yùn)算1.【判斷題】用groupby分組后的結(jié)果是一個(gè)groupby對(duì)象,并不能直接用frame打印出來(lái)查看,它會(huì)被存在于內(nèi)存中,所以說(shuō)最終要輸出的時(shí)候,輸出的是一個(gè)內(nèi)存地址。
正確答案:
正確
我的答案:
正確2.【判斷題】對(duì)于某dataframe類型數(shù)據(jù)df,其數(shù)據(jù)列有id1,data1,data2,如果按照id1進(jìn)行分組,求解在data1上的平均值,可以寫(xiě)為grouped=df['data1'].groupby(df['id1'])。
正確答案:
錯(cuò)誤
我的答案:
正確3.【多選題】
Apieces['a']
Bpieces['a','one']
Cpieces[('a','one')]
Dpieces['a','b']正確答案:
BC
我的答案:
A4.【單選題】下列函數(shù)與其他選項(xiàng)不等效的是(
)
Adf.groupby('key1')[['data2']].sum()
Bdf.groupby('key1')[['data2']].aggregate(['sum'])
Cdf.groupby('key1')[['data2']].agg(['sum'])
Ddf.groupby('key1').agg({'data2':'sum'})
Edf.groupby('key1')[['data2']].agg({'data2':'sum'})
正確答案:E
我的答案:A5.【單選題】
Adf.groupby('key1')['data1'].mean()
Bdf.groupby('key1')[['data2']].mean()
Cdf.groupby(['key1','key2'])['data1','data2'].mean()
Ddf.groupby(['key1','key2'])['data1']['data2'].mean()
正確答案:D
我的答案:A10時(shí)間序列1.【單選題】
A2011-11-01
B2012-10-01
C2012-01-01
D2012-12-31正確答案:A
我的答案:A2.【單選題】
Ap1+5
Bp1-5
Cp1-p2
Dp1-p3正確答案:C
我的答案:A3.【單選題】
ATimestamp('2017-11-0100:00:00')
B
Timestamp('2017-12-3013:00:12')
CTimestamp('2017-11-3013:00:12')
D
Timestamp('2017-11-0113:00:12')正確答案:C
我的答案:A4.【單選題】
A1,2,3
B3,1,2
C2,1,3
D3,2,1正確答案:A
我的答案:A5.【單選題】下列不能正確執(zhí)行的語(yǔ)句是
Aindex=pd.date_range('2012-04-01','2012-05-01',periods=20)
Bindex=pd.date_range(start='2012-04-01',periods=20)
Cindex=pd.date_range(end='2012-05-01',periods=20)
Dindex=pd.date_range('2012-04-01','2012-05-01')正確答案:A
我的答案:A6.【單選題】
Ats[0]
Bts.index[0]
Cts['2017-6-26']
Dts['2017/6/26']
Ets['6/26/2017']
Fts['26/6/2017']正確答案:B
我的答案:A7.【判斷題】正確答案:
錯(cuò)誤
我的答案:
正確8.【單選題】
APeriod('2007-05','M')
BPeriod('2006-06','M')
CPeriod('2006-01','M')
DPeriod('2007-01','M')正確答案:B
我的答案:A9.【單選題】關(guān)于pandas的時(shí)間類,以下說(shuō)法錯(cuò)誤的是?
A.Timestamp,這是最基礎(chǔ)的時(shí)間類,在絕大多數(shù)的場(chǎng)景中,時(shí)間的數(shù)據(jù)都是Timestamp形式的,可以采用python的函數(shù)to_datetime形成Timestamp
BPeriod表示時(shí)間段
CTimedelta表示不同單位的時(shí)間,例如1天,1.5小時(shí),3分鐘,4秒等,而非具體的某個(gè)時(shí)間段
DDatetimeIndex和PeriodtimeIndex,是一組Index,可以用來(lái)作為Series或者DataFrame的索引正確答案:A
我的答案:A10.【多選
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年《價(jià)值為綱》學(xué)習(xí)心得范例(3篇)
- 課題申報(bào)參考:接受美學(xué)視野下的卞之琳莎學(xué)研究
- 課題申報(bào)參考:教育強(qiáng)國(guó)進(jìn)程中高校繼續(xù)教育高質(zhì)量發(fā)展的保障機(jī)制和推進(jìn)路徑研究
- 2025版房地產(chǎn)銷售代理授權(quán)委托合同3篇
- 二零二五年度物流倉(cāng)儲(chǔ)中心臨時(shí)搬運(yùn)工勞動(dòng)合同書(shū)4篇
- 2025版學(xué)校游泳池配套設(shè)施租賃與管理承包合同示范2篇
- 二零二五版藝術(shù)品拍賣師傭金分成合同3篇
- 個(gè)性化離婚合同與起訴狀套裝2024版版B版
- 二零二五年度健康管理與養(yǎng)老服務(wù)業(yè)合作協(xié)議3篇
- 二零二五年度圖書(shū)封面及插圖設(shè)計(jì)合同4篇
- 山東鐵投集團(tuán)招聘筆試沖刺題2025
- 真需求-打開(kāi)商業(yè)世界的萬(wàn)能鑰匙
- 2025年天津市政集團(tuán)公司招聘筆試參考題庫(kù)含答案解析
- GB/T 44953-2024雷電災(zāi)害調(diào)查技術(shù)規(guī)范
- 2024-2025學(xué)年度第一學(xué)期三年級(jí)語(yǔ)文寒假作業(yè)第三天
- 2024年列車員技能競(jìng)賽理論考試題庫(kù)500題(含答案)
- 心律失常介入治療
- 6S精益實(shí)戰(zhàn)手冊(cè)
- 展會(huì)場(chǎng)館保潔管理服務(wù)方案
- 監(jiān)理從業(yè)水平培訓(xùn)課件
- 廣東省惠州市實(shí)驗(yàn)中學(xué)2025屆物理高二第一學(xué)期期末綜合測(cè)試試題含解析
評(píng)論
0/150
提交評(píng)論