版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第一章一、選擇題下列有關數(shù)據分析的說法錯誤的是(D)。數(shù)據分析是從數(shù)據中提取有價值的信息數(shù)據分析的本質是揭示數(shù)據的規(guī)律數(shù)據分析是決策者應具有的基本能力數(shù)據分析是大數(shù)據和人工智能的結合技術一般來說,4類數(shù)據分析的復雜度從低到高為(C)。診斷性分析→預測性分析→描述性分析→規(guī)范性分析預測性分析→描述性分析→診斷性分析→規(guī)范性分析描述性分析→診斷性分析→預測性分析→規(guī)范性分析規(guī)范性分析→預測性分析→診斷性分析→描述性分析規(guī)范性分析需要回答的問題是(A)?!皯撟鍪裁??”“發(fā)生了什么?”“為什么會發(fā)生這種情況?”“未來可能會發(fā)生什么?”下列有關數(shù)據分析的基本流程的說法錯誤的是(D)。數(shù)據分析的重要環(huán)節(jié)是明確目的,即為什么要進行數(shù)據分析數(shù)據的本質是事實的表示,獲取的數(shù)據對象需要與具體的問題關聯(lián)特征工程的目的是使數(shù)據滿足設定的分析目標要求數(shù)據分析為業(yè)務決策帶來有效應用,必須經過可視化呈現(xiàn)數(shù)據分析可能導致糟糕甚至錯誤的結果,不可能的原因是(A)。底層數(shù)據質量太好分析模型過擬合或欠擬合數(shù)據分析沒有考慮到模型中固有的缺陷不同的問題使用了相同的數(shù)據分析模型Python模塊的文件擴展名是(B)。.ipynb.py.txt.csv下列有關Python語言特點說法錯誤的是(A)。機器語言高級語言面向對象跨平臺Anaconda科學包及其依賴項中,不包括(D)。PythonPandasNumPyjiebaPython3.x默認的源文件編碼格式是(D)。ASCIIgbkUTF-16UTF-8下列有關JupyterNotebook說法正確的是(D)。JupyterNotebook命令模式和編輯模式不能切換JupyterNotebook編程過程不能編寫說明文檔JupyterNotebook可以在網頁頁面中直接編寫代碼,但是不能運行JupyterNotebook相當于一個功能無比強大的“計算器”二、判斷題預測性分析用于回答“發(fā)生了什么”這一基本問題。(×)探索性數(shù)據分析是一種使用特定的模型或假設來探索數(shù)據的方法。(×)數(shù)據清洗是在保持或接近保持原數(shù)據完整性的同時將數(shù)據集規(guī)模減小,以提高數(shù)據處理的速度。(×)JupyterNotebook編輯模式(EditMode)按Esc鍵切換到命令模式(CommandMode)。(√)Python每行代碼的長度沒有限制,不能拆解成多行。(×)三、程序題1.使用JupyterNotebook,在CellType在Markdown模式下,模仿【財務應用與實踐】節(jié)的課程內容,編輯輸入適當?shù)母袷轿谋?,并得到如圖1-10所示的運行結果。圖1-10Markdown代碼運行結果2.使用JupyterNotebook,在CellType在Code模式下,編寫(程序題1)“永續(xù)年金現(xiàn)值”代碼并運行,得到運行的結果輸出:現(xiàn)值——20000000。并嘗試下載該Python代碼為.py文件,并在提示符下運行。第2章一、選擇題Python中的非法標識為(D)。ABCABC_aBc01abcPython語句中表達式“10+10.0+5//3+True”的值為(B)。2022.0_20.0錯誤Python語句中,如果字符串內部既包含'又包含",需要借助(C)。分隔符|占位符%轉義字符\沒有辦法Python語句中,字符串中含有\(zhòng)\表示的字符是(D)?;剀囍票矸麚Q行\(zhòng)Python數(shù)據類型中,(C)是可變序列。tuplestrlistbytes以下關于列表操作的描述,錯誤的是(C)。append()方法可以向列表添加元素extend()方法可以將另一個列表中的元素逐一添加到列表add()方法可以向列表添加元素insert(index,object)方法在指定位置index前插入objectPython中,有多種可以直接作用于for循環(huán)的數(shù)據類型,但是不包括(C)。liststrfloatdict以下關于循環(huán)控制語句描述錯誤的是(C)。循環(huán)可以嵌套使用for語句可以在任意序列上進行迭代訪問ifelif結構中必須包含else子句if語句可以嵌套以下關于字典操作的描述中,錯誤的是(D)。del()用于刪除字典或者元素clear()用于清空字典中的數(shù)據len()方法可以計算字典中鍵值對的個數(shù)keys()方法可以獲取字典的值視圖以下關于循環(huán)結構的描述,錯誤的是(B)。使用range()函數(shù)可以指定for循環(huán)的次數(shù)使用int在for循環(huán)結構中可以指定循環(huán)次數(shù)foriinrange(5)表示循環(huán)5次,i的值是從0到4用字符串做循環(huán)結構的時候,循環(huán)的次數(shù)是字符串的長度二、判斷題數(shù)學上理解x=x+5那無論如何是不成立的,在python程序中可以這樣使用,是賦值語句。(√)Python中變量名不區(qū)分英文大小寫。(×)Python中變量名必須是大小寫英文、數(shù)字和_的組合,且不能用數(shù)字開頭。(√)Python中數(shù)據類型tuple是可變序列。(×)Python流程控制子句表達式只能是邏輯表達式。(×)三、程序題1.企業(yè)劃分為大型、中型、小型、微型4種類型,工業(yè)行業(yè)劃型標準為:從業(yè)人員1000人以下或營業(yè)收入40000萬元以下的為中小微型企業(yè),否則為大型企業(yè)。其中,企業(yè)從業(yè)人員300人及以上,且營業(yè)收入2000萬元及以上的為中型企業(yè);從業(yè)人員20人及以上,且營業(yè)收入300萬元及以上的為小型企業(yè);從業(yè)人員20人以下或營業(yè)收入300萬元以下的為微型企業(yè)。(1)有企業(yè)A,30人年營業(yè)收入500萬元。請編寫程序,判斷該企業(yè)的類型。(2)請編寫程序,該企業(yè)每年營業(yè)收入和每年招聘人數(shù)增長率為10%,判斷10年后是何種類型企業(yè)。2.假設某地區(qū)個人所得稅計算依據為表2-8。表2-8個人所得稅稅率表(綜合所得適用)級數(shù)全年應納稅所得額稅率(%)1不超過36000元的32超過36000元至144000元的部分103超過144000元至300000元的部分204超過300000元至420000元的部分255超過420000元至660000元的部分306超過660000元至960000元的部分357超過960000元的部分45不考慮其他因素,給定個人年綜合所得,請編寫程序計算個人所得稅。第3章一、選擇題下面有關Python面向對象的思想,不正確的是(C)。常用的代碼塊打包成一個函數(shù)是語句層面的封裝容器類數(shù)據類型是數(shù)據層面的封裝把所有的代碼寫在一個主程序中是程序封裝描述事物特征的數(shù)據和代碼塊是類封裝下面關于Python類操作中,不正確的是(D)??梢栽L問或修改實例變量,甚至可以添加或者刪除調用類實例對象的方法,也可給類對象動態(tài)添加方法構造函數(shù)用于創(chuàng)建實例對象時使用,也可以沒有構造函數(shù)創(chuàng)建類的實例對象時,Python解釋器不會自動調用構造函數(shù)Python類體中,用@staticmethod修飾的方法為(C)。類方法實例方法靜態(tài)方法動態(tài)方法面向對象程序設計中有3個重要特性,不包括(C)。封裝繼承靜態(tài)多態(tài)從根文件夾開始,描述一個文件為(C)。當前路徑相對路徑絕對路徑復雜路徑Python語句“foo=(lambdax,y:x>y)(3,5)”的運行結果foo的值為(C)。trueTrueFalsefalseabs函數(shù)實際上是定義在(C)中的,不需要用戶手動引用。pandas模塊os模塊builtins模塊import模塊Python程序當在主模塊運行時,__name__的值為(D)?!癬_file__”“__class__”“__module__”“__main__”當代碼不符合Python語法規(guī)則時,解釋器在解析時就會報出(C)。AssertionErrorIndexErrorSyntaxErrorKeyError(A)可以看作是對try模式的簡化,其用于對軟件系統(tǒng)中的資源進行管理。with子句for子句if子句while子句二、判斷題Python類體中,以“變量名=變量值”方式定義的變量,為實例屬性。(×)open()函數(shù)支持的文件打開模式,r只讀模式打開文件,讀文件內容的指針會放在文件的結尾。(×)builtins是Python中的一個模塊。該模塊提供對Python的所有內置標識符的直接訪問,不需要用戶手動引用。(√)Python中,map()和reduce()函數(shù)不是高階函數(shù)。(×)Python中,return語句在同一函數(shù)中不可以出現(xiàn)多次。(×)語法錯誤是解析代碼時出現(xiàn)的錯誤。(√)當代碼不符合Python語法規(guī)則時,解釋器在解析時就會報出TypeError。(×)在Python中,把運行時產生錯誤的情況叫作異常(Exceptions)。(√)在Python中有一些異常,是程序正常運行的結果,比如用raise手動引發(fā)的異常。(√)在Python中try子句可以看作是對with模式的簡化。(×)三、程序題1.請判斷如下代碼段的運行結果,然后鍵入代碼,并執(zhí)行。(1)input()函數(shù)憑證號=input("憑證號:")or'20230528'#輸入回車print(憑證號)(2)用.strip()去除字符串兩端的空白科目名稱=input("科目名稱:").strip("")#輸入若干空格“材料采購”print(科目名稱)(3)用.split()解包input接收的多個輸入科目代碼=input("科目代碼:").split(",")#輸入“1401,2221,100202”print(科目代碼)(4)簡單的交互response=input("保存記賬憑證(Y/確認):\n")#輸入yifresponse.upper()=="Y":print("已保存記賬憑證……")else:print("已取消……")(5)print輸出多個變量或值記賬憑證={'憑證號':'230052','制單日期':'2023年5月28日'}print(f"憑證號:{記賬憑證['憑證號']}"+""*4+f"制單日期:{記賬憑證['制單日期']}")(6)end參數(shù)決定換行/不換行輸出,續(xù)(5)print(f"憑證號:{記賬憑證['憑證號']:>8}",end="")print(f"制單日期:{記賬憑證['制單日期']:>12}",end="")(7)sep決定用什么間隔符來分隔多個值或變量,續(xù)(6)print(f"憑證號:{記賬憑證['憑證號']}"+""*4,f"制單日期:{記賬憑證['制單日期']}",sep='|')(8)導入模塊和函數(shù)應用importmathdefmove(x,y,step,angle=0):nx=round(x+step*math.cos(angle))ny=round(y+step*math.sin(angle))returnnx,nymove(0,0,1,3.14/3)2.深入了解變量的作用空間,完成以下任務。dir(obj)可以得到obj對象的成員列表,其中包括內置命名空間的變量標識(雙下劃線開始和結束),以及obj對象的局部命名空間的變量。請編寫一個函數(shù),返回去除的內置命名空間變量的列表。3.續(xù)第2章的課后習題“三、程序題1.”,要求:(1)請編寫函數(shù)和主程序,輸入任意企業(yè)的人員規(guī)模和營業(yè)收入,判斷企業(yè)規(guī)模類型。(2)結合“第二章【財務應用與實踐】”,“工業(yè)”和“農、林、牧、漁業(yè)”行業(yè)企業(yè)規(guī)模類型的判斷標準,采用類和函數(shù)編程,給定企業(yè)規(guī)模屬性,判斷企業(yè)類型。4.續(xù)第2章的課后習題“三、程序題2.”,要求:(1)編寫一個函數(shù),打印輸出:表2-7個人所得稅稅率表;(2)編寫函數(shù)和主程序,輸入有意義年個人所得,給出應納稅額。5.續(xù)本章【財務應用與實踐】中的年金類程序,要求:(1)修改原有不適用的代碼,并增加定義“遞延年金“、“預付年金”(2)編寫或重寫計算現(xiàn)值和終值的實例方法;(3)編寫主程序,輸入任意年金的屬性值,可以得到其現(xiàn)值和終值。第四章一、選擇題下列代碼運行的結果是(B)。importnumpyasnpa=np.array([[[1,2,3],[4,5,6]],[[7,8,9],[10,11,12]]])print(a[:,1])A. B. C. D. 續(xù)1題,print(a.shape)執(zhí)行的結果是(C)。A. (2,6) B. (4,3) C. (2,2,3) D. (3,2,2)下面代碼運行的輸出結果是(A)。importnumpyasnpnp.arange(0.1,0.5,0.2)A.array([0.1,0.3]) B.array([0,0.3] C.array([0.1,0.5] D.array([0.3,0.5]下面代碼運行的輸出結果是(C)。pd.DataFrame(np.array([[1,2,3],[4,5,6]]),columns=['a','b','c'])A. B. C. D. TypeerrorPandas使用Series()
函數(shù)來創(chuàng)建Series對象,當傳遞的索引值無法找到與其對應的值時,使用(B)填充。A.None B. NaN
C. null D. 0isnull()和notnull()用于檢測Series中的缺失值。如果為值不存在或者缺失,則isnull()返回(A),則notnull()返回(A)。A. True,F(xiàn)alse B. True,True C. False,True D. False,F(xiàn)alseDataFrame表格中每列的數(shù)據類型可以不同,稱為(B)。A. 同構數(shù)據表 B. 異構數(shù)據表 C. 結構化數(shù)據表 D. 非結構化下列(D)不是DataFrame遍歷的方法。A. itertuples() B. iterrows() C. iteritems() D. itercols()在沒有指定索引時,Series和DataFrame自帶行標簽索引,這種情況為(C)。A. 01索引 B. 字符索引 C. 隱式索引 D. 顯式索引索引操作DataFrame,iloc允許接受兩個參數(shù)分別是行和列,參數(shù)之間使用“逗號”隔開,但只能接收(B)。A. 標簽索引 B. 整數(shù)索引 C. 隱式索引 D. 顯式索引二、判斷題NumPy的廣播功能要求運算的數(shù)組的形狀完全一致。(×)Pandas只能讀入excel數(shù)據文件,而不能讀入像.txt這樣的存文本文件。(×)DataFrame對象的索引標簽只能是整數(shù),不能是其他數(shù)據類型。(×)DataFrame的iloc和loc是不同的屬性,前者關注數(shù)據的索引位置,后者則是索引標簽。(√)Series可以保存任何數(shù)據類型,它的標簽默認為整數(shù),從1開始依次遞增。(×)DataFrame的方法isnull(),如果為值不存在或者缺失,則返回False。(×)DataFrame的方法notnull(),如果值不存在或者缺失,則返回True。(×)DataFrame是一種表格型的數(shù)據結構,既有行標簽(index),又有列標簽(columns)。(√)Series和DataFrame自帶行標簽索引,稱為“顯式索引”。(×)DataFrame的loc方法允許接兩個參數(shù)分別是行和列,參數(shù)之間需要使用“冒號”隔開,但該函數(shù)只能接收標簽索引。(×)三、程序題1.首先鍵入如下代碼,并運行,觀察運行結果importpandasaspdimportnumpyasnpN=10df=pd.DataFrame({'日期':pd.date_range(start='2023-01-01',periods=N,freq='D'),'序號':np.linspace(0,stop=N-1,num=N),'重量':np.random.rand(N),'等級':np.random.choice(['Low','Medium','High'],N).tolist(),'體積':np.random.normal(100,10,size=(N)).tolist()})完成以下要求:(1)查閱資料,熟悉代碼中NumPy的方法;(2)利用head(),tail(),sample(),info(),describe()等函數(shù),了解數(shù)據集;(3)提取偶數(shù)“序號”的數(shù)據集;(4)提取“重量”大于均值,并且體積小于中位數(shù)的數(shù)據集;(5)增加一列,標簽為“產品質量”,把(3)提取的樣本標記為“不合格”,其他為合格;(6)把最終的DataFrame存儲為.csv文件。2.針對給定的上市公司基本信息數(shù)據集<公司基本信息.xlsx>,完成以下操作(1)讀入數(shù)據,要求把第2行設為列標題,['股票代碼','同公司B股代碼','同公司H股代碼']列設為字符類型,'股票代碼'設置為索引列。(2)初步了解數(shù)據集查看數(shù)據了解數(shù)據集各列的數(shù)據類型,是否為空值,內存占用情況數(shù)據集各列的數(shù)據統(tǒng)計情況(最大值、最小值、標準偏差、分位數(shù)等等)(3)依據索引和位置提取數(shù)據重新設置[股票代碼]及[上市板塊]為行索引,并排序使用loc或iloc進行數(shù)據提取,并賦值。要求上市公司分為兩類:IT企業(yè)——[主營產品名稱]含有“計算機”,其他企業(yè)——[主營產品名稱]不含有“計算機”,并將寫入新的列[ICT分類]。提取注冊地在遼寧省,注冊資本最大的上市公司股票代碼(4)改寫數(shù)據列[注冊資本],改成以“億元”為單位,并保留4位小數(shù)(5)根據要求提取數(shù)據文件的自己數(shù)據創(chuàng)業(yè)板的所有上市公司數(shù)據集df_c,并得到其中公司的個數(shù)根據得到的df_c,取得所有東三省的上市公司df_ne把的數(shù)據集df_ne,提取['股票代碼','公司簡稱','首發(fā)上市日期','摘牌日期','注冊資本','所在省份']列,并存儲為xlsx文件,文件名為<東北地區(qū)創(chuàng)業(yè)板.xlsx>。操作數(shù)據集df_ne,按首發(fā)上市時間排序索引,得出東北地區(qū)每年上市的公司個數(shù)。第5章一、選擇題對DataFrame操作,下列方法中(C)是聚合方法。A. head() B. iloc() C. mean() D. reindex()在DataFrame中,使用聚合類方法時需要指定軸(axis)參數(shù),(B)表示按垂直方向進行計算。A. axis=1 B. axis=0 C. axis='columns' D. axis=None3-7題依據如下代碼的數(shù)據幀df回答。importPandasaspdimportnumpyasnpdata=[1,2,10,15,19,27]name=np.arange(6)columns=['col1']df=pd.DataFrame(data=data,index=name,columns=columns)gb=df.groupby(df['col1']//10)gb.ngroups上述代碼的輸出值為(B)。A. 2 B. 3 C. 4 D. 5gb.sum().iloc[2].col1上述代碼的輸出值為(D)。A. 3 B. 36 C. 11 D. 27gb.mean().iloc[2].col1上述代碼的輸出值為(D)。A. 3.0 B. 36.0 C. 11.0 D. 27.0gb.transform(lambdax:x-x.mean()).iloc[1].col1上述代碼的輸出值為(A)。A. 0.5 B. -0.5 C. 1.0 D. -1.0gb.apply(lambdax:x.max()-x.min()).iloc[0].col1上述代碼的輸出值為(C)。A. 0 B. -1 C. 1 D. 2通過給(D)函數(shù)傳遞一個自定義函數(shù)和適當數(shù)量的參數(shù)值,把所有的DataFrme中元素作為整體操作對象。A. mean() B. applymap() C. apply() D. pipe()通過給(C)函數(shù)傳遞一個自定義函數(shù)和適當數(shù)量的參數(shù)值,把DataFrme某一行或者某一列作為操作對象。A. mean() B. applymap() C. apply() D. pipe()DataFrame數(shù)據表結構的(B)方法,他們都可以接受一個Python函數(shù),并返回相應的值。針對每個要素操作。A. mean() B. applymap() C. apply() D. pipe()二、判斷題Pandasjoin()函數(shù)具有l(wèi)eft,right,outer,inner連接方式,默認為left連接。(√)groupby()是DataFrame方法,不適用Series。(×)GroupBy對象可以用于迭代。(√)在Pandas中的關系型連接函數(shù)merge()和join()中提供了on參數(shù)來代表連接方式。(×)Pandas能夠實現(xiàn)SQL關系型數(shù)據庫的操作。(√)三、程序題1.簡單數(shù)據處理根據給定的數(shù)據,完成操作任務。數(shù)據集生成代碼如下。[in] importPandasaspddata=[[5,6,1000],[15,5,1000]]name=['債券2301','債券2305']columns=['期數(shù)','利率','面值']df=pd.DataFrame(data=data,index=name,columns=columns)display(df)[out]完成如下任務:(1)用loc屬性或insert函數(shù)增加一個[數(shù)量]列,值為[100000,1000000];(2)在df中增加一行數(shù)據,“債券2302”,值為[5,8,1000,1000000];(3)修改行標題,“債券2302”改為“債券2300”;(4)“債券2305”的[面值]修改為1100;(5)刪除[面值]為80或90的行。2.數(shù)據清洗根據給定的數(shù)據,完成數(shù)據清洗任務。數(shù)據集引入代碼如下。df_raw=pd.read_excel('..\data\ch5\習題\行業(yè)分類.xlsx',\dtype={'大類':str})完成如下任務:(1)使用數(shù)據清洗操作,將df_raw轉化為行業(yè)門類表(參考<..\data\ch5\習題\行業(yè)門類.xlsx>(2)使用數(shù)據清洗操作,將df_raw轉化為行業(yè)大類表(參考<..\data\ch5\習題\行業(yè)大類.xlsx>)3.數(shù)據處理根據給定的數(shù)據集,完成數(shù)據處理任務。在資源文件夾<data\ch5\習題\>中查閱如下文件。完成如下任務:(1)對“公司基本信息”數(shù)據集按行業(yè)大類分組,并得到注冊資本均值前5個行業(yè)的注冊資本的均值、最大值,公司個數(shù)。(2)對“利潤表_T”,“資產負債表_T”2個表進行處理,使它們添加[公司簡稱]和[行業(yè)大類]列數(shù)據。(3)“利潤表_T”和“資產負債表_T”進行連接,得到有2個表都有的數(shù)據集,并存為<資產負債_利潤.xlsx>。
第6章一、選擇題以下關于使用Matplotlib繪圖流程的說法錯誤的是(D)。簡單單個圖形,無需手動創(chuàng)建畫布數(shù)據準備是繪圖的基礎標簽設置與繪制圖形沒有先后添加圖例可在繪制圖形之前以下有關數(shù)據量化分類的說法錯誤的是(B)。定類尺度的主要數(shù)學特征是“=”或“≠”順序尺度不能用表示類別量定距尺度是比順序尺度高一層次的計量尺度定比尺度的主要數(shù)學特征是“÷”或“×”以下關于使用Matplotlib繪圖的說法錯誤的是(C)。繪圖無法正確顯示中文在同一子圖繪圖一定會刪除覆蓋原圖形一個畫布只能創(chuàng)建一個子圖Matplotlib繪圖可以存儲為不同格式的圖形文件obj.plot或plt.plot()的函數(shù)中kind參數(shù)表示的是(B)。A. 垂直柱狀圖 B.繪圖類型 C. 不存在 D.None繪制直方圖,plt.plot()的函數(shù)的kind參數(shù)應該賦值(C)。A. ‘kde’ B.‘bar’ C. ‘hist D.‘pie’下列代碼中繪制散點圖的是(B)。A. plt.plot() B.plt.scatter() C.plt.legend() D.plt.box()下列字符串是表示plot線條的顏色-紅色、形狀-五角星點、線形-短虛線的是(A)。A. 'r*-' B.'go-' C. 'r*+' D.'bs-'下列說法正確的是(D)。餅圖中的數(shù)值表示樣本的數(shù)量關系散點圖的x軸刻度一定是數(shù)值箱線圖的異常值數(shù)量是不能調整的折線圖可以用作查看特征間的趨勢關系下列代碼執(zhí)行結果是(A)。importmatplotlib.pyplotaspltimportpandasaspddf=DataFrame([[20,60,178],[50,20,165],[45,67,167]],index=[1,2,3],columns=['age','weight','height'])df.plot(kind='bar')plt.show()A. B. C. D.基于如下代碼的說法,正確的是(C)。importmatplotlib.pyplotaspltfig=plt.figure()ax=plt.axes()A. ax是畫布對象 B.fig是子圖對象 C. axes是子圖構造函數(shù) D.figure是子圖類二、判斷題無序類別數(shù)據僅表示不同類別,而不表示其他之間量的順序或量的大小。(√)定距尺度的主要數(shù)學特征是“÷”或“×”。(×)obj.plot或plt.plot()的函數(shù)體參數(shù)完全一致。(×)plt.plot()默認繪制折線圖(line)。(√)Series對象plot()方法中參數(shù)use_index默認為True,用索引作為x軸刻度。(√)上市公司的上市年份是分類數(shù)據,也是順序數(shù)據,也是定距數(shù)據,而不是比例數(shù)據。(√)plt.xlabel()和plt.ylabel()用于設置子圖x、y軸標題。(√)在同一幅圖形中繪制多根線條,不能采用多次調用plot函數(shù)。(×)plt.show()會釋放圖形對象資源,如果在顯示圖像之前保存圖片將只能保存空圖片。(×)1個畫布figure可以有若干子圖axes,1個子圖一般有2個數(shù)軸axis。(√)三、程序題1.利用DataFrame繪圖(1)data是某城市生產總值r=[0.83,0.92,1.12,1.23,1.21,1.52,2.24,2.52,2.54]#總收入(百萬)data=pd.DataFrame({'總收入:百萬':r},index=['2014','2015','2016','2017','2018','2019','2020','2021','2022'])請分別采用plt、sns和DataFrameAPI,繪制該數(shù)據的line/bar/hist/box圖。(2)給(1)的數(shù)據增加兩個列。data['投資收益占比']=[0.1,0.15,0.20,0.14,0.25,0.23,0.3,0.32,0.35]data['ESG評級']=['合格','良','良','良','優(yōu)','良','優(yōu)','良','優(yōu)']請分別采用plt、sns和DataFrameAPI,分別繪制該數(shù)據多組數(shù)據的line/bar/hist/box圖。并再將這些圖集成為1張圖。(3)精細繪圖。請給根據(2)的數(shù)據data,繪制畫布大小為8×6,樣式如圖6-4所示的圖形。圖6-4data精細繪圖樣本2.數(shù)據集可視化讀入資源包<..\data\ch6\固定資產.csv>數(shù)據集(1)對該數(shù)據集進行清洗,得到上市公司年報固定資產數(shù)據,并填充缺失數(shù)據集。得到新的數(shù)據集。(2)對(1)得到的數(shù)據集進行可視化,要求:固定資產賬面原值的各個類別的箱線圖固定資產賬面原值,固定資產賬面價值的總計散點圖篩選出“平安銀行”的固定資產數(shù)據,畫一張圖展示該公司的固定資產的變化,以及各個類別之間的關系第7章一、選擇題下列不是Pandas數(shù)據的是(D)A.objectB.datetime64C.categoryD.list下列關于Pandas數(shù)據的說法不正確的是(D)。object可以轉化為stringdtypes屬性為序列或數(shù)據幀的數(shù)據類型astype方法可以改變序列的數(shù)據類型object和string是同一種數(shù)據類型下列代碼的執(zhí)行結果是(C)。s=pd.Series([100,88,999])s.astype('string').str[1][1]A.’0’B.’9’C.’8’D.’1’下列有關字符串的說法正確的是(D)。chr()能夠把任意整數(shù)解釋成字符decode()方法能把任意編碼轉化為字符串Python默認的字符編碼為GBKencode()方法能夠把任意字符串轉化為對應的編碼re.findall('[^ac]','abc')的執(zhí)行結果是(B)。A.['^a']B.['b']C.['^ab']D.['a']下列有關str對象的說法錯誤的是(B)。str屬性定義在Index或Seriesstr對象方法和str的方法完全一致object或string數(shù)據類型都有str屬性str對象方法有時返回一個DataFrame下列代碼的執(zhí)行結果是(C)re.findall(r'大連市(.{2,3}區(qū))(.{2,3}[街|路])(\d+號)','大連市沙河口區(qū)尖山街217號')[('沙河口','尖山','217')][('區(qū)','街','號')][('沙河口區(qū)','尖山街','217號')][('大連市沙河口區(qū)','尖山街','217號')]下列代碼的執(zhí)行結果是(C)。my_index=pd.Index(['abc','abc','abc'])my_index.str.rstrip().str.len()Int64Index([3,3,5],dtype='int64')Int64Index([4,3,3],dtype='int64')Int64Index([4,3,4],dtype='int64')Int64Index([5,3,4],dtype='int64')下列代碼的執(zhí)行結果是(C)。s=pd.Series(['D','U','F','E'])s.str.pad(7,'both','*')[2]'***D***''***U***''***F***''***E***'pd.to_numeric方法能夠對字符格式的數(shù)值進行快速轉換和篩選,其中不是參數(shù)errors選項的是(A)。'downcast''raise''coerce''ignore'二、判斷題Pandas有一種類別數(shù)據類型category,用于對分類值進行編碼。(√)正則表達式是由普通字符和元字符組成的文字模式。(√)普通字符都是可打印字符。(×)在正則表達式中特殊字符稱為轉義字符。(×)正則表達式中匹配前面的子表達式零次或一次,使用元字符*或{0,1}。(×)正則表達式語法中"貪婪"搜索,指的是盡可能快速地搜索最短的匹配文字。(×)轉義字符集與正則表達式的簡寫字符集等價。(×)flags參數(shù)是用來指定正則表達式操作的額外選項。(√)re的拆分和查找操作只能從左到右,不支持從右到左。(×)re只能處理一行文本數(shù)據,多行處理需要借助其他工具。(×)三、程序題1.正則表達式(1)pile()函數(shù)的用法,代碼如下。[in] importrepattern=pile(r'\d+')result=pattern.findall('中國999,創(chuàng)新777')print(result)[out]['999','777']請學習pile語法,效仿以上代碼,查閱資料,了解中國資本市場上市公司股票代碼的編碼規(guī)則。請編寫pattern在多行文本中,匹配上市公司股票代碼。并將結果分別命名為:深市主板,深市中小板,上市主板,上市科創(chuàng)板2.str對象df為數(shù)據幀,代碼如下。[in] df=pd.DataFrame([['機器設備(5)','1280萬','120萬'],['房屋及建筑物(3)','8.89億','2億'],['交通工具(12)','99萬','2萬']],columns=['固定資產(數(shù)量)','原值','累計折舊'])請根據要求做如下操作:(1)將[固定資產(數(shù)量)]列中的[數(shù)量]改為獨立列存儲。(2)編寫函數(shù),將[原值],[累計折舊]兩列轉化為數(shù)字列。文本數(shù)據處理綜合讀取數(shù)據資源包文件<公司基本信息_習題.csv>,代碼如下。[in] df=pd.read_csv('..\data\ch7\公司基本信息_習題.csv',encoding='gbk')display(df.sample(5))[out]請根據要求做如下操作:(1)考察上市公司注冊地址,與辦公地址是否一致。并用適當圖形展示。(2)對[注冊地址]與[辦公地址]不一致的上市公司進行文本分析。根據結果創(chuàng)建一個新的數(shù)據集,對公司地址不一致的上市公司進行分類,如雙總部,異省搬遷,省搬遷等。并用適當圖形展示。第8章一、選擇題DatetimeIndex是由(B)對象組成的序列。A. datetime64[ns] B.Timestamp C. Datetimes D.timeIndex下列代碼的執(zhí)行結果是(C)。s=pd.Series({'日期':'10-Feb-23'})s=pd.to_datetime(s)print(s.dt.month)A. 日期10-2-23 B.日期Feb C. 日期2 D.錯誤通過date_range()方法可以創(chuàng)建某段連續(xù)的時間或者固定間隔的時間段,(C)不是該函數(shù)的參數(shù)。A. start B.end C. period D.freq下列代碼的執(zhí)行結果是(B)。s=pd.Series(['2020-02-1402:14:00'])s=pd.to_datetime(s)print(s.dt.day.values)A. 02-14 B.[14] C.14 D.錯誤可以將整型或浮點型表示的時間轉換為時間戳,時間戳單位默認是(C)。A. 毫秒 B.秒 C.納秒 D.微秒Pandas(D)方法,將標量、數(shù)組、列表或Series轉換為Timedelta類型。A. to_datetime B.DatetimeIndex C.TimedeltaIndex D.to_timedelta下列代碼的執(zhí)行結果是(A)。index=pd.date_range('20220201','20220215')data=[3,3,6,4,2,20,3,8,9,10,12,15,13,22,14]s_data=pd.Series(data,index=index)print(s_data.rolling(3).mean()[2])A. 4.0 B.6.0 C3. D.4.33pd.to_datetime()函數(shù)能夠智能將常見日期格式轉換,'2023/10/1'轉換為(A)。A. ['2023-10-01'] B.['2023-01-10'] C.['2023/01/10'] D.['下列有關dt對象的索引和切片說法正確的是(D)。A.dt對象的索引和切片與list相同B.時間序列分析過程中,一般不把時間戳序列作為索引使用C.DatetimeIndex數(shù)據類型精確到分鐘D.dt對象切片操作的引用可以不在索引序列之中下列代碼的執(zhí)行結果是(D)。index=pd.date_range('20230501','20230515')data=[3,6,4,5,2,1,3,9,9,10,12,15,13,22,14]s_data=pd.Series(data,index=index)print(s_data.rolling(3,min_periods=1).mean()[1])A. 3.0 B.6.0 C.4.0 D.4.5二、程序題1.resample()方法(1)重采樣resample()方法,可以把時間序列數(shù)據集從一個時間頻率f1轉換為另一個時間頻率f2,分為降采樣和升采樣。閱讀執(zhí)行以下代碼,理解降采樣的意義。index
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2 落花生(說課稿)2024-2025學年部編版五年級語文上冊
- 2024年食品添加劑生產企業(yè)食品原料采購合同3篇
- 外匯資產管理合同(2篇)
- 2024年進口食品批量買賣協(xié)議格式
- 專業(yè)科技協(xié)作協(xié)議模板2024版
- 房屋場地租賃合同標準
- 27《故事二則》說課稿-2024-2025學年語文四年級上冊統(tǒng)編版
- 稅務顧問服務稅務咨詢合同模板
- 建筑土建施工合同
- 優(yōu)2024年度醫(yī)療設備采購與技術支持合同
- 顧客忠誠度論文
- 血氣分析及臨床應用
- 實驗室安全檢查自查表
- 證券公司績效考核管理辦法
- 中國建設銀行網上銀行企業(yè)網銀客戶服務系統(tǒng)--用戶操作手冊(簡易版)
- 大班幼兒任務意識培養(yǎng)的策略研究論文
- 浙江省市政工程安全臺賬完整
- 歐洲城市廣場歷史演變
- 國外招商引資模式與經驗借鑒(上海環(huán)盟)
- 個人信用報告異議申請表
- 蒸汽管道專項施工方案
評論
0/150
提交評論