版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
財(cái)務(wù)大數(shù)據(jù)基礎(chǔ)課前回顧下列哪一項(xiàng)不屬于大數(shù)據(jù)的典型特征?(
)A.數(shù)據(jù)量大B.多樣性C.價(jià)值密度大D.速度更新快2.下列哪一項(xiàng)屬于結(jié)構(gòu)化的文件?(
)A.WordB.ExcelC.PPTD.圖片3.下列哪一項(xiàng)不屬于財(cái)務(wù)大數(shù)據(jù)的分析流程?(
)A.數(shù)據(jù)認(rèn)知B.數(shù)據(jù)清洗C.數(shù)據(jù)采集D.數(shù)據(jù)分析
項(xiàng)目二
財(cái)務(wù)大數(shù)據(jù)采集數(shù)據(jù)采集認(rèn)知調(diào)查問卷采集單文件和多文件的數(shù)據(jù)采集互聯(lián)網(wǎng)數(shù)據(jù)采集
項(xiàng)目實(shí)訓(xùn)(PowerBI數(shù)據(jù)采集)數(shù)據(jù)采集認(rèn)知數(shù)據(jù)采集概念數(shù)據(jù)采集:又稱數(shù)據(jù)獲取,是利用一種裝置從系統(tǒng)外部采集數(shù)據(jù)并輸入到系統(tǒng)內(nèi)部的一個(gè)接口。數(shù)據(jù)采集是認(rèn)知事實(shí)的重要基礎(chǔ)。數(shù)據(jù)采集認(rèn)知
常見的數(shù)據(jù)源:企業(yè)的數(shù)據(jù)中心、各大門戶網(wǎng)站、國家統(tǒng)計(jì)局、金融數(shù)據(jù)庫等。數(shù)據(jù)采集概念新浪財(cái)經(jīng):
國家統(tǒng)計(jì)局網(wǎng)站:
思考:為什么要進(jìn)行數(shù)據(jù)采集?數(shù)據(jù)采集認(rèn)知數(shù)據(jù)采集認(rèn)知數(shù)據(jù)采集應(yīng)用行業(yè)信息源應(yīng)用旅游各類信息優(yōu)化出行策略電商商品信息比價(jià)系統(tǒng)游戲游戲論壇調(diào)整游戲運(yùn)營銀行個(gè)人交易信息征信系統(tǒng)/貸款評(píng)級(jí)金融金融新聞/數(shù)據(jù)制定投資策略,量化交易招聘職位信息崗位信息輿情各大論壇社會(huì)群體感知數(shù)據(jù)采集認(rèn)知數(shù)據(jù)采集的常用方法數(shù)據(jù)來源一手?jǐn)?shù)據(jù)調(diào)查實(shí)驗(yàn)二手?jǐn)?shù)據(jù)系統(tǒng)內(nèi)部數(shù)據(jù)系統(tǒng)外部數(shù)據(jù)數(shù)據(jù)采集——PowerBI
PowerQuery是PowerBI的數(shù)據(jù)查詢模塊,它的作用是對(duì)數(shù)據(jù)表進(jìn)行清洗和整合。而在進(jìn)入到數(shù)據(jù)清洗之前,先導(dǎo)入各種各樣的數(shù)據(jù)。
本項(xiàng)目主要介紹PowerBI常見的幾種數(shù)據(jù)采集方式,例如調(diào)查問卷數(shù)據(jù)采集、單文件數(shù)據(jù)采集、多文件數(shù)據(jù)采集和互聯(lián)網(wǎng)數(shù)據(jù)采集等。數(shù)據(jù)采集認(rèn)知調(diào)查問卷采集問卷調(diào)查概念
調(diào)查問卷又稱調(diào)查表或詢問表,是以問題的形式系統(tǒng)地記載調(diào)查內(nèi)容的一種印件。問卷可以是表格式、卡片式或簿記式。調(diào)查問卷采集問卷設(shè)計(jì),是問卷調(diào)查的關(guān)鍵。完美的問卷必須具備兩個(gè)功能——能將問題傳達(dá)給被問的人和使被問者樂于回答。調(diào)查問卷采集問卷設(shè)計(jì)過程明確目的明確方法搜集資料確定內(nèi)容決定結(jié)構(gòu)把握調(diào)研的目的和內(nèi)容常用的有面訪調(diào)查、電話訪問、郵寄問卷、計(jì)算機(jī)輔助訪問等方式(1)這個(gè)問題有必要嗎?(2)是需要幾個(gè)問答題?封閉性問題和開放性的問題調(diào)查問卷采集問卷設(shè)計(jì)構(gòu)成調(diào)查問卷的構(gòu)成要素:標(biāo)題、說明、主體、致謝語(1)標(biāo)題每份問卷都有一個(gè)研究主題。研究者應(yīng)開宗明義定個(gè)題目,反映這個(gè)研究主題,例如“中國互聯(lián)網(wǎng)發(fā)展?fàn)顩r及趨勢(shì)調(diào)查”。(2)說明問卷前面應(yīng)有一個(gè)說明。這個(gè)說明可以是一封告調(diào)查對(duì)象的信,也可以是指導(dǎo)語,說明這個(gè)調(diào)查的目的意義。(3)主體這是研究主題的具體化,是問卷的核心部分。問題和答案是問卷的主體。(4)致謝語為了表示對(duì)調(diào)查對(duì)象真誠合作的謝意,研究者應(yīng)當(dāng)在問卷的的末端寫上感謝的話。調(diào)查問卷采集問卷設(shè)計(jì)要點(diǎn)表明調(diào)查作出身份目的承諾卷首語親愛的朋友:您好!首先非常感謝您接受此次的調(diào)查!我是XXX,正在進(jìn)行一項(xiàng)關(guān)于XX的調(diào)查,您的反饋將成為本研究調(diào)查中的重要依據(jù)。此次問卷填寫需約3分鐘,真心感謝您為我們付出的時(shí)間。我們?cè)诖肃嵵爻兄Z,本次調(diào)查不記名,內(nèi)容僅作學(xué)習(xí)、研究之用,我們將會(huì)對(duì)您的信息嚴(yán)格保密!調(diào)查問卷采集問卷設(shè)計(jì)要點(diǎn)窮盡答案在設(shè)計(jì)問題選項(xiàng)時(shí),對(duì)于會(huì)出現(xiàn)多種情況的,可以添加一個(gè)【其他】,【以上情況都有】選項(xiàng),保證被調(diào)查者有選項(xiàng)可以選擇。多用普通用語,對(duì)專門術(shù)語必須加以解釋。要防止誘導(dǎo)性、暗示性的問題,以免影響回卷者的思考。調(diào)查問卷采集問卷設(shè)計(jì)要點(diǎn)您最希望超市擴(kuò)展的業(yè)務(wù)是?A.機(jī)票、酒店預(yù)訂B.水電費(fèi)查詢C.免費(fèi)WIFI服務(wù)D.支付寶等移動(dòng)支付方式E.其他您【最希望】超市擴(kuò)展的業(yè)務(wù)是?(單選)A.機(jī)票、酒店預(yù)訂B.水電費(fèi)查詢C.免費(fèi)WIFI服務(wù)D.支付寶等移動(dòng)支付方式E.其他認(rèn)知調(diào)查問卷問題設(shè)計(jì)方法:關(guān)鍵詞法(圍繞調(diào)查問卷標(biāo)題中的關(guān)鍵詞設(shè)計(jì)問題)舉例:?jiǎn)柧順?biāo)題“關(guān)于女性消費(fèi)者的日常消費(fèi)行為調(diào)查”思考:標(biāo)題中有哪些關(guān)鍵詞?討論:圍繞關(guān)鍵詞可以設(shè)計(jì)哪些問題?調(diào)查問卷采集調(diào)查問卷采集任務(wù)實(shí)施:設(shè)計(jì)一份調(diào)查問卷動(dòng)手實(shí)踐以小組為單位,選擇自己感興趣的一個(gè)問題,完成
設(shè)計(jì)問卷—發(fā)放問卷—回收問卷—問卷結(jié)果分析
工作流程。問卷設(shè)計(jì)平臺(tái)1.問卷星:
2.問卷網(wǎng):
3.騰訊問卷:
單文件和多文件數(shù)據(jù)采集單文件數(shù)據(jù)采集Excel是財(cái)務(wù)中常見數(shù)據(jù)類型,在PowerBI有多種導(dǎo)入方式。
方式一、直接點(diǎn)擊導(dǎo)入Excel的快捷方式;
方式二、在“主頁”功能區(qū)選擇“Excel工作簿”。
單文件和多文件數(shù)據(jù)采集單文件數(shù)據(jù)采集方式三、點(diǎn)擊“主頁”的“獲取數(shù)據(jù)”,選擇“Excel工作簿”,通過這種方式可以找到所有數(shù)據(jù)源。
單文件和多文件數(shù)據(jù)采集單文件數(shù)據(jù)采集點(diǎn)擊“獲取數(shù)據(jù)”后,選擇本地的文件路徑并打開,PowerBI將建立與本地文件的連接。
單文件和多文件數(shù)據(jù)采集單文件數(shù)據(jù)采集下一步進(jìn)入”導(dǎo)航器“界面,勾選所需工作簿。數(shù)據(jù)若無需處理,則點(diǎn)擊下方的“加載”,數(shù)據(jù)將直接加載至模型;否則,點(diǎn)擊“轉(zhuǎn)化數(shù)據(jù)”,數(shù)據(jù)將加載至PowerQuery數(shù)據(jù)處理的界面。
單文件和多文件數(shù)據(jù)采集單文件數(shù)據(jù)采集其他單個(gè)文件包括CSV、PDF文件等,導(dǎo)入方式和Excel類似。
單文件和多文件數(shù)據(jù)采集單文件數(shù)據(jù)采集其他單個(gè)文件包括CSV、PDF文件等,導(dǎo)入方式和Excel類似。
單文件和多文件數(shù)據(jù)采集單文件數(shù)據(jù)采集任務(wù)實(shí)施調(diào)查問卷數(shù)據(jù)結(jié)果導(dǎo)入PowerBI,并進(jìn)行結(jié)果可視化呈現(xiàn),完成組間互評(píng)。
單文件和多文件數(shù)據(jù)采集Excel與PowerBI的區(qū)別?常用的數(shù)據(jù)分析軟件;處理的數(shù)據(jù)量有限(百萬);最小的處理單元是單元格;需要運(yùn)用公式和函數(shù),沒有操作過程記錄主流的商業(yè)智能軟件;處理的數(shù)據(jù)量較大(千萬);最小的處理單元是行和列;需要運(yùn)用建模和函數(shù);有操作過程記錄
單文件和多文件數(shù)據(jù)采集多文件數(shù)據(jù)采集軟件如何選擇:取決于需要解決的數(shù)據(jù)分析問題。問題1:分析某一個(gè)月份的資產(chǎn)負(fù)債表?問題2:分析多個(gè)月份的財(cái)務(wù)報(bào)表?Excel還是PowerBI?
單文件和多文件數(shù)據(jù)采集多文件數(shù)據(jù)采集如果需要批量導(dǎo)入單個(gè)文件,可以把單個(gè)文件放至文件夾,PowerBI支持導(dǎo)入文件夾。
步驟1:在“獲取數(shù)據(jù)”中點(diǎn)擊導(dǎo)入“文件夾”,選擇本地的文件夾路徑。
單文件和多文件數(shù)據(jù)采集多文件數(shù)據(jù)采集步驟2:點(diǎn)擊“合并并轉(zhuǎn)化數(shù)據(jù)”選項(xiàng),進(jìn)入示例文件選項(xiàng)窗口,PowerBI會(huì)選擇文件夾中的一個(gè)文件作為模板顯示。
單文件和多文件數(shù)據(jù)采集多文件數(shù)據(jù)采集步驟3:利用“合并并轉(zhuǎn)化數(shù)據(jù)”功能,進(jìn)入Power
Query界面會(huì)自動(dòng)創(chuàng)建和調(diào)用自定義函數(shù),實(shí)現(xiàn)智能的轉(zhuǎn)化。
單文件和多文件數(shù)據(jù)采集多文件數(shù)據(jù)采集1.在國家統(tǒng)計(jì)局網(wǎng)站找到各省年度數(shù)據(jù),數(shù)據(jù)內(nèi)容自行選擇。網(wǎng)址
2.下載或復(fù)制5個(gè)省份的數(shù)據(jù)并分別粘貼到5個(gè)Excel文件中。3.使用PowerBI同時(shí)采集這5個(gè)Excel文件的數(shù)據(jù)。任務(wù)實(shí)施網(wǎng)絡(luò)爬蟲
網(wǎng)絡(luò)爬蟲(WebCrawler或WebSpider),是實(shí)現(xiàn)互聯(lián)網(wǎng)數(shù)據(jù)采集的主要方式,它是通過自動(dòng)下載網(wǎng)頁,并根據(jù)一定的規(guī)則來提取所需要信息的程序,網(wǎng)絡(luò)爬蟲所爬取地主要是網(wǎng)頁上的數(shù)據(jù)。網(wǎng)絡(luò)爬蟲小規(guī)模中規(guī)模大規(guī)模數(shù)據(jù)量小爬取速度不敏感數(shù)據(jù)規(guī)模大爬取速度敏感搜索引擎爬取速度關(guān)鍵爬取網(wǎng)頁爬取系列網(wǎng)站爬取全網(wǎng)常用的財(cái)經(jīng)網(wǎng)站網(wǎng)站優(yōu)勢(shì)巨潮資訊網(wǎng)證監(jiān)會(huì)制定的信息披露網(wǎng)站同花順/東方財(cái)富網(wǎng)基本什么方面的內(nèi)容都能在上面涉及到
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GH/T 1440-2023黑蒜
- 中考文言文復(fù)習(xí)資料大全課外文言文沖刺課件
- 不等式證明復(fù)習(xí)課課件
- 單位管理制度合并選集職員管理篇十篇
- 單位管理制度分享合集【職員管理篇】
- 《詩歌鑒賞表達(dá)技巧》課件
- 《企力管理咨詢》課件
- 單位管理制度呈現(xiàn)大全【職員管理篇】
- 《轉(zhuǎn)基因生物安全性》課件
- 4S店維修安全管理制度
- 軟件定義網(wǎng)絡(luò)(SDN)實(shí)戰(zhàn)教程課件
- 上海市住院醫(yī)師規(guī)范化培訓(xùn)公共科目考試題庫-重點(diǎn)傳染病防治知識(shí)
- 2024江蘇省鐵路集團(tuán)限公司春季招聘24人高頻考題難、易錯(cuò)點(diǎn)模擬試題(共500題)附帶答案詳解
- 2024智能變電站新一代集控站設(shè)備監(jiān)控系統(tǒng)技術(shù)規(guī)范部分
- 企業(yè)反恐專項(xiàng)經(jīng)費(fèi)保障制度
- 電梯工程師在電梯設(shè)計(jì)中的工作內(nèi)容
- 《概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)》全套教學(xué)課件
- 2024國家開放大學(xué)電大本科《液壓氣動(dòng)技術(shù)》期末試題及答案
- 肥豬銷售合同模板
- 餐飲顧問合作協(xié)議
- 兩課 說課 單相橋式整流電路分析(獲獎(jiǎng))
評(píng)論
0/150
提交評(píng)論