![數據挖掘實驗報告-實驗1-Weka基礎操作_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/15/5098d6cd-0c44-4444-9e0d-f4d88d64e55f/5098d6cd-0c44-4444-9e0d-f4d88d64e55f1.gif)
![數據挖掘實驗報告-實驗1-Weka基礎操作_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/15/5098d6cd-0c44-4444-9e0d-f4d88d64e55f/5098d6cd-0c44-4444-9e0d-f4d88d64e55f2.gif)
![數據挖掘實驗報告-實驗1-Weka基礎操作_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/15/5098d6cd-0c44-4444-9e0d-f4d88d64e55f/5098d6cd-0c44-4444-9e0d-f4d88d64e55f3.gif)
![數據挖掘實驗報告-實驗1-Weka基礎操作_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/15/5098d6cd-0c44-4444-9e0d-f4d88d64e55f/5098d6cd-0c44-4444-9e0d-f4d88d64e55f4.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、學生實驗報告學院:信息管理學院課程名稱:數據挖掘教學班級:B01姓名:學號:實驗報告課程名稱數據挖掘教學班級B01指導老師學號姓名行政班級實驗項目實驗一: Weka的基本操作組員名單獨立完成實驗類型操作性實驗驗證性實驗綜合性實驗實驗地點H535實驗日期1. 實驗目的和要求:( 1) Explorer 界面的各項功能;注意不能與課件上的截圖相同,可采用打開不同的數據文件以示區(qū)別。( 2) Weka的兩種數據表格編輯文件方式下的功能介紹;Explorer-Preprocess-edit,彈出 Viewer 對話框;Weka GUI選擇器窗口 -Tools | ArffViewer,打開 ARFF-
2、Viewer 窗口。( 3) ARFF文件組成。2實驗過程(記錄實驗步驟、分析實驗結果)2.1 Explorer界面的各項功能初始界面示意其中: explorer 選項是數據挖掘梳理數據最常用界面,也是使用weka 最簡單的方法。Experimenter :實驗者選項,提供不同數值的比較,發(fā)現其中規(guī)律。KnowledgeFlow :知識流,其中包含處理大型數據的方法,初學者應用較少。Simple CLI:命令行窗口,有點像cmd 格式,非圖形界面。進入 Explorer界面功能介紹(1)任務面板Preprocess(數據預處理) :選擇和修改要處理的數據。Classify (分類):訓練和測試
3、分類或回歸模型。Cluster(聚類):從數據中聚類。聚類分析時用的較多。Associate(關聯(lián)分析) :從數據中學習關聯(lián)規(guī)則。Select Attributes (選擇屬性):選擇數據中最相關的屬性。Visualize (可視化):查看數據的二維散布圖。(2)常用按鈕Openfile :打開文件Open URL :打開 URL 格式文件Open DB :打開數據庫文件Generate:數據生成Undo:撤銷操作Edit :編輯數據Save:保存數據文件,可實現文件格式的轉換,比如csv 格式文件向ARFF 格式文件轉換等等。(3)篩選數據Choose:從這個按鈕進去可以選擇某個過濾器對數據
4、進行篩選,數據預處理一般使用這個。Apply :處理完成后,點擊這個按鈕,處理生效。( 4)數據集的屬性關系和操作current relation :展示了屬性的(relation )關系名稱 ,(attributes) 屬性數, (Insetances)實例數, (sum ofweights) 權重的總和等多種屬性關系。Attributes :展示了屬性的所有列, 上邊的四個按鈕是對屬性列的快捷選擇按鈕,包括 (all) 全選,(none)全不選, (Ivert) 反選,(patern)模式,選擇符合某一條件的屬性列。最下邊的remove 按鈕可以刪除選中的屬性列,如果想撤回,可以使用上邊提
5、到的undo 按鈕 ( 5)屬性摘要和直方圖Selected attributes:如果是數值屬性:屬性名(Name)、屬性類型( Type)、缺失值( Missing )個數及百分比、不同值(Distinct )數、唯一值(Unique )數及百分比等等。對于數值屬性和標稱屬性,摘要的方式是不一樣的。圖中顯示的是標簽的取值及相應取值的實例數。選中屬性的直方圖。若數據集的最后一個屬性是類標變量(這是分類或回歸任務的默認目標變量,如 “play ”),直方圖中的每個長方形就會按照該變量的比例分成不同顏色的段。要想換個分段的依據,在上方的下拉框中選個不同的分類屬性就可以了。下拉框里選上“No Cl
6、ass或”者一個數值屬性會變成黑白的直方圖。Visualize :展示所有的屬性的直方圖( 6)狀態(tài)欄( status)顯示一些信息讓你知道正在做什么。在狀態(tài)欄中的任意位置右擊鼠標將會出現一個小菜單。有兩個選項:Memory Information- 顯示 WEKA 可用的內存量。Run garbage collector- 強制運行Java 垃圾回收器,搜索不再需要的內存空間并將之釋放,從而可為新任務分配更多的內存。Log :按鈕可以查看以weka 操作日志。沒有任務時,右邊的小鳥是坐著的,任務運行時,小鳥會站起來左右搖擺。若小鳥站著但不轉動,表示任務出了問題。引例操作顯示功能( 1)2.2
7、 weka 的兩種數據表格編輯方式下的功能介紹Explorer-Preprocess-edit,彈出 Viewer 對話框;1、 雙擊鼠標可以對數據進行修改,2、 在數據上使用右鍵可以對數據修改進行撤回(undo)3、 對數據修改之后,如果想保存,點擊下方的ok,撤回點擊undo,不保存直接點擊cancelWeka GUI選擇器窗口 -Tools | ArffViewer,打開 ARFF-Viewer 窗口。1、 在最開始進入界面點擊上邊的tools,進入arffviewer 。2、 點擊打開不同的文件,會在上沿像瀏覽器一樣挨個展示arff文件的內容。3、 鼠標移動到屬性名稱旁邊是會顯示對屬性
8、列操作的格式,單機左鍵會對所有數據按照這個屬性按照升序排列, ( shift + 左鍵)會對屬性按照這個屬性進行降序排列,( Alt+ 左鍵)或者直接右鍵出現對數據進行操作的菜單,對屬性列進行重命名,所有數據相加之類的操作都可以在菜單中找到。4、 鼠標定在某行時,可以刪除某一行5、 有點像 excel 中的操作2.2ARFF 文件組成、對文件格式介紹WEKA 存儲數據的格式是ARFF ( Attribute-Relation File Format )文件1、 這是一種 ASCII 文本文件2、 文件的擴展名為.arff3、 可以用寫字板打開、編輯ARFF 文件。建議用UltraEdit 等編
9、輯器使用寫字板打開時如下“%”表示注釋, WEKA 將忽略這些行。除去注釋后,整個ARFF 文件可以分為兩個部分:( a)第一部分給出了頭信息(Head information),包括了對關系的聲明和對屬性的聲明。( b)第二部分給出了數據信息( Data information),即數據集中給出的數據。從 “data”標記開始,后面的就是數據信息了。關系名稱在ARFF 文件的第一個有效行來定義,格式為:relation < 關系名 ><關系名 >是一個字符串。如果這個字符串包含空格,它必須加上引號(指英文標點的單引號或雙引號) 。屬性聲明用一列以“attribute
10、開”頭的語句表示。數據集中的每一個屬性都有對應的“attribute 語”句,來定義它的屬性名稱和數據類型( datatype):attribute < 屬性名 > <數據類型 >其中 <屬性名 >必須以字母開頭的字符串。和關系名稱一樣,如果這個字符串包含空格,它必須加上引號。屬性聲明語句的順序很重要,它表明了該項屬性在數據部分的位置。最后一個聲明的屬性被稱作class 屬性,在分類或回歸任務中,它是默認的目標變量。WEKA 一共支持五種數據類型numeric數值型nominal標稱( nominal )型string字符串型date <date-fo
11、rmat>日期和時間型Relational關系型還可以使用兩個類型“integer和”“real,”但是 WEKA 把它們都當作 “numeric 看”待。注意: “integer,”“real,”“numeric,”“date,”“string這”些關鍵字是區(qū)分大小寫的,而 “relation、”“ attribute 和 “ ”data則”不區(qū)分。每個實例占一行,實例的各屬性值用逗號“,隔”開。如果某個屬性的值是缺失值( missing value ),用問號 “?表”示,且這個問號不能省略。文件轉 arff 文件(1)創(chuàng)建 xls 文件,保存為csv 文件(2)weka中打開 csv 格式的文件, 另存為 arff 文件,因為在數
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年二手商鋪租賃合同標準版本(4篇)
- 2025年三方月嫂保姆合同(三篇)
- 辦公室基礎裝修合作協(xié)議
- 液態(tài)堿液罐車配送合同
- 古建筑修繕服務合同
- 南京市藥店裝修合同
- 農業(yè)科技成果物流合同
- 商業(yè)用地招商合同
- 裝修怎么做防水施工方案
- 私人模塊化廁所施工方案
- DCMM練習題練習試題
- 《工業(yè)化建筑施工階段碳排放計算標準》
- 地下停車場充電樁技術方案建議書
- 幼兒園設施設備安全教育
- 廢舊保溫棉處置合同范例
- 2024年數據編織價值評估指南白皮書-Aloudata
- 四川省算力基礎設施高質量發(fā)展行動方案(2024-2027年)
- 托育園老師培訓
- 人教版八年級英語上冊Unit1-10完形填空閱讀理解專項訓練
- 脊柱外科護理進修心得
- 4.1中國特色社會主義進入新時代+課件-2024-2025學年高中政治統(tǒng)編版必修一中國特色社會主義
評論
0/150
提交評論