




已閱讀5頁,還剩63頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1 2009/2/20 關(guān)鍵字 : M/料整理篇 | I 商務(wù)智能入門資料 2 1. 目錄 1. 論 . 1 2. 聯(lián)機(jī)事務(wù)處理 . 1 3. 具介紹 : . 2 具介紹 . 3 具介紹 . 5 具介紹 . 8 源工具 紹 . 14 4. 數(shù)據(jù)倉庫 ( 的架構(gòu) . 19 5. 數(shù)據(jù)集市 . 19 6. 數(shù)據(jù)挖掘 . 20 數(shù)據(jù)挖掘的起源 . 21 數(shù)據(jù)挖掘能做什么 . 21 數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則 . 23 數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn) . 26 數(shù)據(jù)挖掘與數(shù)據(jù)倉庫融合發(fā)展 . 27 統(tǒng)計(jì)學(xué)與數(shù)據(jù)挖掘 . 27 數(shù)據(jù)挖掘相關(guān)的 10 個(gè)問題 . 30 7. 聯(lián)機(jī)分析處理 . 36 作用 . 36 起源 . 36 分類 . 37 發(fā)展背景 . 37 聯(lián)機(jī)分析處理的特點(diǎn) . 38 輯概念和典型操作 . 39 統(tǒng)的體系結(jié)構(gòu)和分類 . 40 聯(lián)機(jī)分析處理的實(shí)現(xiàn)方式 . 41 主要 商產(chǎn)品介紹 . 45 品 . 47 言 . 48 8. 其他工具 . 1 . 1 . 1 . 1 . 1 . 1 . 1 . 2 Q . 3 3 1 1. 論 不是一項(xiàng)新技術(shù),它將數(shù)據(jù)倉庫 (聯(lián)機(jī)分析處理 (數(shù)據(jù)挖掘 (技術(shù)與客戶關(guān)系管理( 結(jié)合起來 應(yīng)用于商業(yè)活動(dòng)實(shí)際過程當(dāng)中,實(shí)現(xiàn)了技術(shù)服務(wù)于決策的目的; I,認(rèn)為 根本上幫助你把公司的運(yùn)營數(shù)據(jù)轉(zhuǎn)化成為高價(jià)值的可以獲取的信息(或者知識(shí)),并且在恰當(dāng)?shù)臅r(shí)間通過恰 當(dāng)?shù)氖侄伟亚‘?dāng)?shù)男畔鬟f給恰當(dāng)?shù)娜?”。 M/基 本流程圖: 2. 聯(lián)機(jī)事務(wù)處理 聯(lián)機(jī)分析處理 (的概念最早是由關(guān)系數(shù)據(jù)庫之父 1993 年提出的,他同時(shí)提出了關(guān)于 12 條準(zhǔn)則。 提出引起了很大的反響, 為一類產(chǎn)品同聯(lián)機(jī)事務(wù)處理 (明顯區(qū)分開來。 當(dāng)今的數(shù)據(jù)處理大致可以分成兩大類:聯(lián)機(jī)事務(wù)處理 聯(lián)機(jī)分析處理 傳統(tǒng)的關(guān)系型數(shù)據(jù)庫的主要應(yīng) 用,主要是基本的、日常的事務(wù)處理,例如銀行交易。 數(shù)據(jù)倉庫系統(tǒng)的主要應(yīng)用,支 持復(fù)雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查詢結(jié)果。 使分析人員、管理人員或執(zhí)行人員能夠從多角度對信息進(jìn)行快速、一致、交互地存取 ,從而獲得對數(shù)據(jù)的更深入了解的一類軟件技術(shù)。 目標(biāo)是滿足決策支持或者滿足在多維環(huán)境下特定的查詢和報(bào)表需求 ,它的技術(shù)核心是 維 這個(gè)概念。 2 3. 具介紹 : 定義:將數(shù)據(jù)抽?。?轉(zhuǎn)換( 清洗( 裝載( 過程。 它是構(gòu)建數(shù)據(jù)倉庫的重要環(huán)節(jié)。數(shù)據(jù)倉庫是面向主題 的、集成的、穩(wěn)定的且隨時(shí)間不斷變化的數(shù)據(jù)集合,用以支持經(jīng)營管理中的決策制定過程。數(shù)據(jù)倉庫系統(tǒng)中有可能存在著大量的噪聲數(shù)據(jù) ,引起的主要原因有:濫用 縮寫詞、慣用語、數(shù)據(jù)輸入錯(cuò)誤、重復(fù)記錄、丟失值、拼寫變化等。即便是一個(gè)設(shè)計(jì)和規(guī)劃良好的數(shù)據(jù)庫系統(tǒng),如果其中存在著大量的噪聲數(shù)據(jù),那么這個(gè)系統(tǒng)也是 沒有任何意義的,因?yàn)?“垃圾進(jìn),垃圾出 ”( 系統(tǒng)根本就不可能為決策分析系統(tǒng)提供任何支持。為了清除 噪聲數(shù)據(jù),必須在數(shù)據(jù)庫系統(tǒng)中進(jìn)行數(shù)據(jù)清洗。目前有不少數(shù)據(jù)清洗研究和 究,但是 如何在 程中進(jìn)行有效的數(shù)據(jù)清洗并使這個(gè)過程可視化,此方面研究不多。 數(shù)據(jù)倉庫服務(wù),數(shù)據(jù)倉庫用于數(shù)據(jù)分析,數(shù)據(jù)分析屬于 統(tǒng)的要干的事兒。 一般中 /小型 統(tǒng)都會(huì)有不成熟的 統(tǒng),為啥叫做不成熟? 因?yàn)樗鼈兓蛘哂袌?bào)表分析功能,但不具有 線分析 ),或者有 卻沒有數(shù)據(jù)挖掘和深度分析?;蛘吒纱?,來個(gè)大集成,直接利用第三方工具來達(dá)到相應(yīng)的目的。 為什么會(huì)這樣,究其原 因,很多情況是因?yàn)闆]有自主的數(shù)據(jù)倉庫,沒有數(shù)據(jù)倉庫,其它的做起來也就有些四不象了。而要建立數(shù)據(jù)倉庫,首要的是: 于是,需求就應(yīng)運(yùn)而生了。 對了, 什么? 啥?什么又是數(shù)據(jù)挖掘?鑒于我只能解釋其表面含義,我就不多說了。各位不妨找本數(shù)據(jù)倉庫的書,翻翻前幾頁,一般就明白了。或者 把。 我們撿當(dāng)下最流行的 用: 說說它與 關(guān)系。 了解 人都知道,它的分析模型由事實(shí)表和維表組成。但往往 統(tǒng)中的數(shù)據(jù)庫是為事務(wù)而建,而并不為 分析而建,而為了 改動(dòng) 據(jù) 庫是不現(xiàn)實(shí),并且,很多情況下也基本上是不可能的 (當(dāng)然,有些公司把不可能的任務(wù)變成可能的,但這顯然是一種很僵硬的做法 )。 這時(shí)候, 作用就顯出來了,它可以為 務(wù),按業(yè)務(wù)主題提取分析模型進(jìn)行數(shù)據(jù)抽取。 (析需要什么樣的數(shù)據(jù)支持?可以參看一下 星型模型 )。 再說說數(shù)據(jù)挖掘: 這個(gè)課題實(shí)在太大,相關(guān)的書藉有很多很多,我還得花時(shí)間慢慢去學(xué)習(xí)。簡單的說,這涉及 務(wù)和統(tǒng)計(jì)學(xué)的知識(shí)?,F(xiàn)在我暫時(shí)還沒開始相關(guān)學(xué)習(xí),但它 與 關(guān)系卻很明顯。因?yàn)閿?shù)據(jù)挖掘所要求的數(shù)據(jù)大都是高聚合的已處理的數(shù)據(jù),所以,不管從獲取3 難度和效率上來說,都不適合直接從 獲取。 同樣,需要 幫忙。 因此,按本人粗淺的理解: 在是: 統(tǒng) 設(shè)計(jì)開發(fā),項(xiàng)目實(shí)施 之必備良藥! 有句名言講得好:成為巨人不如站在巨人的肩膀上。 如果想對 詳盡的了解,不妨先了解一下現(xiàn)有流行的 具。 具介紹 對于 使用 ,有最基本的接觸,但僅限時(shí)簡單的數(shù)據(jù)導(dǎo)入 /導(dǎo)出。當(dāng)開始了解 ,才發(fā)現(xiàn) 來就是 應(yīng)用之一。 先不談?wù)?好壞,但它至少 品的特點(diǎn),易學(xué),易用。所以,要了解 應(yīng)用,從 始,在我看來,是個(gè)不錯(cuò)的選擇。我只是學(xué)習(xí),所以我沒 有能耐去評價(jià)它,下面,只能講 功能一一列舉出來,可能這些與 聯(lián)機(jī)幫助有些重復(fù),但對我來說,是一個(gè)加深記憶的方法。 一:概念 自完全不同源的數(shù)據(jù)析取、轉(zhuǎn)換并合并到單 個(gè)或多個(gè)目的。主要應(yīng)用于企業(yè)數(shù)據(jù)倉庫的數(shù)據(jù)抽取過程,完成從源數(shù)據(jù)庫 /文件到數(shù)據(jù)倉庫的抽取和轉(zhuǎn)換過程。 看看,這不就是 做的事兒。 二:特征 于 B,很方便從不同的數(shù)據(jù)源復(fù)制和轉(zhuǎn)換數(shù)據(jù)。 是了, 是首要支持自已的其它產(chǎn)品,所以,它選擇了最通用的 標(biāo)準(zhǔn)。 圖形化設(shè)計(jì)器,也可通過編程二次開發(fā)。 這也是 長項(xiàng),并且能把其它的東西一股腦兒的集成進(jìn)來。 行效率高于普通 作 據(jù)說是這樣地,我做過簡單的比較,確實(shí)不是一個(gè)數(shù)量級,原理呢?估計(jì)可能有較多特殊處理,比如批量插入 輸前的數(shù)據(jù)壓縮等技術(shù) ,當(dāng)然,這只是我的猜測。 調(diào)度。 這對于 統(tǒng),那很容易了,可以利用現(xiàn)成的系統(tǒng)級調(diào)度。 三:詳細(xì) 來說點(diǎn)詳細(xì)的東東,當(dāng)然,這里的詳細(xì)并不指全部,實(shí)際上,我也只能挑出比較有代表性的功能點(diǎn)列舉一下,要是全部,那還不如抄襲聯(lián)機(jī)幫助了。 最小的可調(diào)度單元 包是基本任務(wù),由工作流連接而成。 包可以嵌套 (包中的單個(gè)任務(wù)可以是執(zhí)行另一個(gè)已存在的包 )。 包是調(diào)度的直接管理對象,嵌套包保證包任務(wù)的重用。 4 務(wù) 最小的工作流連接單元 分為以下幾種任務(wù): 導(dǎo)出和導(dǎo)入數(shù)據(jù)任務(wù)、轉(zhuǎn)換任務(wù)、復(fù)制數(shù)據(jù)庫對象、郵件 /消息發(fā)送、 句或 腳本執(zhí)行包、采用 定義任務(wù)。 其中,最常用的應(yīng)該是普通轉(zhuǎn)換任務(wù)。這等同于 的 T。 數(shù)據(jù)連接 定義數(shù)據(jù)源和目的地 分為以下幾種: 標(biāo)準(zhǔn)數(shù)據(jù)庫(如 000、 000、 與 據(jù)源的 B 連接; 000 電子表格數(shù)據(jù); ;以及其它 B 提供程序 文件連接數(shù)據(jù)鏈接連接 (比較特殊 ) 注意: 為 用產(chǎn)品, 然也不支持 對于標(biāo)準(zhǔn)數(shù)據(jù)庫是最基本的應(yīng)用,易于實(shí)現(xiàn)。 文件連接涉及格式定義,還不算復(fù)雜。 換 數(shù)據(jù)轉(zhuǎn)換 數(shù)據(jù)轉(zhuǎn)換,指列進(jìn)行,有多種方式: 單復(fù)制方式。 單轉(zhuǎn)換 (如,數(shù)據(jù)格式化,取字符串子串等 ) 本 (實(shí)際上是 用自定的 象進(jìn)行轉(zhuǎn)換。 通常會(huì)采用一二方式。如果要將 成到你的應(yīng)用中,可以第三種方式。 作流 工作流包括成功,失敗,完 成。工作流支持腳本控制??删幊炭刂?。 工作流方式對于純數(shù)據(jù)抽取意義不大,但是考慮到任務(wù)包含收發(fā)郵件,信息,上 /下傳文件,那就有必要了。當(dāng)然,你也可以將這些任務(wù)單獨(dú)提出到應(yīng)用端執(zhí)行,而不采用 的任務(wù)。 數(shù)據(jù) 元數(shù)據(jù)方式更多的留備擴(kuò)展,最基礎(chǔ)的應(yīng)用是用來預(yù)定義數(shù)據(jù)表。 據(jù)驅(qū)動(dòng)的查詢?nèi)蝿?wù) (一種特珠的轉(zhuǎn)換方式 ) 一種很特殊的轉(zhuǎn)換方式,支持參數(shù)。這里,單獨(dú)把它提出來,因?yàn)樗皇悄敲慈菀桌斫猓一艘恍r(shí)間,才將其弄明白。 據(jù)源數(shù)據(jù)的特征決定之后的查詢方式 (指增,刪,改,查詢操作 )。 持參數(shù),參數(shù)通過定義綁定表來關(guān)聯(lián),通過定義轉(zhuǎn)換腳本,可以計(jì)算出綁定列參數(shù)。 換時(shí)可以定義批量處理。 換支持多階段抽取,可以定義階段代碼,階段分為:行轉(zhuǎn)換,轉(zhuǎn)換失敗,插入成功,插入失敗,批處理完成,抽取完成。 此種應(yīng)用異常復(fù)雜,應(yīng)屬高級應(yīng)用。簡單的看,當(dāng)轉(zhuǎn)換任務(wù)需要根據(jù)數(shù)據(jù)源來確定動(dòng)作,5 這是非常有用的。比如你的應(yīng)用存在多表存儲(chǔ),就可能根據(jù)表內(nèi)的時(shí)間來確定之后的動(dòng) 作,達(dá)到數(shù)據(jù)分多表存儲(chǔ)的目的。 查找查詢 作為轉(zhuǎn)換數(shù)據(jù)任務(wù)和數(shù)據(jù)驅(qū)動(dòng)的查詢?nèi)蝿?wù)的一種功能。 查找查詢使您得以對源和目的之外的其它連接運(yùn)行查詢和存儲(chǔ)過程。例如,通過使用查找查詢,可以在查詢過程中進(jìn)行單獨(dú)的連接,并在目的表中包括來自連接的數(shù)據(jù)。 作為一種擴(kuò)充功能,實(shí)現(xiàn)更復(fù)雜的查詢操作。 多任務(wù)支持事務(wù)處理 除了順序執(zhí)行,可以進(jìn)行并行執(zhí)行步驟,且支持檢查點(diǎn)回滾。 當(dāng)然,任務(wù)的事務(wù)仍然依賴于數(shù)據(jù)源所在所據(jù)庫是否支持事務(wù)。一般情 況下,順序執(zhí)行已經(jīng)可以滿足抽取需求。 好了,不管對錯(cuò),還是說說我的看法: 首先: 抽取流程定義比較清晰,數(shù)據(jù)轉(zhuǎn)換功能豐富,可視的設(shè)計(jì)工具強(qiáng)大,有一定的可擴(kuò)展性 (制,腳本支持 )。 但是:但學(xué)習(xí)下來,隱隱約約覺得它有 品的通病,就是大而全,如果進(jìn)行小型應(yīng)用的集成,它是很方便和夠用的,但如果要在大型項(xiàng)目中集成 提供的二次開發(fā)方式,就顯得有些散亂,缺少一個(gè)總體的框架指導(dǎo)。當(dāng)然,這可能與它的定位有關(guān)。 具介紹 一、總體概述 括 它是用于從生產(chǎn)庫中提取數(shù)據(jù)到數(shù)據(jù)倉庫中,再由具體的報(bào)表、統(tǒng)計(jì)、分析工具對數(shù)據(jù)倉庫的內(nèi)容進(jìn)行分析,分析出自己所需要的數(shù)據(jù)。 其中 訓(xùn)的內(nèi)容是如何利用 源數(shù)據(jù)庫的內(nèi)容提取存放到目標(biāo)數(shù)據(jù)庫中。主要 要包括四個(gè)部分: 個(gè)部分實(shí)現(xiàn)自己的功能。 二、系統(tǒng)體系結(jié)構(gòu) 此部分介紹了 具包括的主要內(nèi)容。 要有五個(gè)部分。 以和 離,通過 P 連接,連接到遠(yuǎn)程的 2. 主要用于進(jìn)行一個(gè) 的管理,當(dāng)用戶使用 具登錄一個(gè) 務(wù)器之后,進(jìn) 行文件夾權(quán)限的創(chuàng)建,用戶權(quán)限、密碼的管理等。 3. 6 主要是進(jìn)行數(shù)據(jù)抽取的轉(zhuǎn)換工具的設(shè)計(jì),主要是 設(shè)計(jì)、設(shè)計(jì)源數(shù)據(jù)庫的結(jié)構(gòu),目標(biāo)數(shù)據(jù)庫的結(jié)構(gòu),然后設(shè)計(jì)把源數(shù)據(jù)導(dǎo)入到目標(biāo)數(shù)據(jù)庫中,所需要進(jìn)行的轉(zhuǎn)換操作( 。 同一個(gè) 間可以建立 式,多個(gè) 間只能做拷貝。 4. 主要用于流程任務(wù)( 的設(shè)計(jì)。 進(jìn)行任務(wù)流程的設(shè)計(jì)、每一個(gè) 對一個(gè) 一個(gè) 對一個(gè) 其中 的 的 對應(yīng)的關(guān)系。一版來說,用戶都是建立自己的 5. 主要進(jìn)行流程運(yùn)行、及任務(wù)運(yùn)行時(shí)的流程運(yùn)行情況跟蹤??梢愿櫲罩?。包括 志和 志,可以設(shè)置生成日志的循環(huán)個(gè)數(shù)。分析 行是對源數(shù)據(jù)庫的數(shù)據(jù)抽出信息和對目標(biāo)數(shù)據(jù)庫的更新信息。 6. 主要進(jìn)行 管理,包括 作。進(jìn)行 的 操作,進(jìn)行 級別的管理,級別較高。 7. 為客戶端服務(wù)的,客戶端可以和各 種 在一臺(tái)服務(wù)器上。關(guān)于數(shù)據(jù)抽取的設(shè)計(jì)成果轉(zhuǎn)換成為 式的源數(shù)據(jù),都是通過 放到 的。 8. 用于存放的是進(jìn)行 計(jì)的元數(shù)據(jù)。可以支持各類的數(shù)據(jù)庫。方式為數(shù)據(jù)庫中用戶的一個(gè)表目錄和用戶關(guān)系即可。 以和 安裝在一臺(tái)服務(wù)器。如果在一臺(tái)機(jī)器上, 過 式連接到 如果不在一臺(tái)及其上,需要在 安裝一個(gè) 用戶通過 以 式連接到 據(jù)庫,然后 以 式連接到 實(shí)際執(zhí)行數(shù)據(jù)抽取任務(wù)的運(yùn)行環(huán)境。即 。它 是根據(jù)定義的 數(shù)據(jù)庫,然后在自己的實(shí)際環(huán)境中,執(zhí)行數(shù)據(jù)抽取操作。 三、系統(tǒng)組件功能 功能主要體現(xiàn)在 ,其中 現(xiàn)的是對數(shù)據(jù)抽取的數(shù)據(jù)轉(zhuǎn)換方式設(shè)計(jì),以及效率設(shè)計(jì)目標(biāo)等。而在 再把具體的數(shù)據(jù)轉(zhuǎn)換方式應(yīng)用到一個(gè)具體的工作任務(wù)中,包括7 目標(biāo)庫、源庫的選擇,以及一條具體的執(zhí)行任務(wù)的屬性設(shè)置等等。包括任務(wù)的 。 件 ( 1 )工作區(qū) 在 ,涉及到的工作區(qū)主要包括有 其中每個(gè)工作區(qū)的功能分別介紹: 功能是實(shí)現(xiàn)對源數(shù)據(jù)庫表 的設(shè)計(jì),可以手工的進(jìn)行源數(shù)據(jù)庫的設(shè)計(jì),一般都是通過從 者 導(dǎo)入數(shù)據(jù)庫的表結(jié)構(gòu)。 件結(jié)構(gòu)。 用于設(shè)計(jì)目標(biāo)數(shù)據(jù)庫庫的結(jié)構(gòu),可以利用手工設(shè)計(jì),也可以利用 具導(dǎo)入導(dǎo)一個(gè) 結(jié)構(gòu)。 用戶設(shè)計(jì)可重用的 件,這里的組件,在一個(gè) 面都是可以重用的,而且以 方式使用。 件的修改,會(huì)直接反映到使用此 。 設(shè)計(jì)可以重用的多個(gè)組件,只要有 件,可以有 件,也可以沒有 件,實(shí)現(xiàn)的功能就和一個(gè) 功能類似,實(shí)現(xiàn)功能。 實(shí)現(xiàn)的功能是設(shè)計(jì)具體進(jìn)行抽取數(shù)據(jù)的 這些 用到一個(gè) ,形成了 一個(gè) 。 ( 2 ) 組件功能 支持多種語言開發(fā): c、 c+、 持的組件主要包括兩類: 件和 件,其中 件是對輸入記錄集在輸出時(shí)個(gè)數(shù)有變化的組件, 件,輸入的記錄集,輸出時(shí)記錄集的個(gè)數(shù)不發(fā)生改變。 供的組件包括: (1) (2) (3) (4) (5) (6) (7) up to 8 (8) (9) (10) D (11) (12) or of (13) (14) (15) a (16) (17) (18) ML or (19) ML to or 每一類組件都有自己獨(dú)特的功能和特點(diǎn),這里介紹主要的組件包括上述紅色的內(nèi)容。每一種組件的詳細(xì)功能這里不詳細(xì)介紹。 件 對執(zhí)行任務(wù)的執(zhí)行進(jìn)行控制,可以在執(zhí)行時(shí)對執(zhí)行的任務(wù)進(jìn)行傳參數(shù)進(jìn)行傳入,這樣就能在執(zhí)行的時(shí)候把數(shù)據(jù)庫表進(jìn)行動(dòng)態(tài)的設(shè)置。 可以在執(zhí)行的時(shí)候選擇參數(shù)文件,對 的 參數(shù)進(jìn)行傳入。達(dá)到動(dòng)態(tài)執(zhí)行的目的。 定義 任務(wù), 對這些任務(wù)的執(zhí)行進(jìn)行管理控制。 四、補(bǔ)充說明 持同構(gòu)數(shù)據(jù)源的連接,衣鉤數(shù)據(jù)源的連接通過 件實(shí)現(xiàn)。 件,查出的多條記錄集,要么取 或者 或者報(bào)錯(cuò)。 以時(shí)動(dòng)態(tài) / 靜態(tài) ,可以 具介紹 簡稱為 夠?qū)?無格式結(jié)構(gòu)的平面文件 (載到數(shù)據(jù)庫的過程自動(dòng)化。許多 數(shù)據(jù)庫管理 員對 具和 本的混合使用非常熟悉,再加上在各個(gè)不同的地方進(jìn)行一些 置就可以完成數(shù)據(jù)加載的過程。 能夠完成這樣的任務(wù) (而且還有更多的功能 ),通過提供一個(gè)向?qū)?qū)動(dòng)兼?zhèn)浯罅繑帱c(diǎn)和觀查點(diǎn)提示及點(diǎn)擊功能的圖形用戶界面來完成這一過程。通過9 其 “設(shè)計(jì)中心 ”和 “控制中心 ”界面,用戶可以設(shè)計(jì)并部署 程 (本文重點(diǎn)關(guān)注其中的加載過程,也就是將分隔數(shù)值的平面文件內(nèi)容加載到一個(gè)表,而且在加載的過程中數(shù)據(jù)不發(fā)生改變 )。此外, 部署不局限于你當(dāng)前正在工作的服務(wù)器, 后將設(shè)計(jì)的步驟部署到另一臺(tái)服務(wù)器上,如果你想要,還可以部署到更多的服務(wù)器上。 這個(gè)操作背后的整個(gè)程序是怎樣一個(gè)概念呢 ?我們來看看要完成整個(gè)操作需要進(jìn)行的步驟,也許能夠幫你理清大概的框架: 1. 指定源文件,包括文件所在位置及其性質(zhì)。 2. 創(chuàng)建一個(gè)外部表,作為數(shù)據(jù)字典的存 儲(chǔ)器。 3. 確認(rèn)數(shù)據(jù)庫中 “真實(shí) ”表,如有需要?jiǎng)?chuàng)建該表。 4. 在有計(jì)劃的基礎(chǔ)上進(jìn)行整個(gè)過程,或一次性完成整個(gè)處理過程。 這個(gè)過程的處理方法是利用與這些對象相關(guān)的元數(shù)據(jù) (通過設(shè)計(jì)映射和進(jìn)程流 (也稱為過程流 )來綁定他們。事實(shí)上,可以將進(jìn)程流作為一個(gè)可視化假象進(jìn)行創(chuàng)建,也就是說, 際所使用的工作流只是 成的一個(gè)進(jìn)程流模式圖,不過這個(gè)模式圖足以當(dāng)作工作流來使用。 把這個(gè)過程的每一部分都當(dāng)作一個(gè)對象來考慮:文件、文件的位置、外部表、真實(shí)表、將 件映射到外部表的過程、最 后運(yùn)行的作業(yè)等等。所有的這些都是對象,而這些對象都可以通過層級和依賴性將這些對象綁定起來。每個(gè)對象類型都存在一個(gè)模塊當(dāng)中。由于這個(gè)工具是基于 言的,所以面向?qū)ο蟮脑O(shè)計(jì)是可行的。一般來說,每個(gè)對象都是一個(gè)實(shí)例或者是通過某種方法實(shí)例化的對象。 過程 一個(gè)典型的 程模式包括在循環(huán)的基礎(chǔ)上加載一個(gè)平面文件 (你也可以只執(zhí)行其中的映射部分 )。如果你將該過程分解為涉及 項(xiàng)目樹不同部分的若干步驟,那么就10 很容易搞清楚整個(gè)任務(wù)了。一個(gè)項(xiàng)目的開始,首先需要在 創(chuàng)建一個(gè)一個(gè)模塊。提示大家,要記住幾乎每一個(gè)類別都涉及到相同的兩個(gè)步驟:創(chuàng)建模塊和導(dǎo)入元數(shù)據(jù)。而且抽樣并不總是基于同一個(gè)表。 下圖顯示了一個(gè)展開的項(xiàng)目樹: 按照我們想要構(gòu)建 程的步驟,在項(xiàng)目樹里涉及到的項(xiàng)目領(lǐng)域是: 文件 ( 外部表 ( 表 ( 11 映射 (一旦完成映射的步驟,你就需要下拉到進(jìn)程流 (調(diào)度 (在計(jì)劃瀏覽器面板的 “文件 (項(xiàng)目下創(chuàng)建一個(gè)新模塊,指定數(shù)據(jù)源文件的位置,如下圖所示: 完成 “創(chuàng)建模塊 ”步驟并進(jìn)入到 “導(dǎo)入元數(shù)據(jù)向?qū)?”。這里你如果告訴 要加載的內(nèi)容是平面文件時(shí),就會(huì)啟動(dòng) “平面文件抽樣向?qū)?”,完成平面文件結(jié)構(gòu)的定義。記住要給日期字段添加日期格式。當(dāng)指定平面文件并對其抽樣后,就可以準(zhǔn)備創(chuàng)建 關(guān)于外部表的元數(shù)據(jù)了。 “平面文件抽樣向?qū)?”的第一個(gè)步驟如下圖所示: 驟如下圖所示: 12 圖三 當(dāng)要確定字段分隔符時(shí),你除了可以從下拉表中選擇向?qū)峁┑姆指舴?,還可以手動(dòng)輸入其他的分隔符。一旦完成了外部表定義,你就可以馬上部署外部表,并在目標(biāo)架構(gòu)中創(chuàng)建該表。 下一步,我們就要?jiǎng)?chuàng)建表了。如果要從頭開始創(chuàng)建表,就打開 “數(shù)據(jù)對象編輯器 ”進(jìn)行表的設(shè)計(jì)。確保列 定義和外部表相應(yīng)的列定義相匹配。最好首先部署外部表,然后在 通過 外部表 (只是表定義,并非數(shù)據(jù) )創(chuàng)建表。 接下來的步驟就是將外部表的內(nèi)容映射到真實(shí)表。創(chuàng)建一個(gè)新映射,并如下圖所示映射相關(guān)列。 13 圖四 部署該映射,如果部署成功的話,這時(shí)候你就可以手動(dòng)運(yùn)行 (開始 )從外部表將數(shù)據(jù)加載到真實(shí)表。通過進(jìn)入 “控制中心 ”可以核實(shí)并查看該過程 的運(yùn)行,如下圖所示。 圖五 如果想要將這個(gè)進(jìn)程流自動(dòng)化進(jìn)行,就需要?jiǎng)?chuàng)建一個(gè)新的 “進(jìn)程模塊 ”。創(chuàng)建進(jìn)程流模塊、程序包和進(jìn)程流,然后進(jìn)入到 “進(jìn)程編輯器 ”。添加映射操作,執(zhí)行結(jié)果如下圖所示: 14 圖六 一旦完成了進(jìn)程流模式圖,我們就可以創(chuàng)建一個(gè)新的調(diào)度,調(diào)度應(yīng)當(dāng)是通用的,也就是說不能與任何東西綁定。你必須要回到映射步驟,將映射與調(diào)度關(guān)聯(lián)起來。一旦部署了調(diào)度 ,那么就可以將上述的平面文件加載過程自動(dòng)化了。 源 工具 紹 現(xiàn)在是一個(gè) 時(shí)代,而對于開發(fā)者,開源已成為最重要的參考書。對于某課題,不管你是深入研究還是初窺門徑。估且 把,勾一勾同行的成就,你必會(huì)獲益良多。 說到 源項(xiàng)目, 屬翹首,項(xiàng)目名稱很有意思,水壺。按項(xiàng)目負(fù)責(zé)人 各種數(shù)據(jù)放到一個(gè)壺里,然后呢,以一種你希望的格式流出。呵呵,外國人都很有聯(lián)想力。 看了提供的文檔,然后對發(fā)布程序的簡單試用后,可以很清楚得看到 四大塊: 工作 (計(jì)工具 (式 ) 工作 (行器 (命令行方式 ) 轉(zhuǎn)換 (計(jì)工具 (式 ) 轉(zhuǎn)換 (行器 (命令行方式 ) 文章出處: , 屬翹首,因此,偶決定花點(diǎn)時(shí)間 了解一下。 項(xiàng)目名稱很有意思,水壺。按項(xiàng)目負(fù)責(zé)人 說法:把各種數(shù)據(jù)放到一個(gè)壺里,然后呢,以一種你希望的格式流出。呵呵,外國人都很有聯(lián)想力。 看了提供的文檔,然后對發(fā)布程序的簡單試用后,可以很清楚得看到 四大塊: 工作 (計(jì)工具 (式 ) 工作 (行器 (命令行方式 ) 轉(zhuǎn)換 (計(jì)工具 (式 ) 轉(zhuǎn)換 (行器 (命令行方式 ) 嗯,廚師已經(jīng)在廚房里,勺子和盤子一應(yīng)俱全,且看能做出如何的大餐? 一: 工作 (計(jì)器 這是一個(gè) 具,操作方式主要通過拖拖拉拉,勿庸多言,一看就會(huì)。 何謂工作? 多個(gè)作業(yè)項(xiàng),按特定的工作流串聯(lián)起來,開成一項(xiàng)工作。正如:我的工作是軟件開發(fā)。我的作業(yè)項(xiàng)是:設(shè)計(jì)、編碼、測試!先設(shè)計(jì),如果成功,則編碼,否則繼續(xù)設(shè)計(jì),編碼完成則開始設(shè)計(jì),周而復(fù)始,作業(yè)完成。 來,看看 的作業(yè)項(xiàng): 轉(zhuǎn)換:指定更細(xì)的轉(zhuǎn)換任務(wù),通過 成 。通過 輸入?yún)?shù)。 句執(zhí)行, 載 件。 郵件:發(fā)送郵件。 檢查表是否存在, 檢查文件是否存在, 執(zhí)行 本。如: 令。 批處理。 (注意: 處理不能有輸出到控制臺(tái) )。 。作為嵌套作業(yè)使用。 行。這個(gè)比較有意思,我看了一下源碼,如果你有自已的 以很方便的替換成自定義 擴(kuò)充其功能。 全的 議傳輸。 式的上 /下傳。 好了,看看工作流: 如上文所述,工作流是作業(yè)項(xiàng)的連接方式。分為三種:無條件,成功,失敗。這個(gè)沒啥好說的,從名字就能知道它的意圖。 嗯,為了方便工作流使用,提供了幾個(gè)輔助結(jié)點(diǎn)單元 (你也可將其作為簡單的作業(yè)項(xiàng) ): 1: 元,任務(wù)必須由此開始。設(shè)計(jì)作業(yè)時(shí),以此為起點(diǎn)。 2: 元:可以編制做為中 間任務(wù)單元,且進(jìn)行腳本編制,用來控制流程。 3: 元:用途同上。 4: 元:啥都不做,主要是用來支持多分支的情況。文檔中有例子,不再多
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 佛山市小升初數(shù)學(xué)試卷
- 董村小學(xué)二年級數(shù)學(xué)試卷
- 2025至2030城市建設(shè)規(guī)劃行業(yè)市場發(fā)展前景及供給需求與投資機(jī)會(huì)報(bào)告
- 2025至2030軌道交通安防行業(yè)市場深度研究及發(fā)展前景投資可行性分析報(bào)告
- 六安市霍邱縣新店鎮(zhèn)選聘村干部考試真題2024
- 2024年杭州拱墅區(qū)專職社區(qū)工作者招聘筆試真題
- 2025至2030財(cái)務(wù)軟件產(chǎn)業(yè)深度調(diào)研及發(fā)展趨勢與投資戰(zhàn)略報(bào)告
- 東山小學(xué)期中數(shù)學(xué)試卷
- 工貿(mào)單招數(shù)學(xué)試卷
- 福州初三卷子數(shù)學(xué)試卷
- 各類給水管材水力計(jì)算表
- 濟(jì)南遙墻機(jī)場擴(kuò)建工程航站樓建設(shè)監(jiān)理大綱
- 七年級上冊數(shù)學(xué)知識(shí)點(diǎn)總結(jié)及精編例題1
- 往生薦亡功德文疏
- 員工上下班路線規(guī)劃圖
- 心內(nèi)科高危藥物安全管理與指引
- XFD-系列單槽說明書-印稿
- UCLA肩關(guān)節(jié)評分系統(tǒng)
- 分支型室速的導(dǎo)管消融術(shù)ppt課件
- (完整word版)《關(guān)于同意申辦出入境證件的函》
- 廣東外運(yùn)大宗散貨船舶代理業(yè)務(wù)發(fā)展研究
評論
0/150
提交評論