房地產(chǎn)信息產(chǎn)品開發(fā)-論文模板_第1頁
房地產(chǎn)信息產(chǎn)品開發(fā)-論文模板_第2頁
房地產(chǎn)信息產(chǎn)品開發(fā)-論文模板_第3頁
房地產(chǎn)信息產(chǎn)品開發(fā)-論文模板_第4頁
房地產(chǎn)信息產(chǎn)品開發(fā)-論文模板_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

煙臺南山學(xué)院畢業(yè)論文中小企業(yè)信息化建設(shè)的風(fēng)險管理和對策研究姓名:___********_______所在學(xué)院:____管理科學(xué)與工程學(xué)院____所學(xué)專業(yè):__信息管理與信息系統(tǒng)班級__信息系統(tǒng)08級2班_學(xué)號__**********___指導(dǎo)教師:_____宋******_______完成時間:____2012.3_____摘要中小企業(yè)信息化是我國國民經(jīng)濟(jì)信息化的重要組成部分,也是中小企業(yè)在世界經(jīng)濟(jì)全球化,信息化大潮中求的生存和發(fā)展的必然選擇。隨著中小企業(yè)經(jīng)濟(jì)規(guī)模的日益增大,經(jīng)濟(jì)地位的日益提高,信息化建設(shè)的投入不斷加大,中小企業(yè)的信息化建設(shè)和推進(jìn)中深層次機(jī)制上的矛盾和問題,受到了越來越廣泛的關(guān)注。本文作者從中小企業(yè)信息化建設(shè)入手,以中小企業(yè)在信息化建設(shè)中的風(fēng)險管理的現(xiàn)存問題為出發(fā)點,深入分析了其領(lǐng)域風(fēng)險管理的理論體系和技術(shù)方法,特別是項目風(fēng)險管理和軟件項目風(fēng)險管理領(lǐng)域,并與企業(yè)信息化項目風(fēng)險管理進(jìn)行了比較分析和借鑒研究,嘗試構(gòu)建了一個針對企業(yè)信息化項目的風(fēng)險管理模型應(yīng)用于自己的實際工作當(dāng)中,通過公司信息化戰(zhàn)略的制定和地產(chǎn)信息管理系統(tǒng)項目的實施,深入地分析風(fēng)險管理對于企業(yè)信息化建設(shè)順利實施的重要性,作者也通過自己實際工作中的項目實例來對本文所闡述的理論進(jìn)行實證研究并進(jìn)一步對該模式進(jìn)行檢驗和改進(jìn),最終得出本文所建立的針對中小企業(yè)信息化建設(shè)的風(fēng)險管理模型是與企業(yè)的實際應(yīng)用相匹配的,對中小企業(yè)的信息化建設(shè)有很好的指導(dǎo)作用。最后本文作者總結(jié)了進(jìn)行企業(yè)信息化建設(shè)風(fēng)險管理研究的重要意義,并提出了將來進(jìn)一步的研究方向。關(guān)鍵詞:中小企業(yè);信息化;風(fēng)險管理;信息化戰(zhàn)略

RISKMANAGEMENTOFSMALLANDMEDIUM-SIZEDENTERPRISEAbstractTheinformationofsmallandmedium-sizedKeywords:Informationtechnologyindustry;ThefourthrealestateNavigation;目錄TOC\o"1-2"\u第一章需求分析 第一章需求分析1.1論文選題背景及研究意義隨著土地等稀缺資源價格的不斷上漲,中國的房地產(chǎn)已經(jīng)成為國民經(jīng)濟(jì)新的經(jīng)濟(jì)增長點和消費點,越來越受到國民的關(guān)注。但縱觀整個房地產(chǎn)業(yè),目前仍舊是一個傳統(tǒng)產(chǎn)業(yè)領(lǐng)域,其產(chǎn)業(yè)的基本特征表現(xiàn)為粗放式的增長和資金密集型的特點。伴隨著人類走人了二十一,信息化出現(xiàn)的頻率越來越高,涉及的領(lǐng)域越來越廣。20世紀(jì)80年代網(wǎng)絡(luò)技術(shù)的發(fā)展和90年代互聯(lián)網(wǎng)的廣泛應(yīng)用使信息的處理和傳遞突破了時間和地域的局限,信息化已經(jīng)成為一種新的經(jīng)濟(jì)力量。中共中央在國民經(jīng)濟(jì)和社會發(fā)展第十個五年計劃中做出了明確的戰(zhàn)略部署:“信息化是當(dāng)今世紀(jì)經(jīng)濟(jì)和社會發(fā)展的大趨勢,也是我國產(chǎn)業(yè)升級和實現(xiàn)工業(yè)化、現(xiàn)代化的關(guān)鍵環(huán)節(jié),要把推進(jìn)國民經(jīng)濟(jì)和社會信息化放在優(yōu)先的位置。”在中國工業(yè)化和城市化的進(jìn)程中,位列第三產(chǎn)業(yè)之中的房地產(chǎn)業(yè)的作用和地位日益顯現(xiàn),因此在房地產(chǎn)領(lǐng)域?qū)嵤┬畔⒒哂兄匾默F(xiàn)實意義。與此同時,建設(shè)部也相應(yīng)的提出和制定了建設(shè)事業(yè)信息化的“十五計劃”,旨在大力推進(jìn)建設(shè)領(lǐng)域和房地產(chǎn)方面的信息技術(shù)的研究開發(fā)和推廣應(yīng)用,用信息化來改造和提升傳統(tǒng)的建設(shè)行業(yè)和房地產(chǎn)行業(yè)。房地產(chǎn)信息化,是指在房地產(chǎn)業(yè)生產(chǎn)經(jīng)營活動的各個環(huán)節(jié),全面開發(fā)和應(yīng)用現(xiàn)代信息技術(shù),廣泛深入的開展信息資源生產(chǎn)、收集、交流,利用以及增值服務(wù),最大限度的發(fā)揮信息的社會效益和經(jīng)濟(jì)效益的過程。房地產(chǎn)業(yè)信息化,通過建立完備的信息基礎(chǔ)設(shè)施,在房地產(chǎn)的生產(chǎn),經(jīng)營,管理與服務(wù)等方面,廣泛應(yīng)用信息技術(shù),有效開發(fā)利用信息資源,可優(yōu)化產(chǎn)業(yè)結(jié)構(gòu),促進(jìn)行業(yè)科技進(jìn)步,提高房地產(chǎn)業(yè)的服務(wù)管理水平,促進(jìn)國民經(jīng)濟(jì)的快速健康發(fā)展。房地產(chǎn)信息化建設(shè)是一項復(fù)雜的系統(tǒng)工程,他涉及到房地產(chǎn)經(jīng)營管理和市場營銷等各個層面,具有極大的艱巨性,復(fù)雜性和長期性。一般來說,房地產(chǎn)業(yè)信息化建設(shè),具體包括房地產(chǎn)企業(yè)信息化,房地產(chǎn)營銷信息化,房地產(chǎn)產(chǎn)品信息化,以及與之相關(guān)的房地產(chǎn)政務(wù)信息化等(本課題是以研究房地產(chǎn)產(chǎn)品信息化為主的)幾個子系統(tǒng)的信息化建設(shè)。房地產(chǎn)業(yè)信息化是信息化和我國房地產(chǎn)業(yè)發(fā)展過程中的重要課題,其核心問題是這個行業(yè)如何利用現(xiàn)代信息技術(shù),優(yōu)化資源配置和提高企業(yè)能力。因此,深入研究房地產(chǎn)業(yè)的信息化,從而制定出相應(yīng)的房地產(chǎn)業(yè)信息化標(biāo)準(zhǔn),提出合理的房地產(chǎn)行政管理和企業(yè)信息化的解決方案,對于提高行政部門的管理、決策能力和工作效率,提升整個房地產(chǎn)企業(yè)的核心競爭力以及把握市場、獲得更多的商機(jī)等方面都有著積極的現(xiàn)實意義。1.2國內(nèi)外房地產(chǎn)的發(fā)展形勢近幾年,隨著中國房地產(chǎn)業(yè)以及信息化在各領(lǐng)域的快速發(fā)展,信息化在我國房地產(chǎn)業(yè)已經(jīng)開始嶄露頭角。在國際大環(huán)境和我國科教興國戰(zhàn)略的推動下,目前房地產(chǎn)業(yè)全面信息化的發(fā)展勢頭已經(jīng)呈現(xiàn)。房地產(chǎn)企業(yè)信息化應(yīng)用方面取得了長足的發(fā)展,比如一些較大的房地產(chǎn)相關(guān)企業(yè)都已經(jīng)建立了自己的電子商務(wù)平臺,針對房地產(chǎn)企業(yè)的計算機(jī)軟件:如房地產(chǎn)可行性分析軟件、開發(fā)管理軟件、房屋銷售軟件、物業(yè)管理軟件等得到了廣泛的開發(fā)和應(yīng)用;在房地產(chǎn)行政管理信息化同樣取得了顯著的成效,初步建立了房地產(chǎn)宏觀監(jiān)測系統(tǒng),為整個行業(yè)的信息化打下了堅實的基礎(chǔ)。當(dāng)然,我在這個課題中要闡述的是針對房地產(chǎn)開發(fā)商、用戶和房地產(chǎn)中介等房地產(chǎn)核心用戶群所研究開發(fā)的,通過深入研究房地產(chǎn)產(chǎn)品而衍生出來的——房產(chǎn)導(dǎo)航。縱觀國內(nèi)外的房地產(chǎn)業(yè)信息化相關(guān)課題方面,作者發(fā)現(xiàn)類似文獻(xiàn)對一般企業(yè)信息化或者是電子商務(wù)方面的論述比較多,但是對于房地產(chǎn)產(chǎn)品的論述就極為稀少,網(wǎng)絡(luò)上這方面的資源也比較少,并且由于房地產(chǎn)本事就具有較強(qiáng)的地域性、產(chǎn)品異質(zhì)性,土地成本穩(wěn)定性等特定的行業(yè)特征,再加上房地產(chǎn)業(yè)在我國發(fā)展的時間并不是特別長,記憶我國國情的特殊性,這些都決定論一般的信息系統(tǒng)或者是信息平臺的技術(shù)或產(chǎn)品對我國房地產(chǎn)相關(guān)領(lǐng)域并不適用,而專門論述房地產(chǎn)業(yè)信息化的著作或研究成果也乏善可陳。比如建設(shè)部組織相應(yīng)變?yōu)闀M(jìn)行研究論證,出版了相應(yīng)的文獻(xiàn)——《房地產(chǎn)企業(yè)信息化和數(shù)字社區(qū)》。該文獻(xiàn)從不同角度介紹了房地產(chǎn)領(lǐng)域信息化的現(xiàn)狀和發(fā)展、技術(shù)、行政與市場管理經(jīng)驗、數(shù)字社區(qū)的應(yīng)用和發(fā)展趨勢。但我認(rèn)為該文獻(xiàn)偏重于理論指導(dǎo),在具體實踐上面并沒有深入的論述,對一般企業(yè)不是很實用;而《網(wǎng)絡(luò)時代的房地產(chǎn)》是我國比較早提出在房地產(chǎn)領(lǐng)域?qū)嵤┬畔⒒闹?,對于以后房地產(chǎn)業(yè)的信息化建設(shè)起到了較好的引導(dǎo)作用。該著作對于房地產(chǎn)領(lǐng)域?qū)嵤┬畔⒒笤谄髽I(yè)管理、房地產(chǎn)消費、開發(fā)商的發(fā)展戰(zhàn)略等方面可能出現(xiàn)的管理模式的碧昂給出了充分論證。但由于其完成實踐較早,而在信息化的實施過程中的管理信息系統(tǒng)的建設(shè)、實現(xiàn)技術(shù)、信息化的標(biāo)準(zhǔn)等都未給出充分的研究。同樣《房地產(chǎn)業(yè)信息化》做了比較新和深入的研究,但其涉及的范圍相對窄,局限于房地產(chǎn)業(yè)信息化的實現(xiàn)技術(shù),銷售、物業(yè)管理、OA等管理信息系統(tǒng)的論述,而對整個房地產(chǎn)業(yè)信息化所帶來的商業(yè)價值以及信息化價值的評價指標(biāo)等方面缺乏論證。因此,結(jié)合目前的信息化形勢和文獻(xiàn),本文將針對房地產(chǎn)業(yè)的特點,綜合考慮各個方面,對房地產(chǎn)產(chǎn)品——房產(chǎn)導(dǎo)航做進(jìn)一步比較完善的論述。1.3房地產(chǎn)信息化的重要意義(1)利用信息技術(shù),有助于建立良好的企業(yè)形象網(wǎng)絡(luò)可以極大地擴(kuò)展開發(fā)商的生產(chǎn)空間,提高他的知名度和沒遇度,減少他們在異地開發(fā)時必須付出的品牌擴(kuò)展成本。借助網(wǎng)絡(luò)這一第四媒體,房地產(chǎn)開發(fā)商可更好的宣傳樓盤及其品牌形象,并向購房者提供網(wǎng)上樓盤查詢、網(wǎng)上看樓等全天候、雙向互動的、不受地域限制的售前服務(wù),可以增強(qiáng)消費者的品牌忠誠度。交互式經(jīng)營溝通模式,向消費者提供了選擇自由溝通的主動權(quán),使溝通過程更有效率,溝通結(jié)果更令人滿意,特別是其距離時空的實時性使消費者更能密切的參與到從市場調(diào)研、產(chǎn)品開發(fā)、生產(chǎn)到最終服務(wù)的全過程中,使消費者和企業(yè)的利益都得到最大化。(2)利用信息技術(shù),有助于進(jìn)行科學(xué)決策應(yīng)用網(wǎng)絡(luò)計算機(jī)技術(shù),開發(fā)企業(yè)可及時輕松地了解國家有關(guān)經(jīng)濟(jì)政策,為開發(fā)商準(zhǔn)確的預(yù)測未來房地產(chǎn)市場的需求,確定投資開發(fā)的方向提供重要依據(jù)。同時,開發(fā)企業(yè)通過信息技術(shù),直接與房地產(chǎn)代理商、物業(yè)管理公司、求購求職客戶聯(lián)系,有利于全面了解房地產(chǎn)市場需求動態(tài),并通過綜合分析比較各類信息流,得出有用部分,制定比較完善的行銷方案,從而更好的推銷自己開發(fā)的商品房,真正做到“運籌帷幄,決勝千里”。(3)利用信息技術(shù),有助于提高企業(yè)的競爭力房地產(chǎn)企業(yè)項目開發(fā)過程中各個環(huán)節(jié)涉及企業(yè)的各個部門,內(nèi)部通過局域網(wǎng)實現(xiàn)信息資源的共享,企業(yè)內(nèi)部的事務(wù)完全進(jìn)行系統(tǒng)規(guī)范的操作,真正達(dá)到規(guī)范化地運作。利用信息技術(shù)快捷及遠(yuǎn)距離傳輸特點,促成信息的快速、全面、通暢的流動,有益監(jiān)控各個項目的運作狀況,促使企業(yè)各業(yè)務(wù)部門及決策層能夠盡可能多接觸業(yè)務(wù)信息,避免過去傳統(tǒng)條件下憑借管理者個人經(jīng)驗接受業(yè)務(wù)信息的弊端,從而提高企業(yè)內(nèi)部管理效率,同時通過網(wǎng)絡(luò)使企業(yè)的業(yè)務(wù)形成系統(tǒng)流程,可以提高業(yè)務(wù)的透明度和工作效率,優(yōu)化企業(yè)資源配置,從而提高企業(yè)的競爭力。(4)信息技術(shù),有助于企業(yè)間的公平競爭有用網(wǎng)上信息的高度透明將使材料市場趨向完全競爭市場,將大大降低開發(fā)商的建造成本,與此同時,網(wǎng)絡(luò)拋棄了狂轟亂炸式的傳統(tǒng)營銷形式,企業(yè)運作成本降低了。另外,開發(fā)商在交易成本方面的付出大幅降低。開發(fā)商借助信息技術(shù)可以對項目進(jìn)行異地遙控,從各種設(shè)計方案、策劃方案的制定,材料的訂購到合同的簽訂,這些都將使成本趨同化。在專業(yè)網(wǎng)站中,同一區(qū)域或不同區(qū)域開發(fā)商的產(chǎn)品都呈現(xiàn)與購買者眼前,使得開發(fā)商之間的產(chǎn)品差異更為直觀、全面和快捷可查,這為不同能力的開發(fā)商提供了一個公平競爭的平臺。1.4國內(nèi)外房地產(chǎn)業(yè)信息化的現(xiàn)狀分析金融21世紀(jì),隨著互聯(lián)網(wǎng)的應(yīng)用和普及,并由此帶來的信息大爆炸,全球經(jīng)濟(jì)增長的動力正在進(jìn)行改變,以互聯(lián)網(wǎng)為代表的全球信息化浪潮正在以迅猛的態(tài)勢沖擊著各行各業(yè)。2000年7月在聯(lián)合國總部召開的“全球信息化部長會議”上,強(qiáng)調(diào)了信息通信技術(shù)是21世紀(jì)經(jīng)濟(jì)發(fā)展最強(qiáng)勁的動力之一。房地產(chǎn)業(yè)信息化的發(fā)展將會成為行業(yè)發(fā)展的重要方向。房地產(chǎn)業(yè)只有在這一潮流中發(fā)展,才能提高整個房地產(chǎn)業(yè)在國民經(jīng)濟(jì)中的作用,提高行業(yè)的市場競爭力,促進(jìn)產(chǎn)業(yè)在新一輪的經(jīng)濟(jì)變革中健康發(fā)展。(1)國外房地產(chǎn)業(yè)信息化現(xiàn)狀分析在世界范圍內(nèi),房地產(chǎn)業(yè)正在由于技術(shù)的進(jìn)步而發(fā)生著改變,這種改變已經(jīng)開始并以極快的速度進(jìn)行。信息技術(shù)對房地產(chǎn)業(yè)的影響主要發(fā)生在兩個方面:一是信息技術(shù)使房屋的功能得到改善,各種各樣的智能型房屋開始出現(xiàn),二是信息技術(shù)正在改變傳統(tǒng)的房地產(chǎn)經(jīng)營方式。信息技術(shù)對房屋功能的改善。應(yīng)用數(shù)碼科技開發(fā)的數(shù)碼住宅和寬頻社區(qū),成為房地產(chǎn)產(chǎn)業(yè)中的新賣點。許多國際著名的開發(fā)商已經(jīng)開始紛紛推出“互聯(lián)網(wǎng)家庭”、“電子化住宅”,向人們展示了21世紀(jì)房地產(chǎn)業(yè)的發(fā)展趨勢。信息技術(shù)改變了傳統(tǒng)的房地產(chǎn)經(jīng)營管理方式。在美國,信息技術(shù)正在改變以經(jīng)紀(jì)人為主要載體的傳統(tǒng)房地產(chǎn)經(jīng)營方式。美國房地產(chǎn)經(jīng)紀(jì)人協(xié)會共有70萬名成員,上網(wǎng)的成員比例已由1997年的27%上升為目前的78%,90%以上的經(jīng)紀(jì)人擁有個人電腦,60%以上的經(jīng)紀(jì)人使用電子郵件與客戶聯(lián)系,78%的房地產(chǎn)公司通過互聯(lián)網(wǎng)的方式進(jìn)行房屋銷售。(2)國內(nèi)房地產(chǎn)業(yè)信息化現(xiàn)狀分析伴隨著房地產(chǎn)業(yè)的快速發(fā)展,信息技術(shù)在中國房地產(chǎn)業(yè)中的應(yīng)用已拉開序幕。在政府的牽頭和推動下,房地產(chǎn)業(yè)各界積極參與,目前已呈現(xiàn)全面信息化的發(fā)展勢頭。產(chǎn)企業(yè)信息化取得長足進(jìn)展。各種針對房地產(chǎn)企業(yè)的計算機(jī)軟件,如售樓管理系統(tǒng)、成本管理軟件、物業(yè)管理軟件、租賃軟件、房地產(chǎn)可行性分析軟件、房地產(chǎn)開發(fā)管理軟件等,也得到了廣泛的開發(fā)和應(yīng)用。產(chǎn)行政管理信息化成效顯著。近年來,許多城市利用信息技術(shù),開發(fā)了房地產(chǎn)行政管理的計算機(jī)軟件,有效地改進(jìn)了行政管理,提高了工作效率,完善了政府對房地產(chǎn)市場的監(jiān)控和預(yù)測能力。上海市房地產(chǎn)登記交易中心利用區(qū)縣聯(lián)網(wǎng)的管理信息系統(tǒng)自動生成的大量信息,定期發(fā)布分區(qū)、分類別的土地供應(yīng)、項目開工竣工、預(yù)售和存量交易等市場主要數(shù)據(jù)。成都市開發(fā)了商品房預(yù)售網(wǎng)上管理系統(tǒng),實現(xiàn)了對商品房市場的有效監(jiān)控。一些房地產(chǎn)協(xié)會和學(xué)會也加強(qiáng)了信息技術(shù)的應(yīng)用。建立了房地產(chǎn)宏觀監(jiān)測系統(tǒng)。為適應(yīng)我國房地產(chǎn)業(yè)發(fā)展的內(nèi)在要求,針對市場信息零散、盲目投資行為大量存在等狀況,我國已建立了包括中房預(yù)警系統(tǒng)、中房指數(shù)、國房景氣指數(shù)等在內(nèi)的房地產(chǎn)宏觀監(jiān)測系統(tǒng)。小區(qū)和網(wǎng)絡(luò)小區(qū)建設(shè)步伐加強(qiáng)。房產(chǎn)網(wǎng)站發(fā)展。由于房地產(chǎn)業(yè)自身的行業(yè)特點,使其在網(wǎng)上具有更大的優(yōu)勢。正是基于這些優(yōu)勢,房地產(chǎn)業(yè)各界都以最快的速度建立或準(zhǔn)備建立自己的網(wǎng)站。1.5信息產(chǎn)品——房產(chǎn)導(dǎo)航產(chǎn)生的必要性伴隨著經(jīng)濟(jì)的快速發(fā)展,作為對國民經(jīng)濟(jì)有著巨大作用的房地產(chǎn)業(yè)也十分的火熱,日益嚴(yán)重的房價問題使人們的購房意念趨于不穩(wěn)定,首先是房價的上漲這是影響人們購房意念的首要因素。下面我們就來看一下影響房價上漲的因素和相應(yīng)的調(diào)控措施。首先,看信貸過度擴(kuò)張對房價的影響。信貸過度增加通過供給與需求兩個方面影響房價。從供給的因素看,寬松的信貸政策助長了開發(fā)商捂盤惜售的行為。從需求的角度看,寬松的貨幣政策增加了住房的需求,尤其是按揭貸款的優(yōu)惠利率下調(diào)到歷史最低水平時,買房者的還款負(fù)擔(dān)大大降低。另外,需要強(qiáng)調(diào)的是,寬松的貨幣政策已經(jīng)喚起市場對于貨幣貶值的預(yù)期,買房成為富裕階層保持財富的一種選擇。其次就是國家取的相應(yīng)的調(diào)整房價的相關(guān)措施,特別是最近的十一屆全國人大四次會議上溫家寶總理關(guān)于穩(wěn)定物價方面做得承諾:房價調(diào)整不力將追責(zé)!對于今年的房價走勢判斷,不少代表委員都出言謹(jǐn)慎。他們指出,調(diào)控房價的困難之源,主要在于有效供給不足、投資需求過旺以及調(diào)控的長效機(jī)制不完善,“這些都是多年積累的問題,需要時間來解決?!闭ぷ鲌蟾嫣岢?,堅定不移地搞好房地產(chǎn)市場調(diào)控。加快健全房地產(chǎn)市場調(diào)控的長效機(jī)制,切實穩(wěn)定房地產(chǎn)市場價格。進(jìn)一步擴(kuò)大保障性住房建設(shè)規(guī)模,今年要再開工建設(shè)保障性住房、棚戶區(qū)改造住房共1000萬套,重點增加中小套型普通商品住房建設(shè),調(diào)整完善房地產(chǎn)相關(guān)稅收政策,加強(qiáng)稅收征管,有效遏制投機(jī)投資性購房。面對這一漲一落的房價,現(xiàn)在人們的心理很沒有把握,特別是那些觀望買房的人,這時候房產(chǎn)信息產(chǎn)品——房產(chǎn)導(dǎo)航就起到了尤為重要的作用,他通過收集多方面的房屋出租出售的信息,從時間、地域、房屋類型等方面對房地產(chǎn)價格作出相應(yīng)綜合分析,給購房者、房地產(chǎn)商、和房屋中介帶來了很大的便利,也使人們的購房意念更穩(wěn)定,有助于提高人們購房的實惠性、房地產(chǎn)商開發(fā)的明智性和房屋中介的明確性。

第二章理論知識2.1數(shù)據(jù)科學(xué)實驗、檢驗、統(tǒng)計等所獲得的和用于科學(xué)研究、技術(shù)設(shè)計、查證、決策等的數(shù)值。數(shù)據(jù)是關(guān)于自然、社會現(xiàn)象和科學(xué)試驗的定量或定性的記錄,是科學(xué)研究最重要的基礎(chǔ);研究數(shù)據(jù)就是對數(shù)據(jù)進(jìn)行采集、分類、錄入、儲存、統(tǒng)計分析,統(tǒng)計檢驗等一系列活動的統(tǒng)稱數(shù)據(jù)具有數(shù)值屬性、物理屬性。在數(shù)據(jù)處理上數(shù)據(jù)又具有集合性、隸屬性、穩(wěn)定性、方便性、重復(fù)性、共同性、指向性以及運算規(guī)則及運算約束。由于物理屬性轉(zhuǎn)移到“人”概念下的“個”,所以必須先進(jìn)行加法運算,其結(jié)果是分析命題的依據(jù)。數(shù)據(jù)是復(fù)雜的,它可以是任何介質(zhì)上所記錄的信息,比如我們可以對文字信息進(jìn)行拷貝、連接、檢索、刪除,都是數(shù)據(jù)概念下的操作。進(jìn)行各種統(tǒng)計、計算、科學(xué)研究或技術(shù)設(shè)計等所依據(jù)的數(shù)值。數(shù)據(jù)(data)是載荷或記錄信息的按一定規(guī)則排列組合的物理符號??梢允菙?shù)字、文字、圖像,也可以是計算機(jī)代碼。對信息的接收始于對數(shù)據(jù)的接收,對信息的獲取只能通過對數(shù)據(jù)背景的解讀。數(shù)據(jù)背景是接收者針對特定數(shù)據(jù)的信息準(zhǔn)備,即當(dāng)接收者了解物理符號序列的規(guī)律,并知道每個符號和符號組合的指向性目標(biāo)或含義時,便可以獲得一組數(shù)據(jù)所載荷的信息。亦即數(shù)據(jù)轉(zhuǎn)化為信息,可以用公式“數(shù)據(jù)+背景=信息”表示。數(shù)據(jù):在計算機(jī)系統(tǒng)中,各種字母、數(shù)字符號的組合、語音、圖形、圖像等統(tǒng)稱為數(shù)據(jù),數(shù)據(jù)經(jīng)過加工后就成為信息。在計算機(jī)科學(xué)中,數(shù)據(jù)是指所有能輸入到計算機(jī)并被計算機(jī)程序處理的符號的介質(zhì)的總稱,是用于輸入電子計算機(jī)進(jìn)行處理,具有一定意義的數(shù)字、字母、符號和模擬量等的通稱。是組成地理信息系統(tǒng)的最基本要素,種類很多:按性質(zhì)分為定位的,如各種坐標(biāo)數(shù)據(jù);定性的,如表示事物屬性的數(shù)據(jù)(居民地、河流、道路等);定量的,反映事物數(shù)量特征的數(shù)據(jù),如長度、面積、體積等幾何量或重量、速度等物理量;定時的,反映事物時間特性的數(shù)據(jù),如年、月、日、時、分、秒等。按表現(xiàn)形式分?jǐn)?shù)字?jǐn)?shù)據(jù),如各種統(tǒng)計或量測數(shù)據(jù);模擬數(shù)據(jù),由連續(xù)函數(shù)組成,又分為圖形數(shù)據(jù)(如點、線、面)、符號數(shù)據(jù)、文字?jǐn)?shù)據(jù)和圖像數(shù)據(jù)等。按記錄方式分地圖、表格、影像、磁帶、紙帶。按數(shù)字化方式分為矢量數(shù)據(jù)、格網(wǎng)數(shù)據(jù)等。在地理信息系統(tǒng)中,數(shù)據(jù)的選擇、類型、數(shù)量、采集方法、詳細(xì)程度、可信度等,取決于系統(tǒng)應(yīng)用目標(biāo)、功能、結(jié)構(gòu)和數(shù)據(jù)處理、管理與分析的要求。2.2信息信息是目前出現(xiàn)頻率最高的詞匯之一,在許多有關(guān)信息管理、信息系統(tǒng)和信息資源管理的書籍里都對“信息”一詞進(jìn)行了討論,都根據(jù)自己的理解給出了一些定義,但到目前為止沒有一個是絕對的、唯一的或權(quán)威的定義。一般而言,可以將信息定義為:信息是物質(zhì)系統(tǒng)運動的本質(zhì)特征,是物質(zhì)系統(tǒng)運動的方式,運動的狀態(tài)及運動的有序性。其基本含義是:信息是客觀存在的事實,是物質(zhì)運動軌跡的真實反映。通俗的講,信息一般泛指包含于消息、情報、指令、數(shù)據(jù)、圖像、信號等形式之中的新的知識和內(nèi)容。對于信息由如此多的定義和解釋,實際上是反映了人們在研究中試圖說明信息的本質(zhì)或特征,反映了人們從不同的角度對信息這一概念的理解和認(rèn)識,那么信息的本質(zhì)是什么,他有哪些特征呢?具體而言,信息具有如下的基本性質(zhì):(1)存在的普遍性和客觀性。(2)產(chǎn)生的無限性和獲取的相對性。(3)時間和空間上的傳遞性。(4)對利用者的共享性。(5)產(chǎn)生和利用的時效性。(6)對物質(zhì)載體的依附性和獨立性。(7)可加工和開發(fā)性。(8)整體性和層次性。信息的分類方式雖然很多,但有的分類方式?jīng)]有多少實際意義。下面就集中典型的分類進(jìn)一步討論。(1)按照信息的發(fā)生領(lǐng)域或描述的對象,可將信息劃分為自然信息和社會信息。自然信息又包括物理信息、生物信息和社會信息。社會信息是指社會上人與人之間交流的信息,社會信息又可分為經(jīng)濟(jì)信息、科技信息、政務(wù)信息、文化信息、軍事信息等。(2)按照信息的表現(xiàn)形式,可將信息劃分為消息、資料和知識。(3)按照主體的認(rèn)識層次,,可將信息劃分為與發(fā)信息、語義信息和語用信息??傊?,不管如何對信息進(jìn)行分類,目的只是為了便于對信息的管理和信息系統(tǒng)的建設(shè),各種類型的信息是相互交融、相互關(guān)聯(lián)的。在實際中,應(yīng)把握住信息的特征,尤其是信息的整體性特征,用系統(tǒng)思想指導(dǎo)我們的信息管理與系統(tǒng)的學(xué)習(xí)和研究。信息與數(shù)據(jù)的關(guān)系:信息是學(xué)術(shù)上的總稱謂。數(shù)據(jù)是信息的具體描述,即信息的載體。2.3數(shù)據(jù)處理利用相應(yīng)的技術(shù)和設(shè)備進(jìn)行各種數(shù)據(jù)加工的過程。數(shù)據(jù)處理是對數(shù)據(jù)的采集、存儲、檢索、加工、變換和傳輸。數(shù)據(jù)是對事實、概念或指令的一種表達(dá)形式,可由人工或自動化裝置進(jìn)行處理。數(shù)據(jù)的形式可以是數(shù)字、文字、圖形或聲音等。數(shù)據(jù)經(jīng)過解釋并賦予一定的意義之后,便成為信息。數(shù)據(jù)處理的基本目的是從大量的、可能是雜亂無章的、難以理解的數(shù)據(jù)中抽取并推導(dǎo)出對于某些特定的人們來說是有價值、有意義的數(shù)據(jù)。數(shù)據(jù)處理是系統(tǒng)工程和自動控制的基本環(huán)節(jié)。數(shù)據(jù)處理貫穿于社會生產(chǎn)和社會生活的各個領(lǐng)域。數(shù)據(jù)處理技術(shù)的發(fā)展及其應(yīng)用的廣度和深度,極大地影響著人類社會發(fā)展的進(jìn)程。根據(jù)處理設(shè)備的結(jié)構(gòu)方式、工作方式,以及數(shù)據(jù)的時間空間分布方式的不同,數(shù)據(jù)處理有不同的方式。不同的處理方式要求不同的硬件和軟件支持。每種處理方式都有自己的特點,應(yīng)當(dāng)根據(jù)應(yīng)用問題的實際環(huán)境選擇合適的處理方式。數(shù)據(jù)處理主要有四種分類方式據(jù)處理設(shè)備的結(jié)構(gòu)方式區(qū)分,有聯(lián)機(jī)處理方式和脫機(jī)處理方式。根據(jù)數(shù)據(jù)處理時間的分配方式區(qū)分,有批處理方式、分時處理方式和實時處理方式。根據(jù)數(shù)據(jù)處理空間的分布方式區(qū)分,有集中式處理方式和分布處理方式。根據(jù)計算機(jī)中央處理器的工作方式區(qū)分,有單道作業(yè)處理方式、多道作業(yè)處理方式和交互式處理方式。數(shù)據(jù)處理對數(shù)據(jù)(包括數(shù)值的和非數(shù)值的)進(jìn)行分析和加工的技術(shù)過程。包括對各種原始數(shù)據(jù)的分析、整理、計算、編輯等的加工和處理。比數(shù)據(jù)分析含義廣。隨著計算機(jī)的日益普及,在計算機(jī)應(yīng)用領(lǐng)域中,數(shù)值計算所占比重很小,通過計算機(jī)數(shù)據(jù)處理進(jìn)行信息管理已成為主要的應(yīng)用。如側(cè)繪制圖管理、倉庫管理、財會管理、交通運輸管理,技術(shù)情報管理、辦公室自動化等。在地理數(shù)據(jù)方面既有大量自然環(huán)境數(shù)據(jù)(土地、水、氣候、生物等各類資源數(shù)據(jù)),也有大量社會經(jīng)濟(jì)數(shù)據(jù)(人口、交通、工農(nóng)業(yè)等),常要求進(jìn)行綜合性數(shù)據(jù)處理。故需建立地理數(shù)據(jù)庫,系統(tǒng)地整理和存儲地理數(shù)據(jù)減少冗余,發(fā)展數(shù)據(jù)處理軟件,充分利用數(shù)據(jù)庫技術(shù)進(jìn)行數(shù)據(jù)管理和處理。有關(guān)商務(wù)網(wǎng)站的數(shù)據(jù)處理:由于網(wǎng)站的訪問量非常大,在進(jìn)行一些專業(yè)的數(shù)據(jù)分析時,往往要有針對性的數(shù)據(jù)清洗,即把無關(guān)的數(shù)據(jù)、不重要的數(shù)據(jù)等處理掉。接著對數(shù)據(jù)進(jìn)行相關(guān)分分類,進(jìn)行分類劃分之后,就可以根據(jù)具體的分析需求選擇模式分析的技術(shù),如路徑分析、興趣關(guān)聯(lián)規(guī)則、聚類等。通過模式分析,找到有用的信息,再通過聯(lián)機(jī)分析(OLAP)的驗證,結(jié)合客戶登記信息,找出有價值的市場信息,或發(fā)現(xiàn)潛在的市場。2.4數(shù)據(jù)監(jiān)控所謂網(wǎng)絡(luò)數(shù)據(jù)監(jiān)控即對于網(wǎng)上流動的數(shù)據(jù),首先按事先設(shè)定的截獲原則完成有效截取,然后對截獲下的數(shù)據(jù)進(jìn)行數(shù)據(jù)還原,最后對還原后的數(shù)據(jù)進(jìn)行分析并作出某種控制決定??梢娋W(wǎng)絡(luò)監(jiān)控需分三個階段,先完成數(shù)據(jù)截獲,然后是數(shù)據(jù)的還原,最后才是進(jìn)行控制。而網(wǎng)絡(luò)監(jiān)控的困難之處即如何完成第一,第二階段的工作。這里我們用到的數(shù)據(jù)監(jiān)控是指:對采集到的可以通過系統(tǒng)協(xié)議到達(dá)前臺顯示的數(shù)據(jù)進(jìn)行一系列的檢測和控制。其中包括異常數(shù)據(jù)的檢測和改正、正常數(shù)據(jù)的批處理、和新數(shù)據(jù)的提取以及系統(tǒng)里的基礎(chǔ)庫的完善(相當(dāng)于我們平常所說的數(shù)據(jù)庫只不過是從前臺操作界面進(jìn)行操作)。數(shù)據(jù)的監(jiān)控的特點:實時性、差異性、規(guī)律性、不可或缺性。2.5信息技術(shù)信息技術(shù)目前同信息一樣,是非常流行的術(shù)語??赡軟]有聽不到或不了解信息技術(shù),但不可能沒有聽說過IT這一名稱。因為,在20世紀(jì)中葉的規(guī)??涨暗目茖W(xué)技術(shù)革命中,信息技術(shù)的發(fā)展最為突出,從20世紀(jì)40年代以前出現(xiàn)的電話、電報到20世紀(jì)40年代以后出現(xiàn)的電子計算機(jī)技術(shù)、衛(wèi)星通信、光纖通信、計算機(jī)網(wǎng)絡(luò)和多媒體技術(shù)的發(fā)明和應(yīng)用,信息技術(shù)不僅改變了原來僅從屬于其他技術(shù)的發(fā)展史,而且大大加快了發(fā)展和應(yīng)用的速度,成為當(dāng)代高新技術(shù)中的關(guān)鍵技術(shù)、引導(dǎo)現(xiàn)代科學(xué)技術(shù)發(fā)展趨勢的主導(dǎo)技術(shù)。一般來說,信息技術(shù)是能夠擴(kuò)展人類信息器官功能的,幫助完成信息的獲?。ㄊ占?、識別和提?。鬏敚ㄗ儞Q、存儲和傳遞)、加工(處理和檢索)、再生(分析)和利用等的一類技術(shù)的總稱。在信息技術(shù)的研究中,信息技術(shù)主要可以分為以下幾類:(1)測量、傳感和識別技術(shù)。他用于信息獲取,其延長的是感覺器官采集信息的能力。(2)通信與存取技術(shù)。他用于信息傳遞,其延長的是傳導(dǎo)神經(jīng)系統(tǒng)傳遞信息的能力。(3)計算與智能技術(shù)。他用于信息認(rèn)識和再生,其延長的是思維器官處理信息和決策的能力。(4)控制與顯示技術(shù)。他用于信息執(zhí)行,其延長的是效應(yīng)器官的應(yīng)用信息的能力。與其他技術(shù)相比,信息技術(shù)有以下主要特點:(1)顯著的知識密集型。(2)高度的創(chuàng)新性。(3)極強(qiáng)的滲透性。(4)強(qiáng)大的帶動性。(5)高度的增殖性。(6)高額的投入性。(7)極強(qiáng)的時效性。(8)巨大的風(fēng)險性。2.6基礎(chǔ)庫基礎(chǔ)庫就是包含了所有小區(qū)、片區(qū)、道路、物業(yè)社區(qū)和道路關(guān)聯(lián)的數(shù)據(jù)庫里的一個組成部分,他是房產(chǎn)導(dǎo)航的最基礎(chǔ)的部分,也是房產(chǎn)導(dǎo)航的精髓,房源數(shù)據(jù)中所有提取的小區(qū)、道路、片區(qū)都是基礎(chǔ)庫中所有的,房源數(shù)據(jù)中的所有提取出來的小區(qū)和道路關(guān)聯(lián)的也都是基礎(chǔ)庫中所有的?;A(chǔ)庫包括:原先基礎(chǔ)庫里面的小區(qū),和將來要新建的小區(qū);原先基礎(chǔ)庫里的片區(qū)和將來要新建的片區(qū);原先基礎(chǔ)庫里的小區(qū)和道路的關(guān)聯(lián)和將來要新建的小區(qū)與道路的關(guān)聯(lián)。新建基礎(chǔ)庫的規(guī)則:有房源;在基礎(chǔ)庫里用最小關(guān)鍵字查真基礎(chǔ)庫里真沒有;在政府網(wǎng)上搜索;在百度、谷歌地圖上查找;如果能夠查到則新建,如果上面的條件都不符合則不新建。新建道路和小區(qū)關(guān)聯(lián):添加小區(qū)周邊的四條主干道;半徑在1公里以內(nèi),房源中提到的道路;尚未核對頻次大于5次,半徑在1。5公里以內(nèi)道路;房源中提到頻次大于10次,半徑在2.7房產(chǎn)專用術(shù)語樓盤是指還未正式入住、正在規(guī)劃、實施的樓體。物業(yè)小區(qū)是指存在物業(yè)管理、封閉的、有開發(fā)商的小區(qū)。居民區(qū)是指沒有物業(yè)管理、非封閉的、沒有開發(fā)商的如單位宿舍。小區(qū)是指存在出租、出售交易本體的,可供居住的場所。片區(qū)是指不存在出租、出售交易本體的,用來描述房源位置的場所。

第三章平臺技術(shù)3.1數(shù)據(jù)庫SQLSERVER2005首先因為是在網(wǎng)絡(luò)上收集、管理一些數(shù)據(jù),所以必然就需要一樣?xùn)|西來管理這些數(shù)據(jù)這我們也就在然而然的想到了網(wǎng)上的倉庫——數(shù)據(jù)庫。在這里我選取了經(jīng)常用的SQLSERVER2005來作為理論使用工具,以下所有涉及到數(shù)據(jù)庫的都是在他的基礎(chǔ)上,當(dāng)然在實際的網(wǎng)站建設(shè)當(dāng)中可以選擇其他的數(shù)據(jù)庫工具。另外,之所以選擇SQLSERVER2005是因為他擁有以下的優(yōu)點:(1)數(shù)據(jù)分區(qū)只有到了2005版本SQLServer才擁有了真正的表和索引數(shù)據(jù)分區(qū)技術(shù)。這個技術(shù)一下子使SQLServer數(shù)據(jù)庫從“青壯年”成長為成熟的企業(yè)級數(shù)據(jù)庫產(chǎn)品,是一個里程碑性質(zhì)的標(biāo)志。數(shù)據(jù)分區(qū)技術(shù)極大加強(qiáng)了表的可伸縮性和可管理性,使得SQLServer處理海量數(shù)據(jù)的能力有了質(zhì)的飛躍,是我認(rèn)為最值得升級的一個理由。(2)安全SQLServer2005的安全功能是我認(rèn)為值得升級的第三個理由。SQLServer2005的安全達(dá)到了前所未有的強(qiáng)大水平,有著比以前版本更清晰的安全模型即主體,安全對象和權(quán)限。(3)快照隔離你還在為系統(tǒng)出現(xiàn)的阻塞(blocking)或死鎖(deadlock)現(xiàn)象苦惱嗎?快試試SQLServer2005中的快照隔離吧。通過行版本(rowversioning)控制技術(shù),SQLServer2005除了原來支持的四種事務(wù)隔離級別(臟讀、提交讀、可重復(fù)讀、可串行讀)外新增了一個快照(SNAPSHOT)隔離級別,有可能使阻塞或死鎖成為歷史。SQLServer在TEMPDB中存放不同版本的數(shù)據(jù)行,select語句讀取這些不同版本的行,讀操作不阻塞寫數(shù)據(jù),寫操作也不阻塞讀操作,這樣那些由于讀/寫爭用導(dǎo)致的大量死鎖的系統(tǒng)將從中獲得無窮益處。如果你的系統(tǒng)復(fù)雜難優(yōu)化,那么升級到SQLServer2005試試快照隔離級別,也許會有意想不到的效果。(4)數(shù)據(jù)庫鏡像對于那些要求高可用性的用戶來說,數(shù)據(jù)庫鏡像也許是考慮升級的唯一理由。SQLServer2005的前版本在高可用性方面提供了故障轉(zhuǎn)移群集(FailoverCluster)和Logshipping方案。群集方案的一個好處是在一臺機(jī)器發(fā)生問題時它可以提供極快的故障轉(zhuǎn)移能力,在備份服務(wù)器上聯(lián)機(jī)數(shù)據(jù)庫,應(yīng)用程序只需重新連接即可。群集方案的一個缺點是數(shù)據(jù)庫放在共享盤上,有單點失效這個缺點,一旦共享盤失敗將導(dǎo)致整個系統(tǒng)崩潰。所以群集方案一般都要結(jié)合嚴(yán)緊的備份方案一起使用。而logshipping系統(tǒng)有一個時間上的延遲,且如果日志備份很大,傳送速度也是個問題。SQLServer2005引入的數(shù)據(jù)庫鏡像可作為故障轉(zhuǎn)移群集或Logshipping的替代或補(bǔ)充方案來提高數(shù)據(jù)庫的高可用性。鏡像的主要優(yōu)點是它比前兩者更容易管理,沒有群集的單點失效缺點,也沒有l(wèi)ogshipping的時間延遲。鏡像服務(wù)器可以放在很遠(yuǎn)的地方,提高了作為備份服務(wù)器的高可用性。(5)商務(wù)智能BI增強(qiáng)SQLServer2005對已經(jīng)有或打算開發(fā)基于SQLServer的商務(wù)智能方案的用戶吸引力極大。SQLServer2005中有關(guān)商務(wù)智能方面的增強(qiáng)很多,是升級的很好理由。首先是傳統(tǒng)的DTS(DataTransformationServices)被新的IS(IntegrationServices)代替。另外,無論是IS、報表服務(wù)等都可以在類似VisualStudio的環(huán)境中開發(fā),任務(wù)完成不過鼠標(biāo)拖拉之間,非常容易上手。(6)全文搜索增強(qiáng)SQLServer2005全文檢索在開發(fā)的時候就集中于三點:性能,集成,和可擴(kuò)展性。性能方面的提高得益于全新設(shè)計的全文檢索引擎。其中關(guān)鍵的一點設(shè)計是全文檢索引擎現(xiàn)在使用共享內(nèi)存和SQLServer進(jìn)行數(shù)據(jù)大規(guī)模并發(fā)交互,而不是原來基于逐行的方式,使得性能上了好幾個數(shù)量級。除了性能,SQLServer2005中的全文索引的集成性也大大加強(qiáng)?,F(xiàn)在終于可以和數(shù)據(jù)庫一起備份和恢復(fù)全文索引了。你不再需要在恢復(fù)數(shù)據(jù)庫后重建全文索引了!除了可以備份外,你也可以方便的改變?nèi)乃饕拇疟P位置。你甚至可以在一個熱備機(jī)器上把全文索引建立好,然后copy這個索引到生產(chǎn)服務(wù)器上使用。(7)可用性功能增強(qiáng)索引聯(lián)機(jī)操作。除了數(shù)據(jù)庫鏡像,SQLServer2005中可用性還有很多其他提高。索引現(xiàn)在可以使用ONLINE關(guān)鍵字進(jìn)行在線建立或重建或刪除了。我認(rèn)為索引聯(lián)機(jī)操作的意義是很大的,因為很多數(shù)據(jù)庫系統(tǒng)都有定期調(diào)整或維護(hù)索引方面的需求。有了2005你無需擔(dān)心業(yè)務(wù)的正常運行而大膽的對索引進(jìn)行維護(hù)或修改。頁校驗和。SQLServer2005中的數(shù)據(jù)庫頁引入校驗和增強(qiáng)了數(shù)據(jù)的可靠性。(8)復(fù)制增強(qiáng)在SQLServer2005中,可將Oracle數(shù)據(jù)庫直接復(fù)制到SQLServer。可以從備份中初始化事務(wù)性訂閱而不是僅僅局限于從快照對復(fù)制進(jìn)行初始化。(9)異步處理能力SQLServer2005通過引入全新的ServiceBroker提供了革命性的異步處理能力。ServiceBroker提供了一個功能強(qiáng)大的異步編程模型。它為數(shù)據(jù)庫應(yīng)用程序增加了可靠、可擴(kuò)展、分布式異步功能異步編程,允許程序僅僅在資源可用時才去執(zhí)行占用大量資源的任務(wù),以此來縮短響應(yīng)時間,提高吞吐量。綜合以上的優(yōu)點,SQLSERVER2005當(dāng)然是最佳選擇。3.2網(wǎng)站ASP.NET網(wǎng)站的前臺界面設(shè)計,需要用到網(wǎng)站設(shè)計軟件,在這里我們以下講述的都是在ASP.NET的基礎(chǔ)上的。同樣我選擇ASP.NET也是因為看中了他本身的優(yōu)勢如下:(1)可管理性:ASP.NET使用基于文本的、分級的配置系統(tǒng),簡化了將設(shè)置應(yīng)用于服務(wù)器環(huán)境和Web應(yīng)用程序的工作。因為配置信息是存儲為純文本的,因此可以在沒有本地管理工具的幫助下應(yīng)用新的設(shè)置。配置文件的任何變化都可以自動檢測到并應(yīng)用于應(yīng)用程序。(2)安全:ASP.NET為Web應(yīng)用程序提供了默認(rèn)的授權(quán)和身份驗證方案。開發(fā)人員可以根據(jù)應(yīng)用程序的需要很容易地添加、刪除或替換這些方案。(3)易于部署:通過簡單地將必要的文件復(fù)制到服務(wù)器上,ASP.NET應(yīng)用程序即可以部署到該服務(wù)器上。不需要重新啟動服務(wù)器,甚至在部署或替換運行的已編譯代碼時也不需要重新啟動。(4)增強(qiáng)的性能:ASP.NET是運行在服務(wù)器上的已編譯代碼。(5)靈活的輸出緩存:根據(jù)應(yīng)用程序的需要,ASP.NET可以緩存頁數(shù)據(jù)、頁的一部分或整個頁。緩存的項目可以依賴于緩存中的文件或其他項目,或者可以根據(jù)過期策略進(jìn)行刷新。(6)國際化:ASP.NET在內(nèi)部使用Unicode以表示請求和響應(yīng)數(shù)據(jù)。可以為每臺計算機(jī)、每個目錄和每頁配置國際化設(shè)置。(7)移動設(shè)備支持:ASP.NET支持任何設(shè)備上的任何瀏覽器。開發(fā)人員使用與用于傳統(tǒng)的桌面瀏覽器相同的編程技術(shù)來處理新的移動設(shè)備。(8)擴(kuò)展性和可用性:ASP.NET被設(shè)計成可擴(kuò)展的、具有特別專有的功能來提高群集的、多處理器環(huán)境的性能。(9)跟蹤和調(diào)試:ASP.NET提供了跟蹤服務(wù),該服務(wù)可在應(yīng)用程序級別和頁面級別調(diào)試過程中啟用??梢赃x擇查看頁面的信息,或者使用應(yīng)用程序級別的跟蹤查看工具查看信息。在開發(fā)和應(yīng)用程序處于生產(chǎn)狀態(tài)時,ASP.NET支持使用.NETFramework調(diào)試工具進(jìn)行本地和遠(yuǎn)程調(diào)試。當(dāng)應(yīng)用程序處于生產(chǎn)狀態(tài)時,跟蹤語句能夠留在產(chǎn)品代碼中而不會影響性能。(10)與.NETFramework集成:因為ASP.NET是.NETFramework的一部分,整個平臺的功能和靈活性對Web應(yīng)用程序都是可用的。也可從Web上流暢地訪問.NET類庫以及消息和數(shù)據(jù)訪問解決方案。(11)與現(xiàn)有ASP應(yīng)用程序的兼容性:ASP和ASP.NET可并行運行在IISWeb服務(wù)器上而互不沖突;不會發(fā)生因安裝ASP.NET而導(dǎo)致現(xiàn)有ASP應(yīng)用程序崩潰的可能。3.3軟硬件支持房產(chǎn)導(dǎo)航,他是在網(wǎng)站建設(shè)的基礎(chǔ)上運行的,所以他需要比較完備的網(wǎng)絡(luò)環(huán)境:公司局域網(wǎng)絡(luò)的搭建和維護(hù);公司所有必須的設(shè)備:電腦、打印機(jī)、復(fù)印機(jī)、掃描儀、投影儀和程控電話系統(tǒng);公司工作的軟件系統(tǒng)的建設(shè)和維護(hù);服務(wù)器、路由器等設(shè)備,以及網(wǎng)絡(luò)平臺;防火墻等負(fù)責(zé)病毒查殺和防止病毒入侵以保證公司網(wǎng)絡(luò)系統(tǒng)安全的工具。

第四章數(shù)據(jù)處理4.1數(shù)據(jù)收集數(shù)據(jù)收集,又稱數(shù)據(jù)采集或數(shù)據(jù)獲取,是利用一種裝置,從系統(tǒng)外部采集數(shù)據(jù)并輸入到系統(tǒng)內(nèi)部。數(shù)據(jù)采集技術(shù)廣泛引用在各個領(lǐng)域。在互聯(lián)網(wǎng)行業(yè)快速發(fā)展的今天,數(shù)據(jù)采集已經(jīng)被廣泛互聯(lián)網(wǎng)及分布式領(lǐng)域,數(shù)據(jù)采集領(lǐng)域已經(jīng)發(fā)生了重要的變化。數(shù)據(jù)收集有很多種方式,如下圖:數(shù)據(jù)收集方法數(shù)據(jù)收集方法文案調(diào)查實地調(diào)查定量調(diào)查定性調(diào)查詢問調(diào)查觀測調(diào)查實驗調(diào)查圖4.1二手?jǐn)?shù)據(jù)的收集——文案調(diào)研二手?jǐn)?shù)據(jù)的來源非常豐富,而且極具調(diào)研價值,分析和解釋二手?jǐn)?shù)據(jù)也相當(dāng)重要。文案調(diào)查就是收集已有數(shù)據(jù)資料,并加以整理和分析的一種調(diào)研活動他的特點是:以收集第二手資料、文獻(xiàn)性信息為主;偏重于從動態(tài)角度收集歷史及現(xiàn)實資料;看中數(shù)據(jù)來源,而不是應(yīng)答或調(diào)研對象;文案調(diào)查不受時空限制;二手?jǐn)?shù)據(jù)的整理和分析是文案調(diào)查的重要內(nèi)容;二手?jǐn)?shù)據(jù)調(diào)研的主要優(yōu)勢:二手?jǐn)?shù)據(jù)收集的基本優(yōu)點來自數(shù)據(jù)的可得性;文案調(diào)研可能是收集某類數(shù)據(jù)的唯一可行方法;文案調(diào)查常常是市場調(diào)研的首選方法。當(dāng)二手資料不足以解決問題時,才決定執(zhí)行實地調(diào)研;文案調(diào)研的局限性表現(xiàn)在:二手?jǐn)?shù)據(jù)滿足當(dāng)前調(diào)研問題和調(diào)研目標(biāo)的實用性可能不高;難以把握文案調(diào)查所收集到資料的準(zhǔn)確程度;要查找最初的數(shù)據(jù)源可能并不容易,成本也可能很高,需要那些具有較廣泛和深厚專業(yè)理論知識和技能的調(diào)研人員才能較好地使用文案調(diào)研方案;盡管適時的、相關(guān)的二手?jǐn)?shù)據(jù)可能適合調(diào)研人員的需要,但這些數(shù)據(jù)也許是不準(zhǔn)確的。對二手?jǐn)?shù)據(jù)的可靠性進(jìn)行評估有兩條途徑:評估數(shù)據(jù)來源。通過檢驗二手?jǐn)?shù)據(jù)來源的專業(yè)水平、可信度和聲譽(yù),獲得對數(shù)據(jù)可靠性的總體認(rèn)識,調(diào)研人員傾向于從信譽(yù)好的來源獲得數(shù)據(jù)。交叉檢驗。調(diào)研人員還可以對不同來源的數(shù)據(jù)進(jìn)行交叉檢驗,以確定獨立項目的相似性,如果數(shù)據(jù)之間相互不一致,調(diào)研人員應(yīng)該努力確定這些差異的原因,并決定哪種數(shù)據(jù)最有可能是準(zhǔn)確的。二手?jǐn)?shù)據(jù)的來源企業(yè)內(nèi)部數(shù)據(jù)來源:內(nèi)部數(shù)據(jù)是那些源自企業(yè)內(nèi)部的數(shù)據(jù),或者有公司最先記錄的數(shù)據(jù),屬于企業(yè)專有數(shù)據(jù)。企業(yè)外部數(shù)據(jù)來源:將原始數(shù)據(jù)來源于奮發(fā)機(jī)構(gòu)區(qū)分開來是有益的。二手?jǐn)?shù)據(jù)的分發(fā)機(jī)構(gòu);圖書館是二手?jǐn)?shù)據(jù)的傳統(tǒng)分發(fā)渠道;因特網(wǎng)是二手?jǐn)?shù)據(jù)的現(xiàn)代分發(fā)渠道。二手?jǐn)?shù)據(jù)的原始來源:書籍與報刊(最主要的二手?jǐn)?shù)據(jù)來源)、政府來源(提供大量的數(shù)據(jù)資料、具有權(quán)威性)、大眾媒介來源(提供關(guān)于各種主題的信息資料)、行業(yè)協(xié)會來源(行業(yè)性的信息中心)、商業(yè)性來源(信息作為標(biāo)準(zhǔn)化產(chǎn)品來生產(chǎn),然后出售或出版)。定型數(shù)據(jù)調(diào)研定性數(shù)據(jù)調(diào)研提供了關(guān)于問題背景的看法與理解,定量調(diào)研則通過高度結(jié)構(gòu)化的測量工具收集數(shù)據(jù),并經(jīng)過統(tǒng)計分析將數(shù)據(jù)量化,以求對問題作深入認(rèn)識。如下表:比較項目定性調(diào)研定量調(diào)研調(diào)研目標(biāo)樣本收據(jù)收集數(shù)據(jù)分析提供關(guān)于動機(jī)與潛在原因的定性理解,屬于探測性研究少量無代表性的樣本低度或非結(jié)構(gòu)化定性分析與判斷量化數(shù)據(jù)并從感興趣的目標(biāo)總體中概括結(jié)果,建議最終的行動方案大量有代表性的樣本高度結(jié)構(gòu)化統(tǒng)計分析表4.1定性調(diào)研方法的分類根據(jù)調(diào)查對象是否了解項目的真正目的氛圍直接法和間接法兩大類;直接方法對研究的目的不加掩飾。間接方法則掩飾項目的真正目的。如下圖:定性調(diào)研方法定性調(diào)研方法直接方法間接方法—投射法焦點小組訪談法層訪談法詞語聯(lián)想法完成法構(gòu)筑法表達(dá)法圖4.2焦點小組訪談法又稱小組座談法,是定性數(shù)據(jù)調(diào)研中最典型的方法,甚至已成為定性數(shù)據(jù)研究的代名詞。焦點小組訪談法巧妙的運用心理學(xué)的有關(guān)知識和激勵原理,將若干個被訪者同時置于一個訪談室,由主持人同時訪問多人,而不是一問一答式的面談。一個人的發(fā)言會點燃其他人的思想火花,從而可以觀察到受訪者的相互作用,從而比同樣數(shù)量的人作單獨陳述能提供更多的信息。焦點小組訪談的優(yōu)點:資料收集快、效率高;取得的資料較廣泛和深入;結(jié)構(gòu)靈活,焦點小組訪談在覆蓋的主題及深度方面都可以是靈活的。焦點小組訪談的局限性:對主持人的要求比較高;容易造成判斷錯誤;小組成員選擇不當(dāng)會影響調(diào)查結(jié)果的準(zhǔn)確性和客觀性;訪談結(jié)果散亂,后期分析和說明都比較困難;有些涉及隱私、保密的問題,很難在會上討論;結(jié)果對于整個總體不具有代表性,也不可進(jìn)行推論。深層訪談法所謂深層訪談,是指訪員與一名受訪者在輕松自然的氣氛中圍繞某一問題進(jìn)行深入討論,目的是讓受訪者自由發(fā)言,充分表達(dá)自己的觀點和情感;深層訪談法主要用于詳細(xì)探究受訪者的想法,討論一些保密的、敏感的話題,調(diào)查某些比較特殊的商品購買和使用情況等。深層訪談法的優(yōu)點:消除了群體壓力。受訪者更自由、更真實的回應(yīng);一對一交流使受訪者感到被關(guān)注和激勵更樂于表達(dá);便于對一些保密性、敏感性問題進(jìn)行調(diào)查;容易將談話與其生理反應(yīng)想聯(lián)系,評估資料可信度。深層訪談法的缺點:無法產(chǎn)生受訪者之間觀點的相互刺激和碰撞;深層訪談一般要比焦點小組訪談成本高;這種方法受訪員素質(zhì)的影響更大;深層訪談的結(jié)果和數(shù)據(jù)常難以解釋和分析。投射技術(shù)的原理投射技術(shù)是一種無結(jié)構(gòu)、非之間的定性調(diào)研技術(shù),投射測試的目的在于探究隱藏在表面反應(yīng)下的真實心理,以獲知真實的情感、意圖和動機(jī)方面的信息。由于心理防御機(jī)制的作用,人們常常難以感受或不能表達(dá)內(nèi)心深處的某些感覺?;谶@種認(rèn)識,人們開發(fā)投射技術(shù),繞過防御機(jī)制,使真正的情感和態(tài)度浮現(xiàn)出了。聯(lián)想法:所謂聯(lián)想法,是指由訪談?wù)呓o受訪者提供某一刺激物,要求他即刻說出腦海中出現(xiàn)的第一種事物,借此來了解受訪者的真實感受。完成法:訪談?wù)呓o出一種不完全的刺激情景,要求被試者來完成。這類方法被一些調(diào)研者認(rèn)為是所有投射技術(shù)中最有用和最可靠的一種。主要包括:句子完成法;故事完成法。構(gòu)筑法:該方法要求受試者以故事、對話或者繪圖的形式來構(gòu)造一個回答。表達(dá)法是指給受試者提供一個語言或視覺場景,要求將場景與別人的感受和態(tài)度聯(lián)系起來。受試者表達(dá)的不是他們自己的感受或態(tài)度。表達(dá)法的兩種主要形式:角色扮演法;第三人稱法。在房產(chǎn)導(dǎo)航這個產(chǎn)品的開發(fā)過程中,所用到的數(shù)據(jù)收集方法是實地調(diào)查和文案調(diào)查的結(jié)合。實地調(diào)查主要包括的是一些用戶自己發(fā)上來的數(shù)據(jù),即一些在網(wǎng)站上注冊了的用戶如果有房源出租或出售或轉(zhuǎn)租就可以把房源信息發(fā)布到網(wǎng)上,然后這些數(shù)據(jù)如果不經(jīng)過整理還有分析、處理就會存在異常,也就是說通過這種方式收集到的數(shù)據(jù)不論他的正確與否都會在前臺網(wǎng)站顯示,所以這種數(shù)據(jù)在數(shù)據(jù)監(jiān)控中是要優(yōu)先處理的。文案調(diào)查主要是指,通過一些軟件或者由采集人員手動從別的網(wǎng)站或者報紙等地方收集到數(shù)據(jù),這些數(shù)據(jù)都是需要相關(guān)人員手動輸入到數(shù)據(jù)庫中的,然后通過一定的規(guī)則的數(shù)據(jù)會進(jìn)入前臺等待監(jiān)控。這些收集來的數(shù)據(jù)也必須得符合一定的規(guī)范,這個規(guī)范是:必須有小區(qū)名、所屬城市的哪個行政區(qū)、道路、片區(qū)。首先先確定是否有小區(qū),如果有了小區(qū)再有行政區(qū)、道路中的一個或同時都有都可以;其次是沒有小區(qū),但是有道路和行政區(qū);再次也可以是沒有小區(qū)但有片區(qū)和行政區(qū)。下面我分別來介紹一下這幾個名詞的含義:小區(qū):是存在出租、出售交易本體的可供居住的場所;片區(qū):不存在出租、出售交易本體的,只能用來描述房源位置的場所;道路:就是每個城市里所擁有的不同道路,他可以屬于不同的行政區(qū),同一個行政區(qū)里也可以有不同的很多條道路。4.2數(shù)據(jù)整理數(shù)據(jù)整理是對調(diào)查、觀察、實驗等研究活動中所搜集到的資料進(jìn)行檢驗、歸類編碼和數(shù)字編碼的過程。他是數(shù)據(jù)統(tǒng)計分析的基礎(chǔ)。在二十世紀(jì)90年代中晚期,為了揭示一些隱含數(shù)據(jù)性質(zhì)、趨勢和模式,很多商家開始探討把傳統(tǒng)的統(tǒng)計和人工智能分析技術(shù)應(yīng)用到大型數(shù)據(jù)庫的可行性問題,這些探討最終發(fā)展成為基于統(tǒng)計分析技術(shù)的正規(guī)數(shù)據(jù)整理工具。數(shù)據(jù)整理的方法(1)歸納法:可應(yīng)用直方圖、分組法、層別法及統(tǒng)計解析法。(2)演繹法:可應(yīng)用要因分析圖、散布圖及相關(guān)回歸分析。(3)預(yù)防法:通稱管制圖法,包括Pn管制圖、P管制圖、C管制圖、U管制圖、管制圖、X-Rs管制圖。數(shù)據(jù)整理的步驟(1)原始數(shù)據(jù)之審核。(2)分類項目之確定。(3)施行歸類整理。(4)列表。(5)繪圖。數(shù)據(jù)整理的注意事項(1)現(xiàn)場收集數(shù)據(jù),應(yīng)逐日、逐周和品管部門所收集的數(shù)據(jù)作核對,以求整理真實且具有代表性的數(shù)據(jù)。(2)數(shù)據(jù)整理,改善前、后所具備的條件要一致,如此所作的數(shù)據(jù)整理和比較才有意義。(3)異常發(fā)生要采取措施,一定要以整理后之?dāng)?shù)據(jù)為研究依據(jù)。(4)使用經(jīng)別人發(fā)表的次級數(shù)據(jù)應(yīng)注意:通過實地調(diào)查或文案調(diào)查得到的數(shù)據(jù)都是需要經(jīng)過整理的,這些數(shù)據(jù)的整理就相當(dāng)于對他們進(jìn)行分類,在進(jìn)行分類前首先是初步確定這些數(shù)據(jù)的可靠性,然后在進(jìn)行分類,這里的分類標(biāo)準(zhǔn)主要包括:發(fā)布數(shù)據(jù)的時間范圍:離當(dāng)時時間出售為半年、出租是三個月以內(nèi)的算作是第一個時間范圍(這一個范圍內(nèi)的數(shù)據(jù)的可靠性、真實性和對最終效果的影響最大);出售離當(dāng)時時間半年以前、出租數(shù)據(jù)是三個月以前的算作是第二個時間范圍(這一個范圍內(nèi)的數(shù)據(jù)因為時間比較久了,所以決策效率沒有那么高,一般這種數(shù)據(jù)經(jīng)過稍微的出來便可以進(jìn)入數(shù)據(jù)庫里留作資料,對房價均價的影響相對來說比較?。?。所屬城市:這個是相對來說比較能夠一目了然的方法,屬于相同城市的數(shù)據(jù)放到同一組里,這樣他們的差異會比較小一點,并且綜合大量的數(shù)據(jù)更能夠看出最近的房價走勢,方便不同地方的人們購房作出理智而明確的決策。所屬小區(qū):同一個城市會有很多個不同的小區(qū)特別是比較發(fā)達(dá)的像是上海、青島等城市的小區(qū)會特別的多,這個時候把同一個小區(qū)的數(shù)據(jù)都整理出來會更加明確的表達(dá)人們需要知道的信息,并且同一城市里的人在選擇哪個小區(qū)方面作有利的指導(dǎo)。所屬道路:把這種屬于同一個城市,在同一條道路周邊的小區(qū)情況放在一塊,對已經(jīng)有了固定工作后想買房子的人們提供了相當(dāng)大的便利,因為這種已經(jīng)有了固定工作的人們,他們在買房子的時候更多想的是在那條路附近買房但是并沒有確定是那一套房子,如果有了這樣一類數(shù)據(jù),人們在購買房子的時候就可以綜合的衡量利弊確定最適合自己并且最優(yōu)惠的房子。房屋類型:可以分為住宅、公寓、商住、車庫、寫字樓、商鋪、廠房庫房,住宅就是供居住的場所;商住:可供住宅也可以辦公的場所,價格比一般的住宅高一些;車庫:有產(chǎn)權(quán)的封閉的六面體;寫字樓:專業(yè)商業(yè)辦公樓的別稱,嚴(yán)格意義上講不能住人;商鋪:使用者可以通過它與客戶進(jìn)行交易、服務(wù)的場所;廠房庫房:存放商品或者是進(jìn)行車間加工的場所;他們當(dāng)中一般寫字樓和商鋪的價格會比較高,所以分類整理數(shù)據(jù),有利于更加合理的區(qū)分去同一小區(qū)內(nèi)不同房源的價格差異,同時更好的確定符合自己的房源。室內(nèi)結(jié)構(gòu):主要內(nèi)容平房、錯層、復(fù)式、閣樓、團(tuán)結(jié)戶、老式房、地下室、帶閣樓、帶車庫、其他。錯層是指指一套住宅內(nèi)的各種功能用房在不同的平面上,用30-60cm的高差進(jìn)行空間隔斷,層次分明,立體性強(qiáng),但未分成兩層,適合大面積住宅;復(fù)式是指復(fù)式住宅在概念上是一層,并不具備完整的兩層空間,但層高較普通住宅(通常層高2.8米)建筑類型:多層、小高層、高層、平房、別墅、連體別墅、單體樓房、其他。多層是指2-7層南北通透的樓盤;小高層是指8-11層有電梯及物業(yè)的樓盤;高層指8層以上的樓盤;別墅這里指的是獨體別墅即獨門獨院,上有獨立空間,下有私家花園領(lǐng)地,是私密性很強(qiáng)的獨立式住宅,表現(xiàn)為上下左右前后都屬于獨立空間,一般房屋周圍都有面積不等的綠地、院落。這一類型是別墅歷史最悠久的一種,也是別墅建筑的終極形式;連體別墅又分為雙拼別墅、聯(lián)排別墅、別拼別墅,兩套連在一起的就是雙拼別墅,一般是三面采光,聯(lián)排的就是有3套或3套以上的別墅連在一起的;把收集來的數(shù)據(jù)按照以上的方式整理,當(dāng)然可以以任何一種方式,這樣會給不同的人們帶來不同的信息,方便用戶查找信息時候的多樣化和準(zhǔn)確性。4.3數(shù)據(jù)分析數(shù)據(jù)分析是指用適當(dāng)?shù)慕y(tǒng)計方法對收集來的大量第一手資料和第二手資料進(jìn)行分析,以求最大化地開發(fā)數(shù)據(jù)資料的功能,發(fā)揮數(shù)據(jù)的作用。是為了提取有用信息和形成結(jié)論而對數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過程。數(shù)據(jù)分析的目的是把隱沒在一大批看來雜亂無章的數(shù)據(jù)中的信息集中、萃取和提煉出來,以找出所研究對象的內(nèi)在規(guī)律。在實用中,數(shù)據(jù)分析可幫助人們作出判斷,以便采取適當(dāng)行動。數(shù)據(jù)分析是組織有目的地收集數(shù)據(jù)、分析數(shù)據(jù),使之成為信息的過程。數(shù)據(jù)分析是質(zhì)量管理體系的基礎(chǔ)。組織的管理者應(yīng)在適當(dāng)時,通過對以下問題的分析,評估其有效性:供決策的信息是否充分、可信,是否存在因信息不足、失準(zhǔn)、滯后而導(dǎo)致決策失誤的問題;信息對持續(xù)改進(jìn)質(zhì)量管理體系、過程、產(chǎn)品所發(fā)揮的作用是否與期望值一致,是否在產(chǎn)品實現(xiàn)過程中有效運用數(shù)據(jù)分析;收集數(shù)據(jù)的目的是否明確,收集的數(shù)據(jù)是否真實和充分,信息渠道是否暢通;數(shù)據(jù)分析方法是否合理,是否將風(fēng)險控制在可接受的范圍;數(shù)據(jù)分析所需資源是否得到保障。分析數(shù)據(jù)常用的工具:老七種工具,即排列圖、因果圖、分層法、調(diào)查法、散步圖、直方圖、控制圖。新七種工具,即關(guān)聯(lián)圖、系統(tǒng)圖、矩陣圖、KJ法、計劃評審技術(shù)、PDPC法、矩陣數(shù)據(jù)圖。利用數(shù)據(jù)挖掘進(jìn)行數(shù)據(jù)分析常用的方法主要有:分類。分類是找出數(shù)據(jù)庫中一組數(shù)據(jù)對象的共同特點并按照分類模式將其劃分為不同的類,其目的是通過分類模型,將數(shù)據(jù)庫中的數(shù)據(jù)項映射到某個給定的類別。歸分析?;貧w分析方法反映的是事務(wù)數(shù)據(jù)庫中屬性值在時間上的特征,產(chǎn)生一個將數(shù)據(jù)項映射到一個實值預(yù)測變量的函數(shù),發(fā)現(xiàn)變量或?qū)傩蚤g的依賴關(guān)系,其主要研究問題包括數(shù)據(jù)序列的趨勢特征、數(shù)據(jù)序列的預(yù)測以及數(shù)據(jù)間的相關(guān)關(guān)系等。聚類。聚類分析是把一組數(shù)據(jù)按照相似性和差異性分為幾個類別,其目的是使得屬于同一類別的數(shù)據(jù)間的相似性盡可能大,不同類別中的數(shù)據(jù)間的相似性盡可能小。關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫中數(shù)據(jù)項之間所存在的關(guān)系的規(guī)則,即根據(jù)一個事務(wù)中某些項的出現(xiàn)可導(dǎo)出另一些項在同一事務(wù)中也出現(xiàn),即隱藏在數(shù)據(jù)間的關(guān)聯(lián)或相互關(guān)系。特征。特征分析是從數(shù)據(jù)庫中的一組數(shù)據(jù)中提取出關(guān)于這些數(shù)據(jù)的特征式,這些特征式表達(dá)了該數(shù)據(jù)集的總體特征。變化和偏差分析。偏差包括很大一類潛在有趣的知識,如分類中的反常實例,模式的例外,觀察結(jié)果對期望的偏差等,其目的是尋找觀察結(jié)果與參照量之間有意義的差別。Web頁挖掘。Web上的信息量無比豐富,通過對Web的挖掘,可以利用Web的海量數(shù)據(jù)集中精力分析和處理那些對企業(yè)有重大或潛在重大影響的外部環(huán)境信息和內(nèi)部經(jīng)營信息,并根據(jù)分析結(jié)果找出企業(yè)管理過程中出現(xiàn)的各種問題和可能引起危機(jī)的先兆,對這些信息進(jìn)行分析和處理,以便識別、分析、評價和管理危機(jī)。這里我們在對收集整理的數(shù)據(jù)進(jìn)行分析的時候主要還是運用了分類的方法,把同一批數(shù)據(jù)的不同類別都找出來,然后分析哪一個才類別才是影響房價的主要因素,收集整理到的數(shù)據(jù)所擁有的類別在整理的分類里面已經(jīng)敘述過,通過分析研究這些數(shù)據(jù),不僅從中可以發(fā)現(xiàn)異常的數(shù)據(jù),而且還可以提取出很多有規(guī)律的東西(比如同一城市那個區(qū)域的房價比較高、同一小區(qū)都是有什么樣的房屋類型、不同的房屋類型之間的差價是多少,用戶通過了解這些分析之后的數(shù)據(jù),才會做出更加明智的決策。關(guān)聯(lián)規(guī)則也有用到,比如一條房源數(shù)據(jù)里面的房屋面積、城市、行政區(qū)和另一條房源數(shù)據(jù)里面的一樣,但是他們擁有不同的售價,這時候我們就可以建立關(guān)聯(lián),并且通過比較得到他們售價不同的原因,也就是可以找到影響房價差異的原因,比如說:道路的不同、建筑類型的不同、室內(nèi)結(jié)構(gòu)的不同等。特征性也比較常用到,特別是在分析數(shù)據(jù)是否異常的時候,我們可以把一個城市內(nèi)帶有寫字樓特征的數(shù)據(jù)提取出來,然后分析這種特征的數(shù)據(jù)與這個城市的平均住房價格的差異,然后再當(dāng)看到一條帶有寫字樓特性的數(shù)據(jù)時我們就可以通過特征分析得到的那個差異范圍判斷這條數(shù)據(jù)是不是正確的,從而為用戶決策提供了更加準(zhǔn)確的依據(jù)。小區(qū)行情圖是類直方圖的一種,他也是數(shù)據(jù)房產(chǎn)數(shù)據(jù)分析中很常用的一種方法,他是按小區(qū)進(jìn)行整理的,以時間為橫軸,以房價為縱軸,然后把得到的數(shù)據(jù)繪制到相應(yīng)小區(qū)的行情圖里面看看他的波動,如果他與以前存在的數(shù)據(jù)相比波動特別大一般是差價50%以上,就可以直接判斷是異常數(shù)據(jù),如果在50%之內(nèi),就先留著,等待接下來的數(shù)據(jù),如果以后進(jìn)入的數(shù)據(jù)沒有波動那么大的,那么這條數(shù)據(jù)就是異常數(shù)據(jù),反之有很多跟他波動類似的數(shù)據(jù),就能明確的看到房價的變動,同時也影響了均價。數(shù)據(jù)分析意義:數(shù)據(jù)分析的目的是把隱沒在一大批看來雜亂無章的數(shù)據(jù)中的信息集中、萃取和提煉出來,以找出所研究對象的內(nèi)在規(guī)律。在實用中,數(shù)據(jù)分析可幫助人們作出判斷,以便采取適當(dāng)行動。數(shù)據(jù)分析是組織有目的地收集數(shù)據(jù)、分析數(shù)據(jù),使之成為信息的過程。這一過程是質(zhì)量管理體系的支持過程。在產(chǎn)品的整個壽命周期,包括從市場調(diào)研到售后服務(wù)和最終處置的各個過程都需要適當(dāng)運用數(shù)據(jù)分析過程,以提升有效性。例如J.開普勒通過分析行星角位置的觀測數(shù)據(jù),找出了行星運動規(guī)律。又如,一個企業(yè)的領(lǐng)導(dǎo)人要通過市場調(diào)查,分析所得數(shù)據(jù)以判定市場動向,從而制定合適的生產(chǎn)及銷售計劃。因此數(shù)據(jù)分析有極廣泛的應(yīng)用范圍。4.4數(shù)據(jù)處理數(shù)據(jù)經(jīng)過收集分析是有用可靠的數(shù)據(jù)了,這個時候就會進(jìn)行數(shù)據(jù)的處理,這里的數(shù)據(jù)處理是指:對采集的的數(shù)據(jù),進(jìn)行提取、加工從而變成有用信息的過程。這時候把收集整理的數(shù)據(jù)經(jīng)過處理,放入數(shù)據(jù)庫,在這個過程中并不是所有的數(shù)據(jù)都能進(jìn)入前臺顯示的,有一些不符合處理規(guī)則的數(shù)據(jù)就會被擋在校對數(shù)據(jù)庫里面,只有符合規(guī)范的一些才會進(jìn)入監(jiān)控的數(shù)據(jù)庫,在前臺顯示。一條數(shù)據(jù)可以提取出來以下項目:小區(qū)、道路、片區(qū)、面積、價格、還有其他的一些細(xì)節(jié)(這些細(xì)節(jié)在數(shù)據(jù)處理的過程后期才會參與,前期的時候主要是小區(qū)、道路、片區(qū)、行政區(qū)、面積、價格的提?。?。數(shù)據(jù)處理的規(guī)則就是圍繞著以上幾個參數(shù)進(jìn)行處理的,規(guī)則包括以下幾個:小區(qū)、道路、片區(qū)至少有一個,行政區(qū)必須得有;當(dāng)一條數(shù)據(jù)小區(qū)、道路、片區(qū)都可以提取并且也擁有正確行政區(qū)的時候,這條數(shù)據(jù)是有效的可以直接進(jìn)入監(jiān)控數(shù)據(jù)庫,在前臺顯示。當(dāng)一條數(shù)據(jù)小區(qū)、道路、片區(qū)都可以提取出來的時候先提取小區(qū)、再提取道路、最后提取片區(qū)。當(dāng)一條數(shù)據(jù)小區(qū)提取不出來的時候,先看看能不能提取道路,若能提取道路并且由行政區(qū),這條數(shù)據(jù)就可以經(jīng)過加工進(jìn)入監(jiān)控數(shù)據(jù)庫,進(jìn)而在前臺顯示。如果不能提取出道路,再看能不能提取出片區(qū),如果能提取出片區(qū)并且存在行政區(qū),這條數(shù)據(jù)就可以經(jīng)過加工進(jìn)入監(jiān)控數(shù)據(jù)庫,進(jìn)而在前臺顯示。如果不能夠提取出片區(qū),那么這條數(shù)據(jù)就是無效數(shù)據(jù),他就會進(jìn)入校對數(shù)據(jù)庫,等待數(shù)據(jù)的重新確認(rèn)加工。上面的6條規(guī)則都是在面積、價格存在的情況下論述的,如果缺失面積或價格那么這條數(shù)據(jù)也將被擋在校對數(shù)據(jù)庫里面,等待數(shù)據(jù)的重新確認(rèn)加工。數(shù)據(jù)處理針對不同來源的數(shù)據(jù)有不同的處理方法:對用戶發(fā)上來的信息盡量的保留,因為這一部分?jǐn)?shù)據(jù)是用戶發(fā)上來的是第一手的資料,這時候如果必備項滿足的話可以允許沖突的存在,在對他進(jìn)行處理的時候沒有異常的數(shù)據(jù)直接進(jìn)入前臺,有異常的數(shù)據(jù)看看是什么沖突,如果小區(qū)-道路沖突就看看,小區(qū)是否真的存在,如果真的存在,就去地圖查找道路是否在小區(qū)周邊(1公里針對從別的網(wǎng)站上采集來的數(shù)據(jù),這種是二手資料,如果必備項都滿足的話,是不允許存在沖突的,不沖突的數(shù)據(jù)只看他們面積和價格是否是異常的,然后提取的項目是否出現(xiàn)錯誤就可以,如果都沒錯誤,這條加工過的數(shù)據(jù)就可以在前臺為用戶提供決策了。判斷在處理所有數(shù)據(jù)中都會用到的是,檢查小區(qū)、道路、片區(qū)、行政區(qū)是否提取錯誤;價格、面積是否提取錯誤;細(xì)節(jié)比如房源信息中提到用途是寫字樓的是否已經(jīng)設(shè)置用途為寫字樓;室內(nèi)結(jié)構(gòu)閣樓的是否已經(jīng)設(shè)置室內(nèi)結(jié)構(gòu)為閣樓;建筑類型是別墅的是否已經(jīng)設(shè)置建筑類型為別墅。還有就是出租的房源中房源是整租還是合租(一般面積小于5的都是合租;總價小于600的都是合租;總價大于1500的都是整租)系統(tǒng)的來說,進(jìn)入監(jiān)控數(shù)據(jù)庫中的數(shù)據(jù)經(jīng)過處理就會成為信息,然后這些信息就會為用戶提供大量的決策支持,這些進(jìn)入到前臺的準(zhǔn)確信息就是組成房產(chǎn)導(dǎo)航的關(guān)鍵因素。

第五章數(shù)據(jù)監(jiān)控5.1信息產(chǎn)品的產(chǎn)生數(shù)據(jù)經(jīng)過了,收集、整理、分析、處理然后成為了信息,這樣也就充分說明了信息=數(shù)據(jù)+加工過程,然后這些信息集合在一塊經(jīng)過一定綜合分類就會成為對用戶決策提供依據(jù)的信息產(chǎn)品,也就是說信息產(chǎn)品——房產(chǎn)導(dǎo)航就誕生了。房產(chǎn)導(dǎo)航是為房地產(chǎn)商、房產(chǎn)中介和購房者提供購房依據(jù)的工具,但是這些信息并不是無償?shù)?,這也是房產(chǎn)導(dǎo)航的優(yōu)越性所在,這是站在房地產(chǎn)的基礎(chǔ)上利用信息技術(shù)盈利的一種全新手段,也是以后經(jīng)濟(jì)發(fā)展的主流趨勢,在利潤方面,有句俗話說的好“賺錢就是賺有錢人的錢”,房地產(chǎn)商一個樓盤資金的客觀度大家都有所耳聞,所以這些信息的價值也就會在利潤方面比較客觀。這些數(shù)據(jù)的處理和形成的信息的現(xiàn)實都是通過房產(chǎn)導(dǎo)航這款軟件,他可以存在在電腦上也可以存在在手機(jī)上,并且他還結(jié)合了GPRS全球定位系統(tǒng),當(dāng)帶有房產(chǎn)導(dǎo)航軟件的手機(jī)到達(dá)一個地方的時候,打開軟件就會自動的顯示出這是在哪,這附近有什么小區(qū),小區(qū)的價格什么情況,然后房地產(chǎn)商在看到這些的時候就可以很輕松快捷的在看到商機(jī),或者對他的建房、購房、售房計劃起到提醒或者點睛的關(guān)鍵性作用。5.2數(shù)據(jù)監(jiān)控數(shù)據(jù)監(jiān)控是指對已經(jīng)在前臺顯示的數(shù)據(jù)進(jìn)行整理、分析從而進(jìn)行異常排查的過程,他是保證信息產(chǎn)品——房產(chǎn)導(dǎo)航可靠性的關(guān)鍵。數(shù)據(jù)監(jiān)控包括兩個方面:一個是已經(jīng)處理過的數(shù)據(jù);另一個是剛剛進(jìn)入監(jiān)控界面還沒有處理的數(shù)據(jù);對于已經(jīng)處理過的數(shù)據(jù),出現(xiàn)異常的可能性不大,只是可能會因為最近數(shù)據(jù)的價格波動而影響比同,(這里的比同是按照房源的單價與30天以內(nèi)的同一小區(qū)內(nèi)的房源單價平均值的比例算出來的,一般波動范圍為60%—-30%(對普通的住宅來講),對于寫字樓和商鋪波動范圍是200%—-30%,復(fù)式波動范圍是60%—-30%,閣樓、帶閣樓、別墅、地下室的波動范圍是:60%—-40%,用戶發(fā)布到數(shù)據(jù)比較特殊,因為他要盡量保留所有他的波動范圍是60%—-35%。)這個時候如果是出售半年以前的就按比同是50%以內(nèi)的留著,如果是50%以外的數(shù)據(jù)就置為無效數(shù)據(jù)。對于剛剛進(jìn)入監(jiān)控系統(tǒng)的數(shù)據(jù)也要分類處理:用戶發(fā)布的數(shù)據(jù),我們會優(yōu)先處理,對這種數(shù)據(jù)先批量的找到,然后進(jìn)行價格、面積排序把異常的數(shù)據(jù)置無效,然后再看看房源是不是有沖突,有沖突(道路—小區(qū),小區(qū)—行政區(qū),道路—行政區(qū))的話如果是小區(qū)—道路沖突,這時候小區(qū)如果是正確的就通過地圖和網(wǎng)站查找這條道路是不是在小區(qū)的一公里以內(nèi),如果是就建立小區(qū)道路關(guān)聯(lián),然后這條房源信息就成為了沒有沖突的了,如果小區(qū)不存在,就通過政府網(wǎng)查找,如果能查到或者是這個小區(qū)有10條以上的房源就可以新建這個小區(qū),如果不能新建這個小區(qū)就直接將這個提取的錯誤小區(qū)刪掉留有道路和行政區(qū),這樣就可以成為一條有用的房源信息了;如果是小區(qū)—行政區(qū)沖突,先要確定這個小區(qū)在系統(tǒng)內(nèi)是屬于哪個行政區(qū)的,然后從網(wǎng)上查找沖突的行政區(qū)內(nèi)是否有這個同名的小區(qū),如果有的話就可以在新建一個沖突行政區(qū)內(nèi)的小區(qū),如果沒有就把沖突的行政區(qū)改為系統(tǒng)里有的行政區(qū),這樣就可以得到有用的房源信息;如果是道路—行政區(qū)沖突,跟小區(qū)—行政區(qū)沖突類似,先從網(wǎng)站或者地圖上查找在沖突的行政區(qū)內(nèi)是否存在同名的道路,如果存在就在沖突行政區(qū)內(nèi)新建這條道路,如果不存在,然后查找系統(tǒng)內(nèi)這條道路所屬的行政區(qū),如果這條道路系統(tǒng)內(nèi)屬于多個行政區(qū)(道路跨行政區(qū))那么這條房源信息就成為無效的了,如果在系統(tǒng)內(nèi)這條道路只屬于一個行政區(qū)那么就把這個沖突的行政區(qū)改為系統(tǒng)內(nèi)存在的行政區(qū),這樣就可以獲得有用的房源信息了;還有就是在對各個房源異常檢查完之后,再看他們的細(xì)節(jié)是否設(shè)置完善,要將細(xì)節(jié)也設(shè)置完善才得到完整、有用的房源信息。從別的網(wǎng)站采集來的數(shù)據(jù),這部分?jǐn)?shù)據(jù)一般的沖突不會存在,他存在的是價格、面積的異常,或者是小區(qū)、道路、行政區(qū)、片區(qū)的錯提,對于這種數(shù)據(jù)一般的數(shù)量比較大所以應(yīng)該按照一定的規(guī)律進(jìn)行批量處理:首先要按單價、面積和比同分別申請出不在正常范圍內(nèi)的異常數(shù)據(jù),然后把這些數(shù)據(jù)設(shè)置為無效;按細(xì)節(jié)申請出來,比如說寫字樓,就把帶有寫字樓關(guān)鍵字的房源數(shù)據(jù)都申請?zhí)幚?,然后價格、面積、比同排序把異常的數(shù)據(jù)設(shè)置為無效,然后剩下的數(shù)據(jù)看看位置是否設(shè)置正確,細(xì)節(jié)批量的置為寫字樓以外,然后把其他的細(xì)節(jié)也設(shè)置上,這樣就得到了一批有用的房源信息。單價、比同正常數(shù)據(jù)的批量申請?zhí)幚磉M(jìn)行處理,這種數(shù)據(jù)只需要看位置是否提錯,細(xì)節(jié)是否設(shè)置完善就可以。批量申請出來以后我們就先把他們提錯的位置糾正,細(xì)節(jié)設(shè)置完善,那么就又可以得到一批有用的房源信息。單價、面積正常的數(shù)據(jù)批量申請?zhí)幚磉M(jìn)行處理,這種數(shù)據(jù)首先要看他們的比同是否在正常的范圍內(nèi),如果不是那么不是的那些數(shù)據(jù)設(shè)置無效,剩下的在正常范圍內(nèi)的那些數(shù)據(jù),要觀察他們位置是否提錯,把提錯的位置改為正確的位置,再看細(xì)節(jié)是否設(shè)置完善,然后設(shè)置細(xì)節(jié),就可以得到一批有用的房源信息。剩下的那些沒有規(guī)律的數(shù)據(jù),只能申請出一批,按面積、價格、比同排序,分別把每種排序時異常的數(shù)據(jù)排查掉,然后再對他們進(jìn)行位置和細(xì)節(jié)方面的設(shè)置,直到修改為完善有用的信息。這樣通過實時的監(jiān)控和處理數(shù)據(jù),就能夠保證房產(chǎn)導(dǎo)航上的數(shù)據(jù)具有全面、最新、準(zhǔn)確的特點?;ヂ?lián)網(wǎng)數(shù)據(jù)監(jiān)控還有以下的特點:1)高效性:2)全面性:3)及時性:4)精準(zhǔn)性:5.3數(shù)據(jù)維護(hù)數(shù)據(jù)維護(hù)是指保持?jǐn)?shù)據(jù)處于適合使用的狀態(tài)。狹義數(shù)據(jù)維護(hù)指經(jīng)常更新存儲介質(zhì)中的數(shù)據(jù),使其保持正常狀態(tài)。廣義數(shù)據(jù)維護(hù)指數(shù)據(jù)系統(tǒng)建成后的全部數(shù)據(jù)管理工作。數(shù)據(jù)維護(hù)的目的是保證數(shù)據(jù)的準(zhǔn)確、及時、安全和保密。保證數(shù)據(jù)的準(zhǔn)確性,首先要保證數(shù)據(jù)更新的狀態(tài),數(shù)據(jù)要在合理的誤差范圍內(nèi),同時要保證數(shù)據(jù)的唯一性,應(yīng)用數(shù)據(jù)庫,容易保證數(shù)據(jù)唯一性。要保證數(shù)據(jù)的正確性,一方面要嚴(yán)格操作規(guī)程,對輸入數(shù)據(jù)進(jìn)行正確性檢查,避免把一種數(shù)據(jù)放到另一種數(shù)據(jù)的位置,或者把錯誤的數(shù)據(jù)放進(jìn)去;另一方面,在鍵入計算機(jī)時,系統(tǒng)應(yīng)采用檢驗技術(shù),以保證數(shù)據(jù)的準(zhǔn)確性。保證數(shù)據(jù)的及時性,把常用數(shù)據(jù)放在易取位置,各種設(shè)備狀態(tài)良好,操作人員技術(shù)熟練,及時提供數(shù)據(jù)。安全性是防止數(shù)據(jù)受到破壞,要采取一些安全措施,在萬一受到破壞后,較容易地恢復(fù)數(shù)據(jù)。為了保證數(shù)據(jù)的安全,首先要保證存儲介質(zhì)的環(huán)境,要防塵,要干燥,并要維持一定的恒溫。為了防止數(shù)據(jù)的丟失,要保持備份,如軟盤要定期復(fù)制。其次,一旦數(shù)據(jù)丟失或遭到破壞,應(yīng)有補(bǔ)救的措施。如我們可以根據(jù)前幾天的總帳和今天的原始憑證恢復(fù)現(xiàn)在的總帳。為了考慮特殊情況的發(fā)生,為水災(zāi)、火災(zāi)、地震等,對于一些重要的數(shù)據(jù)應(yīng)雙備份,并分處存放。數(shù)據(jù)是一種資源,也是無形財富,人們越來越重視數(shù)據(jù)的保密性問題。而目前數(shù)據(jù)被盜或者被非法用戶查閱的事件越來越多,防止數(shù)據(jù)失竊是數(shù)據(jù)維護(hù)的重要問題。機(jī)器內(nèi)部可采用口令(password)等方式實現(xiàn)數(shù)據(jù)的保密。在機(jī)器外部也應(yīng)采取一些措施,如應(yīng)用嚴(yán)格的處理手續(xù),實行機(jī)房的嚴(yán)格管理,加強(qiáng)人員的保密教育等。數(shù)據(jù)的維護(hù)是數(shù)據(jù)管理的重要一環(huán),沒有好的數(shù)據(jù)維護(hù),就沒有好的數(shù)據(jù)使用,要克服重使用、輕維護(hù)的傾向,強(qiáng)調(diào)數(shù)據(jù)維護(hù)的重要性。

第六章添加數(shù)據(jù)6.1手工添加手工添加數(shù)據(jù),是一種最原始的數(shù)據(jù)添加方法,這種數(shù)據(jù)是無法直接通過軟件從其他網(wǎng)站上收集到的,也不是用戶自己發(fā)上來的數(shù)據(jù),而是相關(guān)人員通過一定的方式得到資料,然后手工添加到系統(tǒng)里面。這種數(shù)據(jù)的來源可以分為:書籍,閱讀相關(guān)方面的書籍,可以從書籍上找到相關(guān)的資料信息,這種方法比較零散不容易直觀的找到有用的數(shù)據(jù),并且書籍里的數(shù)據(jù)的時效性不是很好保證;報紙,通過查閱各個地方的各期報紙可以獲得不同的數(shù)據(jù),這種方式得到的數(shù)據(jù)時效性比較好控制,但是因為是在報紙上刊登的所有可靠性不是很高;與他人的溝通交流,與他人溝通交流得到的數(shù)據(jù)具有一定的時效性并且可靠性會更加高一些,但是這種方式得到的數(shù)據(jù)量相對來說少一點。手工添加的優(yōu)點:他的可靠性很高,這種數(shù)據(jù)一般都是經(jīng)過添加數(shù)據(jù)的相關(guān)人員初步判斷了的,當(dāng)數(shù)據(jù)添加員采集數(shù)據(jù)的時候就會相應(yīng)查找一些比較可靠性的資料這在無形中也增加了數(shù)據(jù)的可靠性;異常數(shù)據(jù)少,在數(shù)據(jù)添加員添加數(shù)據(jù)的時候,他會按照規(guī)則進(jìn)行提取,并且初步判斷位置、細(xì)節(jié)的設(shè)置,這個時候經(jīng)過數(shù)據(jù)添加員的初步判斷,異常數(shù)據(jù)就會大大減少;他局限性很小,一般只要是找到數(shù)據(jù)就可以添加進(jìn)去,大大的彌補(bǔ)了網(wǎng)站采集的限制性;缺點:添加的數(shù)據(jù)量少,手工添加是需要從一些文獻(xiàn)資料上人為去查找相關(guān)的信息,提取出所需要的數(shù)據(jù),并且這部分資料并不多,所以在數(shù)量上肯定要比從其他網(wǎng)站上采集來的數(shù)據(jù)要少的很多;耗費時間比較大,對于這部分?jǐn)?shù)據(jù),因為要找的話,需要去圖書館等地方實地查找,然后記錄,與從網(wǎng)上收集數(shù)據(jù)相比是有一定的時間差距,因此這種添加數(shù)據(jù)的方法一般都會用但是每天的量都很少;與數(shù)據(jù)添加員的素質(zhì)能力相關(guān),數(shù)據(jù)添加員的能力好壞影響了添加數(shù)據(jù)可靠性,只有高素質(zhì)高能力的數(shù)據(jù)添加員才會添加出可靠性和完整性比較高的數(shù)據(jù),如果是素質(zhì)和能力都不是很好的數(shù)據(jù)添加員添加出的數(shù)據(jù)在可靠性和完整性方面就會大大減弱;因此這種手工添加的數(shù)據(jù)添加方法,在實際添加數(shù)據(jù)中應(yīng)用比較頻繁,但是每次用的時候添加的數(shù)據(jù)量都不會很多,他一般用于添加哪種必須得添加但是網(wǎng)上又不能直接從其他網(wǎng)站采集的哪種數(shù)據(jù)。6.2用戶添加用戶是指在網(wǎng)站注冊會員的客戶,這種群體主要是一些房源的發(fā)布者,他們可以在擁有房源數(shù)據(jù)時及時的發(fā)布到網(wǎng)路上。用戶添加的限制性比其他兩種添加方式限制性要小,用戶發(fā)布房源的方式也比較靈活,他是完完全全的第一手資料,并且是其他網(wǎng)站和其他的書籍、報刊上找不到的,因此這部分?jǐn)?shù)據(jù)相當(dāng)?shù)恼滟F。他有以下的優(yōu)點數(shù)據(jù)相當(dāng)珍貴,因為這是其他各個地方不可能出現(xiàn)的房源數(shù)據(jù),因為注冊成為房產(chǎn)導(dǎo)航的用戶都是一對一的用戶,他們發(fā)布房源的就顯得尤為珍貴;時效性強(qiáng),用戶添加的數(shù)據(jù)都是有房源數(shù)據(jù),就添加的網(wǎng)站上面來,因此他比從書籍、報刊采集手工添加的和從其他網(wǎng)站上采集的數(shù)據(jù)的時效性要好很多,他具有即時性的特點;可以更好的進(jìn)行數(shù)據(jù)挖掘,,因為這部分?jǐn)?shù)據(jù)的限制比較少,所以用戶添加的數(shù)據(jù)的沖突性很大,在解決這些沖突的過程中,就可以很好的挖掘數(shù)據(jù),使基礎(chǔ)庫更加完善;不足:他的可靠性受用戶素質(zhì)影響比較大,因為發(fā)布房源數(shù)據(jù)的用戶素質(zhì)參差不齊,有些時候有些用戶為了牟利提供了虛假的房源數(shù)據(jù),這時候就導(dǎo)致了房源數(shù)據(jù)的不可靠性;房源數(shù)據(jù)數(shù)量起來較其他幾種比較復(fù)雜,因為用戶發(fā)布的房源數(shù)據(jù)限制比較少,所以存在很大的沖突情況,在給我們數(shù)據(jù)監(jiān)控員的工作強(qiáng)度上加大了很多,特點是那種開發(fā)比較好的城市,用戶添加的數(shù)據(jù)比較多,處理起來會相對麻煩很多;添加數(shù)據(jù)量與相應(yīng)城市的開發(fā)程度有關(guān),房產(chǎn)導(dǎo)航開發(fā)程度比較好的城市,用戶會相比來說多一些,所以用戶添加的房源就會相應(yīng)增加;用戶添加數(shù)據(jù)是一種即時性數(shù)據(jù),他比其他幾種方式得到的更加珍貴,他能更加實際的反應(yīng)出當(dāng)?shù)氐姆績r狀況,但是他受用戶所在的城市房地產(chǎn)發(fā)展水平和房產(chǎn)導(dǎo)航在此城市的開發(fā)狀況的影響,房地產(chǎn)發(fā)展水平高的和房產(chǎn)導(dǎo)航開發(fā)狀況比較好的城市,用戶添加的數(shù)據(jù)會比較多。6.3采集數(shù)據(jù)采集的數(shù)據(jù)是指通過一定的數(shù)據(jù)采集軟件從其他房地產(chǎn)相關(guān)網(wǎng)站上采集到的數(shù)據(jù),然后把這種數(shù)據(jù)添加到庫里面的數(shù)據(jù)添加方式。采集到的數(shù)據(jù)有以下特點:他的數(shù)量很龐大,是房產(chǎn)導(dǎo)航數(shù)據(jù)的主要來源,因為互聯(lián)網(wǎng)上有很多其他的房地產(chǎn)相關(guān)的網(wǎng)站,因此這種是來源最廣的一種數(shù)據(jù)添加方式;他的可靠性比較高,這部分從其他網(wǎng)站采集來的數(shù)據(jù),是他們其他網(wǎng)站經(jīng)過處理后的數(shù)據(jù)集,因此他的可靠性、真實性都比較高;有些數(shù)據(jù)的處理難度比較大,因為有些網(wǎng)站的數(shù)據(jù)設(shè)置了保護(hù),在采集數(shù)據(jù)的時候不可能那么全面的采集到整條完整的數(shù)據(jù),這個時候,就需要我們在處理的時候根據(jù)房源信息提取出有用的完整的數(shù)據(jù),無形之中就增加了我們的工作力度;他的日常數(shù)據(jù)添加量不穩(wěn)定,一般沒有特殊情況下,每個城市每天新添加的數(shù)據(jù)量都是相同的,但是當(dāng)某個城市在當(dāng)天發(fā)現(xiàn)了新的房產(chǎn)方面的網(wǎng)站的時候,這個城市的采集數(shù)據(jù)的添加量就會忽然間增加,如果發(fā)現(xiàn)網(wǎng)站大的話就可能會持續(xù)幾天采集數(shù)據(jù)添加量都處于很高的水平,直至把新發(fā)現(xiàn)網(wǎng)站的數(shù)據(jù)采集完畢,城市的每日采集數(shù)據(jù)量就會恢復(fù)正常水平;這種采集添加數(shù)據(jù)的方式,是應(yīng)用最多也是對房產(chǎn)導(dǎo)航數(shù)據(jù)量貢獻(xiàn)最大的方式,他的采集限制相比來說比較多,因此采集到的數(shù)據(jù)的規(guī)范性更大,處理起來難度也會相應(yīng)降低。

第七章刪除數(shù)據(jù)7.1手工刪除手工刪除是指直接從數(shù)據(jù)庫中把數(shù)據(jù)刪除掉,這條數(shù)據(jù)就作為無用數(shù)據(jù)徹底的從數(shù)據(jù)庫中消失,從而保持了房價的穩(wěn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論