版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
人工智能之?dāng)?shù)據(jù)挖掘ResearchReportofDataMining1目錄摘要 .第一篇 概述第二篇 技術(shù)
1.1數(shù)據(jù)挖掘基本概念. 1.2數(shù)據(jù)挖掘知識(shí)圖譜 1.3近年SIGKDD概況 .4近年D部分文革解讀…… 2第篇 人才
2.1統(tǒng)計(jì)數(shù)據(jù)分析..2.2基于機(jī)器學(xué)習(xí)的數(shù)據(jù)挖掘.. 512.3…2.4自然中的數(shù)據(jù)挖掘 大數(shù)據(jù)理 3第四篇 應(yīng)用
3.1學(xué)者情況概覽 3.2學(xué)者簡(jiǎn)介 3.3部分....1074.1零售業(yè)4.2旅游業(yè)4.3物流業(yè) 4.4醫(yī)學(xué)界 第五篇 國(guó)內(nèi)外工業(yè)界在上的研究118Arnawn 125Microsoft 128Facebook 131阿巴巴(ibaba) 132騰訊(139百度(Baidu) 141第六篇 趨勢(shì)夕`,,
6.1發(fā)展趨勢(shì)56.2技術(shù)預(yù)見(jiàn) 466.3叉研究熱析參考文獻(xiàn) 150附錄 圖表目錄圖1數(shù)挖是識(shí)的過(guò)之一 3圖2數(shù)挖過(guò)基驟 5圖3DataMining知圖譜 6圖42013-2018KDD性論投與收況 7圖52013-2018KDD界論投與收況 8圖6柯烏大戰(zhàn)AlphaGo撼后微熱議 43圖7兩微名的點(diǎn)贊據(jù)箱圖 45圖8組較組較頻率布方圖 47圖9相均和差同數(shù)據(jù) 52圖10k=3的K-means算法迭代程 53圖11神元 59圖12神網(wǎng)絡(luò) 59圖13Girvan-Newman算法結(jié)果 66圖14基化Q值法結(jié)果 67圖15Louvain算法驟 68圖16Skip-Gram模型構(gòu) 70圖17話模的率圖 73圖18大據(jù)理臺(tái)術(shù)架圖 74圖19基開(kāi)系的數(shù)據(jù)理臺(tái)構(gòu) 75圖20全學(xué)分地圖 77圖21國(guó)學(xué)分地圖 77圖22數(shù)挖領(lǐng)球Top1000學(xué)遷圖 78圖23數(shù)挖球Top1000者構(gòu)布 78圖24數(shù)挖球Top1000者h(yuǎn)-index布圖 79圖25數(shù)挖球Top1000者別比 79圖26兩段交推方法 119圖27視推()視頻索右) 120圖28方框架 120圖29視推的測(cè)果 121圖30YouTube-8M數(shù)上的頻索 121圖31抽系的構(gòu)圖 122圖32數(shù)偏差 122圖33數(shù)集實(shí)結(jié)果 123圖34同submodular比較果 124圖35共表層 124圖36UCI數(shù)據(jù)的結(jié)果 125圖37Google據(jù)實(shí)結(jié)果 125圖38PG型、MPG版本 126圖39在系的A/B126圖40框結(jié)構(gòu) 127圖41實(shí)結(jié)果 127圖42MicrosoftBing的視化索 129圖43算展示 129圖44降過(guò)程 130圖45RBE模型 131圖46Rosetta兩段取架構(gòu) 132圖47系的體計(jì) 134圖48DPG-FBE 134圖49阿巴的視搜索 135圖50可化索統(tǒng)離線習(xí)左在搜系統(tǒng)總架() 135圖51基注力制絡(luò)和RNN的度構(gòu) 136圖52排過(guò)程 136圖53電商網(wǎng)中品的示習(xí) 137圖54SI輔助息 137圖55多級(jí)排模型 138圖56鯤的體構(gòu) 138圖57conv-RNN框架 139圖58局匹圖 140圖59關(guān)增的體示 141圖60生有義醫(yī)關(guān)系 141圖61提實(shí)??尚孕诺募軋D 142圖62研城中的動(dòng) 143圖63大模際聘據(jù)系統(tǒng) 144圖64DataMining局點(diǎn) 145圖65DataMining期點(diǎn) 145圖66DataMining期點(diǎn) 145圖672007今DataMining與HealthCare領(lǐng)交分析 147圖68DataMining與HealthCare未來(lái)3交研趨勢(shì)測(cè) 148表1數(shù)挖和KDD比圖 2表2數(shù)挖分表 3表3兩比受迎博名在2018年3月到2018年5間一分博數(shù)據(jù) 44表4LDA模中變標(biāo)記 7311摘要(DataACMSIGKDDkNNSIGKDD基于AMinerh-indexAMiner數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域與發(fā)展趨勢(shì)。數(shù)據(jù)挖掘無(wú)論是在科學(xué)領(lǐng)域還是工程領(lǐng)域、理論研究AMiner概述篇數(shù)據(jù)挖掘基本概念(Data早期數(shù)據(jù)挖掘并不是作為單獨(dú)學(xué)科存在,追溯到30年前,GregoryI.Piatetsky-Shapiro(也是KDnuggets的創(chuàng)始人)等人于1989年8月在美國(guó)底特律的國(guó)際人工智能聯(lián)合會(huì)議(KnowledgeDiscoveryin30年KDD1995KDD。1995ACMKDDACMSIGKDD(ACMSIGKDDConferenceonKnowledgeDiscoveryandDataMining,SIGKDD)SIGKDD1.2SIGKDDweb2。數(shù)據(jù)挖掘是KDD的一個(gè)關(guān)鍵步驟,下表對(duì)二者做一比較。表1數(shù)據(jù)挖掘和KDD對(duì)比圖輸出不同共同點(diǎn)數(shù)據(jù)挖掘模型輸入的都是學(xué)習(xí)集(learningsets)目的都是盡可能多的自動(dòng)化數(shù)據(jù)挖掘過(guò)程知識(shí)發(fā)現(xiàn)規(guī)則1/curriculum/index.html2王惠中,彭安群數(shù)據(jù)挖掘研究現(xiàn)狀及發(fā)展趨勢(shì)[J]工礦動(dòng)化,2011(2)233 評(píng)估與表示評(píng)估與表示數(shù)據(jù)挖掘知識(shí)選擇與轉(zhuǎn)換清理與集成數(shù)據(jù)倉(cāng)庫(kù)一般文件圖1數(shù)據(jù)挖掘是知識(shí)發(fā)現(xiàn)的過(guò)程之一IBMRakeshAgrawal(IBMFellow、MSTechnicalFellowACMSIGKDDUIUC(JiaweiHan)Tree算法ACMSIGKDDJohnRossQuinlanACMSIGKDD)GoodmanIBM1996IntellingentMinerSPAAEnterpriseMinerSGISetMinerSybase公司的WaehuseSudCoeSoEXPOAoedgeDsoerokbenhBne、Quest等等。數(shù)據(jù)挖掘分類表2數(shù)據(jù)挖掘分類表分類方依據(jù)分類按挖掘的數(shù)據(jù)庫(kù)類型文字型網(wǎng)絡(luò)型Time型Space型按挖掘的知識(shí)類型高抽象層原始數(shù)據(jù)層多個(gè)抽象層按所用技術(shù)類型模式識(shí)別神經(jīng)網(wǎng)絡(luò)可視化統(tǒng)計(jì)學(xué)面向數(shù)據(jù)庫(kù)或倉(cāng)庫(kù)技術(shù)Time型、Space3。3王桂芹,黃道數(shù)據(jù)挖掘技術(shù)綜述[J]電腦應(yīng)用技術(shù)2007(69):10-11.PAGE4JiaweiHan,MichelineKamber,JianPei,etal.數(shù)據(jù)挖掘PAGE4JiaweiHan,MichelineKamber,JianPei,etal.數(shù)據(jù)挖掘:概念與技術(shù)[M].機(jī)械工業(yè)出版社,2012.44。按應(yīng)用分類數(shù)據(jù)挖掘過(guò)程數(shù)據(jù)挖掘過(guò)程中各步驟的大體內(nèi)容如下:PAGEPAGE10邏輯邏輯數(shù)據(jù)庫(kù)被選擇的數(shù)據(jù)預(yù)處理后的數(shù)據(jù)被轉(zhuǎn)換的數(shù)據(jù)被抽取的信息被同化的信息分析和同化挖掘轉(zhuǎn)換預(yù)處理選擇圖2數(shù)據(jù)挖掘過(guò)程基本步驟第三步:進(jìn)行數(shù)據(jù)挖掘。對(duì)得到的經(jīng)過(guò)轉(zhuǎn)換的數(shù)據(jù)進(jìn)行挖掘。第四步:結(jié)果分析。解釋并評(píng)估結(jié)果,其使用的分析方法一般應(yīng)視數(shù)據(jù)挖掘操作而定,通常會(huì)用到可視化技術(shù)。第五步:知識(shí)的同化。將分析所得到的知識(shí)集成到所要應(yīng)用的地方去5。數(shù)據(jù)挖掘功能大數(shù)據(jù)與數(shù)據(jù)挖掘4V4VNIST的(Velocity)(Variability)IBMVariability后來(lái)將5V(McKinseyGlobal5王桂芹,黃道.數(shù)據(jù)挖掘技術(shù)綜述[C]全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集,2007大數(shù)據(jù)的快速發(fā)展極大的促進(jìn)了數(shù)據(jù)挖掘領(lǐng)域的發(fā)展。數(shù)據(jù)挖掘知識(shí)圖譜下圖是數(shù)據(jù)挖掘二級(jí)知識(shí)圖譜的可視化表示,三級(jí)詳細(xì)數(shù)據(jù)可以參見(jiàn)本報(bào)告附錄,或到/data中直接下載原始數(shù)據(jù)。圖3DataMining知識(shí)圖譜SIGKDD概況(ACMSIGKDDConferenceonKnowledgeDiscoveryandDataACM2010SIGKDD1989199524SIGKDDSIGKDD每年的大會(huì)都會(huì)吸引大量的研究界和工業(yè)界的投稿。圖4和圖5分別給出了KDD(Research(IndustrialAppliedDataScience14%-20%201850020%120010008006004002000
ResearchTrack103698372681304260511036983726813042605125111117487848191submitted accepted SUBannualgrowth ACCannualgrowth
50.0%40.0%30.0%20.0%10.0%0.0%-10.0%-20.0%-30.0%圖42013-2018KDD研究性論文投稿與接收情況6005004003002001000
AppliedDataScienceTrack496390331197136341894963903311971363418912866668441submitted accepted SUBannualgrowth ACCannualgrowth
80.0%60.0%40.0%20.0%0.0%-20.0%圖52013-2018KDD工業(yè)界論文投稿與接收情況SIGKDDSIGKDDSIGKDD20132013811-1419(SIGKDD2013)SIGKDD2013RamasamyUthurusamyRobertGrossmanInderjitS.DhillonGoogleYehudaKoren50300501200SIGKDD2013507263125(66(Presentation)59SIGKDD2013RaghuRamakrishnanAndrewNgStephenJ.WrightGoogleHalVarianSIGKDD2013的具體獲獎(jiǎng)情況如下:最佳研究性論文最佳論文獎(jiǎng)SimpleandDeterministicMatrixSketching簡(jiǎn)易及確定性矩陣草圖作者:EdoLiberty摘要:該論文研究的問(wèn)題是針對(duì)給定的矩陣A,如何能找到一個(gè)更小的壓縮矩陣B對(duì)原矩陣A進(jìn)行估計(jì),這是基于社交網(wǎng)絡(luò)大數(shù)據(jù)分析中的一個(gè)關(guān)鍵問(wèn)題。地址:/archive/simple-and-deterministic-matrix-sketching/53e9b500b7602d970402e5e6最佳論文獎(jiǎng)第二名QueryingDiscriminativeandRepresentativeSamplesforBatchModeActiveLearning批量模式主動(dòng)學(xué)習(xí)的查詢判別樣本和代表性樣本作者:ZhengWang,JiepingYe摘要:他們解決了在主動(dòng)學(xué)習(xí)中如何能夠挑選同時(shí)具有代表性又具有區(qū)分性的樣本。地址:/archive/querying-discriminative-and-representative-samples-for-batch-mode-active-learning/53e9bba7b7602d97047f32a6最佳學(xué)生論文獎(jiǎng)Aspaceefficientstreamingalgorithmfortrianglecountingusingthebirthdayparadox一種利用生日悖論的空間高效三角形計(jì)數(shù)流算法作者:MadhavJha、C.Seshadhri、AliPinar摘要:該論文設(shè)計(jì)了一種節(jié)省空間的算法,該算法近似于傳遞性(全局聚類系數(shù))和總/數(shù)量的實(shí)時(shí)估計(jì)。地址:/archive/a-space-efficient-streaming-algorithm-for-triangle-counting-using-the-birthday-paradox/53e9999eb7602d97021e514e最佳學(xué)生論文獎(jiǎng)第二名RecursiveRegularizationforLarge-scaleClassificationwithHierarchicalandGraphicalDependencies具有層次結(jié)構(gòu)和圖形依賴性的大規(guī)模分類的遞歸正則化作者:SiddharthGopal、YimingYang摘要class-labels2.地址:/archive/recursive-regularization-for-large-scale-classification-with-hierarchical-and-graphical-dependencies/53e9aac3b7602d97034430d3AmplifyingtheVoiceofYouthinAfricaviaTextAnalytics通過(guò)文本分析放大非洲年輕人的心聲。作者:PremMelville及UNICEF的多名研究人員地址:/archive/amplifying-the-voice-of-youth-in-africa-via-text-analytics/53e9b09fb7602d9703b07333最佳論文獎(jiǎng)第二名QueryClusteringbasedonBidLandscapeforSponsoredSearchAuctionOptimization基于競(jìng)價(jià)格局的查詢聚類對(duì)贊助搜索競(jìng)價(jià)優(yōu)化作者:微軟公司以YeChen為代表的一眾人摘要:集群查詢更小但更有效的微市場(chǎng),定義為基于集群的拍賣(mài)參數(shù)。地址:/archive/query-clustering-based-on-bid-landscape-for-sponsored-search-auction-optimization/53e9af2cb7602d9703964e4f最佳博士論文最佳博士畢業(yè)論文MiningHeterogeneousInformationNetworks挖掘異構(gòu)信息網(wǎng)絡(luò)作者:YizhouSun博士,其導(dǎo)師為韓家煒(JiaweiHan)教授摘要種半結(jié)構(gòu)化異構(gòu)網(wǎng)絡(luò)建模為挖掘互聯(lián)數(shù)據(jù)提供了一系列新原則和強(qiáng)大的方法。地址:/archive/mining-heterogeneous-information-networks-a-structural-analysis-approach/53e9ae3cb7602d9703851185最佳博士畢業(yè)論文第二名MachineLearninginHealthInformatics:MakingBetteruseofDomainExperts健康信息學(xué)中的機(jī)器學(xué)習(xí):更好地利用領(lǐng)域?qū)<易髡撸築yronWallace博士,其導(dǎo)師為CarlaBrodley教授。摘要地址:/archive/machine-learning-in-health-informatics-making-better-use-of-domain-experts/56d890a4dabfae2eeee4ca4dSIGKDD創(chuàng)新和服務(wù)大獎(jiǎng)創(chuàng)新貢獻(xiàn)獎(jiǎng):JonKleinberg(康奈爾大學(xué))2013(InnovationAward)JonKleinbergJonKleinbergHITS。SIGKDDSIGKDD服務(wù)貢獻(xiàn)獎(jiǎng):GaborMelli(索尼互動(dòng)娛樂(lè))2013(ServiceGaborGaborMelliKDD1997數(shù)據(jù)集生成器。在2005年,他與伙伴共同創(chuàng)立了數(shù)據(jù)挖掘案例研究研討會(huì)系列(),并成為SIGKDD信息總監(jiān)。從那時(shí)起,他參與組織了許多CIKMKDD,CIKM,PAKDDACM2013年,GaborMelliKDD(/RKB/)的項(xiàng)目。SIGKDD杰出服務(wù)獎(jiǎng)主要授予在知識(shí)發(fā)現(xiàn)及數(shù)據(jù)挖掘領(lǐng)域作出重大服務(wù)貢獻(xiàn)的個(gè)人或KDDCUP競(jìng)賽第一名:Algorithm隊(duì)第二名:Dmitry&Leustagos&BSMan隊(duì)KDDCUP2013561241SIGKDD20142014824-2720(SIGKDD2014)DaaSceceorocalGod,F(xiàn)acebookSofusMacskassyDstillery公司的首席科學(xué)家ClaudiaPerlich博士共同擔(dān)任,研究性程序委員會(huì)主席由斯坦福大學(xué)JureLeskovecWeiWangRayidGhani)SocialAlphaPremMelville2320SIGKDD2014共收到1036篇研究性論文和197篇工業(yè)和政府應(yīng)用性論文投稿,雙雙高于SIGKDD2013相應(yīng)投稿數(shù)量的40%以上。每篇投稿文章由至少3名審稿人評(píng)審及1名相應(yīng)領(lǐng)域的高級(jí)程序委員協(xié)調(diào)討論并推薦,最終由程序委員會(huì)主席決定是否錄取。在46名高級(jí)程序委員和340名評(píng)審人的共同努力下,本次大會(huì)最終錄取151篇研究性論文(錄用率約14.6%)和44篇工業(yè)和政府應(yīng)用性論文(錄用率約22%)。中國(guó)大陸學(xué)者作為第一作者在本屆大會(huì)共發(fā)表13篇相關(guān)研究論文,作者來(lái)自清華大學(xué)、80SIGKDD2014。SIGKDD2014OrenEtzioniEricHorvitzEricSchadtSendhilMullainathanDanDoctoroff先生SIGKDD2014除了經(jīng)典的最佳論文、最佳學(xué)生論文等獎(jiǎng)項(xiàng)外,還設(shè)置了與會(huì)議主題有關(guān)的論文獎(jiǎng)項(xiàng),具體的獲獎(jiǎng)情況如下:最佳研究性論文最佳論文獎(jiǎng)ReducingtheSamplingComplexityofTopicModels減少主題模型的采樣復(fù)雜度作者:AaronQ.Li、AmrAhmed、SujithRavi及AlexanderJ.Smola摘要:該論文研究如何降低主題模型求解過(guò)程中的采樣復(fù)雜度,其提出的算法比傳統(tǒng)方法提高一個(gè)數(shù)量級(jí)的時(shí)間復(fù)雜度。地址:/archive/reducing-the-sampling-complexity-of-topic-models/5550453745ce0a409eb549bd最佳學(xué)生論文獎(jiǎng)AnEfficientAlgorithmForWeakHierarchicalLasso弱層次套索的一種有效算法作者:YashuLiu、JieWang、JiepingYe地址:https:///archive/an-efficient-algorithm-for-weak-hierarchical-lasso/5550453745ce0a409eb549c3最佳主題論文TargetingDirectCashTransferstotheExtremelyPoor定位極度貧困人口直接發(fā)放現(xiàn)金作者:Enigma、GiveDirectly的研究者們地址:/archive/targeting-direct-cash-transfers-to-the-extremely-poor/5550453645ce0a409eb549aa最佳工業(yè)和政府論文StyleintheLongTail:DiscoveringUniqueInterestswithLatentVariableModelsinLargeScaleSocialE-commerce長(zhǎng)尾設(shè)計(jì):在大型社交電子商務(wù)中通過(guò)潛在的變量模型發(fā)現(xiàn)獨(dú)特的興趣作者:DianeJ.Hu,RobHall和JoshAttenberg摘要:該論文描述了在Etsy站點(diǎn)上部署兩個(gè)基于樣式的新推薦系統(tǒng)的方法和實(shí)驗(yàn)。其使用了LatentDirichletAllocation(LDA)來(lái)發(fā)現(xiàn)Etsy上的趨勢(shì)類別和樣式,然后用它們來(lái)map-reducewith-latent-variable-models-in-large-scale-social-e-commerce/5550453645ce0a409eb5491d最佳博士論文ReconstructionandApplicationsofCollectiveStorylinesfromWebPhotoCollections將來(lái)自網(wǎng)頁(yè)照片集合中的集合故事線重構(gòu)、應(yīng)用作者:GunheeKim博士,其導(dǎo)師為EricXing教授摘要:該論文的目標(biāo)是通過(guò)聯(lián)合推斷圖像集的時(shí)間趨勢(shì)和重疊內(nèi)容,來(lái)創(chuàng)建集體故事情地址:/qeyTTacH時(shí)間檢測(cè)獎(jiǎng)(TestofTime)SIGKDD2014TestofTime20KDD大以下三篇論文在2014年獲此殊榮:ADensity-BasedAlgorithmforDiscoveringClustersinLargeSpatialDatabaseswithNoise(KDD1996)一種基于密度的具有噪聲的大型空間數(shù)據(jù)庫(kù)集群發(fā)現(xiàn)算法作者:MartinEster、Hans-PeterKriegel、JoergSander、XiaoweiXu摘要:該論文提出的DBSCAN算法對(duì)基于密度的聚類算法產(chǎn)生了巨大的影響,并已成為聚類算法中公認(rèn)的重要算法之一。地址:/archive/a-density-based-algorithm-for-discovering-clusters-in-large-spatial-databases-with-noise/53e9bd7bb7602d9704a1d173IntegratingClassificationandAssociationRuleMining(KDD1998)集成分類和關(guān)聯(lián)規(guī)則挖掘作者:劉兵、WynneHsu、LinkedIn公司的YimingMa摘要地址:/archive/integrating-classification-and-association-rule-mining/53e9aefcb7602d9703930008MaximizingtheSpreadofInfluencethroughaSocialNetwork(KDD2003)通過(guò)社交網(wǎng)絡(luò)最大化影響力擴(kuò)散度作者:DavidKempe、JonKleinberg、EvaTardos摘要:該論文是社交網(wǎng)絡(luò)中影響力最大化問(wèn)題研究的里程碑式工作,其在數(shù)學(xué)上證明了求解該類問(wèn)題算法的性能指標(biāo)界限,為此領(lǐng)域后繼研究工作提供了理論支持。地址:/archive/maximizing-the-spread-of-influence-through-a-social-network/53e9b6d1b7602d970425d749SIGKDD創(chuàng)新和服務(wù)大獎(jiǎng)創(chuàng)新貢獻(xiàn)獎(jiǎng):Prof.PedroDomingos(UniversityofWashington)SIGKDD2014PedroDomingosDomingos、AAAI、UAI和NIPS等國(guó)際會(huì)議的最佳論文獎(jiǎng)。服務(wù)貢獻(xiàn)獎(jiǎng):Dr.TedSenator(Leidos)KDDCUPKDDCUP2014DonorsChoos652名人員組成的472支隊(duì)伍參與,比賽冠軍最終由“STRAYA”團(tuán)隊(duì)獲得。SIGKDD20152015810-1321(SIGKDD2015)本屆大會(huì)主席由澳大利亞悉尼科技大學(xué)工程與信息技術(shù)學(xué)院操龍兵教授和悉尼科技大學(xué)信息技術(shù)學(xué)院ChengqiZhang教授共同擔(dān)任,研究性程序委員會(huì)主席由康奈爾大學(xué)ThorstenJoachimsGeoffWebbDragosD.MargineantuPexipGrahamWilliams共同擔(dān)任。SIGKDD2015大會(huì)收到了1008篇稿件。其中研究論文819篇,錄用160篇(錄用率約19.5%);政府和工業(yè)屆應(yīng)用論文189篇,錄用68篇(錄用率約35.9%)。中國(guó)大陸學(xué)者作1490SIGKDDRonnyKohaviDurrant-Whyte教授,CourseraDaphneKollerSusanAtheySIGKDD2015的具體獲獎(jiǎng)情況如下:最佳研究性論文最佳論文獎(jiǎng)EfficientAlgorithmsforPublic-PrivateSocialNetworks公共-私人的社交網(wǎng)絡(luò)高效算法作者aoChecheAesndoEpasRaiuaSoaanzi及VahabMokni摘要地址:/papers/kdd2015.pdf最佳學(xué)生論文獎(jiǎng)Edge-WeightedPersonalizedPageRank:BreakingaDecade-OldPerformanceBarrier邊緣加權(quán)個(gè)性化網(wǎng)頁(yè)排序:打破十年來(lái)的性能障礙作者:WenleiXie、DavidBindel、AlanDemers和JohannesGehrke摘要地址:/archive/edge-weighted-personalizedrank-breaking-a-decade-old-performance-barrier/5736973c6e3b12023e62b916最佳博士論文最佳博士畢業(yè)論文MiningLatentEntityStructuresfromMassiveUnstructuredandInterconnectedData從大量非結(jié)構(gòu)化和互連的數(shù)據(jù)中挖掘潛在的實(shí)體結(jié)構(gòu)作者:ChiWang博士,其導(dǎo)師為韓家煒(JiaweiHan)教授。摘要:大數(shù)據(jù)時(shí)代背景下,信息量之龐大,覆蓋人類日常生活的方方面面,但有價(jià)值且地址:https:///archive/mining-latent-entity-structures-from-massive-unstructured-and-interconnected-data/555048b845ce0a409eb70bc0最佳博士畢業(yè)論文第二名ModelingLargeScaleSocialNetworkinContext從語(yǔ)境中模擬大型社交網(wǎng)絡(luò)作者:QirongHo博士,導(dǎo)師為EricXing教授摘要:如今社交網(wǎng)絡(luò)和互聯(lián)網(wǎng)包含數(shù)以百萬(wàn)計(jì)甚至數(shù)十億計(jì)的節(jié)點(diǎn),以及大量的側(cè)信息(:(1),,在一起,確保可伸縮性很大的網(wǎng)絡(luò)。本文提出的方法將統(tǒng)計(jì)模型的靈活性與數(shù)據(jù)挖掘和社會(huì)網(wǎng)motif1地址:/anon/ml2014/CMU-ML-14-100.pdfComputingDistrustinSocialMedia社交媒體的不信任度計(jì)算作者:JiliangTang博士,其導(dǎo)師HuanLiu教授地址:/items/28550時(shí)間檢測(cè)獎(jiǎng)(TestofTimeAward)MiningHigh-SpeedDataStreams(KDD2000)挖掘高速數(shù)據(jù)流作者:PedroDomingos、GeoffHulten摘要:該論文提出了VFDT這一實(shí)時(shí)數(shù)據(jù)流挖掘系統(tǒng),用于快速處理不斷增長(zhǎng)的數(shù)據(jù)記錄。地址:https:///archive/mining-high-speed-data-streams/53e9b055b7602d9703ab8cf1OptimizingSearchEnginesUsingClick-ThroughData(KDD2002)使用可點(diǎn)擊數(shù)據(jù)來(lái)最優(yōu)化搜索引擎作者:ThorstenJoachims摘要:該論文率先提出了通過(guò)挖掘利用用戶點(diǎn)擊數(shù)據(jù)從而提高搜索引擎結(jié)果準(zhǔn)確率的方論文地址:https:///archive/optimizing-search-engines-using-clickthrough-data/53e9b042b7602d9703aa0d88MiningandSummarizingCustomerReviews(KDD2004)挖掘與匯總消費(fèi)者點(diǎn)評(píng)作者:MinqingHu、劉兵教授地址:https:///archive/mining-and-summarizing-customer-reviews/53e9af46b7602d97039827ecSIGKDD創(chuàng)新和服務(wù)大獎(jiǎng)創(chuàng)新貢獻(xiàn)獎(jiǎng):Prof.HansPeterKriegel(UniversityofMunich)(InnovationAward)HansPeterKriegelPeterKriegel2014KDDTestofTimeACMfellow。服務(wù)貢獻(xiàn)獎(jiǎng):Prof.JianPei(SimonFraserUniversity)(ServiceAward)JianPeiICDMSDMCIKMTKDEKDDCUP競(jìng)賽第一名:theIntercontinentalEnsembleKDDCUP2015RonBekkerman261263821—“theIntercontinentalEnsembleSIGKDD20162016813-1722(SIGKDD2016)SIGKDD2016大會(huì)主席由IBM公司的BalajiKrishnapuram博士和BOSCH公司的MohakShah(PCCo-Chairs)Amazon公司AlexSmolaIBMCharuAggarwalTrackTrack(AppliedDataScienceTrack)IBMRastogiRajeevDouShen882726SIGKDD2016大會(huì)收到784篇研究性論文和331篇應(yīng)用數(shù)據(jù)科學(xué)論文投稿,其中研究性論文的數(shù)量相比2015年的1008篇和2014年的1036篇有所減少,而應(yīng)用數(shù)據(jù)科學(xué)論文則相比往年有了很大的增加。本次大會(huì)最終錄取142篇研究性論文(錄用率約18.1%)和66篇應(yīng)用數(shù)據(jù)科學(xué)論文(錄用率約20%)。SIGKDD2016JenniferChayes博士,JoeHellersteinGregPapadopoulosGoogleDeepMindNandodeFreitas2015ACMWhitfieldDiffieSIGKDDSIGKDD2016具體獲獎(jiǎng)情況為:最佳研究性論文最佳論文獎(jiǎng)FRAUDAR:BoundingGraphFraudintheFaceofCamouflage欺詐者:面部偽裝中的邊界圖片欺詐作者:BryanHooi、HyunAhSong、AlexBeutel、NeilShah、KijungShin、ChristosFaloutsos地址:/archive/fraudar-bounding-graph-fraud-in-the-face-of-camouflage/57aa28de0a3ac518da9896dc最佳論文獎(jiǎng)第二名RankingCausalAnomaliesviaTemporalandDynamicalAnalysisonVanishingCorrelations基于消除相關(guān)性并通過(guò)臨時(shí)、動(dòng)態(tài)分析排序來(lái)排序異?,F(xiàn)象的因果關(guān)系作者:WeiCheng、KaiZhang、HaifengChen、GuofeiJiang、ZhengzhangChen、WeiWang摘要:為了解決這些局限性,本文提出了一個(gè)基于網(wǎng)絡(luò)擴(kuò)散的框架來(lái)識(shí)別重要的因果異地址:https:///archive/ranking-causal-anomalies-via-temporal-and-dynamical-analysis-on-vanishing-correlations/57aa28de0a3ac518da9896ca最佳學(xué)生論文獎(jiǎng)TRIèST:CountingLocalandGlobalTrianglesinFully-dynamicStreamswithFixedMemorySize在固定內(nèi)存大小的全動(dòng)態(tài)流中計(jì)算本地三角形和全局三角形作者:orenzoDeStefani等人摘要地址:https:///archive/tri-st-counting-local-and-global-triangles-in-fully-dynamic-streams-with-fixed-memory-size/599ee0589c05d3074f0123ac最佳學(xué)生論文獎(jiǎng)第二名PredictingMatchupsandPreferencesinContext預(yù)測(cè)語(yǔ)境下的匹配與偏好作者:ShuoChen、ThorstenJoachims摘要和)地址:https:///archive/predicting-matchups-and-preferences-in-context/57aa28de0a3ac518da9896cbRankingRelevanceinYahooSearch排序雅虎搜索中的關(guān)聯(lián)性作者YueningJiliangTimDalyMianweiHua、JianhuiChangsungHongboChikashiJean-MarcYiChang摘要20查詢重寫(xiě)三大關(guān)鍵技術(shù),以及時(shí)間、位置相關(guān)的搜索。地址:https:///archive/ranking-relevance-in-yahoo-search/57aa28de0a3ac518da98974b最佳論文獎(jiǎng)第二名MatrixComputationsandOptimizationinApacheSparkApacheSpark中的矩陣計(jì)算與最優(yōu)化作者:RezaBosaghZadeh、XiangruiMeng、AlexanderUlanov、BurakYavuz、LiPu、ShivaramVenkataraman、EvanSparks、AaronStaple、MateiZaharia摘要:該論文中主要闡述了一種集群程序框架運(yùn)算ApacheSpark中可用的矩陣計(jì)算。論文中的主要貢獻(xiàn)已經(jīng)合并入ApacheSpark,在Spark安裝時(shí)屬默認(rèn)設(shè)置可用。地址:https:///archive/matrix-computations-and-optimization-in-apache-spark/56d845aedabfae2eeeac4830最佳學(xué)生論文獎(jiǎng)ContextualIntentTrackingforPersonalAssistants用于個(gè)人助理的上下文意圖追蹤作者:YuSun等人摘要:這篇文章研究了如何為個(gè)人助理軟件提供準(zhǔn)確的用戶意圖分析。地址:https:///archive/contextual-intent-tracking-for-personal-assistants/57aa28de0a3ac518da98974c最佳學(xué)生論文獎(jiǎng)第二名Firebird:PredictingFireRiskandPrioritizingFireInspectionsinAtlantaFirebird(數(shù)據(jù)庫(kù)):預(yù)測(cè)亞特蘭大火災(zāi)風(fēng)險(xiǎn)并預(yù)先進(jìn)行火險(xiǎn)安全檢查作者M(jìn)adaioShang-TseChenOliverHaimsoWenwenZhangXiangCheng、MatthewHinds-AldrichDuenHorngChauBistraDilkina摘要:與AtlantaFireRescueDepartment(AFRD)合作,作者們開(kāi)發(fā)了Firebird框架,使用機(jī)器學(xué)習(xí)、地理編碼和信息可視化,以幫助亞特蘭大市政消防部門(mén)識(shí)別和優(yōu)先安排商業(yè)500071%AFRD6096AFRD對(duì)火AFRD的(NFPA)地址:https:///archive/firebird-predicting-fire-risk-and-prioritizing-fire-inspections-in-atlanta/573695fe6e3b12023e511d3c最佳博士論文最佳博士論文Dissertation:ExploringandMakingSenseofLargeGraphs畢業(yè)論文:探索理解大規(guī)模圖形作者:DanaiKoutra博士,其導(dǎo)師為ChristosFaloutsos教授。6618Twitter9000地址:/anon/2015/CMU-CS-15-126.pdf最佳博士論文第二MiningDisparateSourcesforQuestionAnswering挖掘不同來(lái)源以供解答作者:HuanSun博士,其導(dǎo)師為XifengYan教授摘要過(guò)問(wèn)答交互解決一系列問(wèn)題并做出決策。地址:/~sun.397/ResearchProj.htmlScalableMultivariateTimeSeriesAnalysis可擴(kuò)展的多元時(shí)間序列分析作者:TahaBahadori博士,其導(dǎo)師為YanLiu教授摘要地址:/cdm/ref/collection/p15799coll3/id/593708時(shí)間檢測(cè)獎(jiǎng)(TestofTimeAward)Graphsovertime:densificationlaws,shrinkingdiametersandpossibleexplanations(KDD2005)時(shí)間推移圖:致密化法律、縮小直徑和可能的解釋作者:JureLeskovec博士、JonKleinberg、ChristosFaloutsos摘要:這篇論文研究了真實(shí)網(wǎng)絡(luò)如何隨時(shí)間進(jìn)行演變,發(fā)現(xiàn)隨著時(shí)間增長(zhǎng),真實(shí)網(wǎng)絡(luò)通地址:https:///archive/graphs-over-time-densification-laws-shrinking-diameters-and-possible-explanations/53e9a515b7602d9702e37973SIGKDD創(chuàng)新和服務(wù)大獎(jiǎng)創(chuàng)新貢獻(xiàn)獎(jiǎng):PhilipS.Yu教授(伊利諾伊大學(xué)芝加哥分校)2016(InnovationPhilipS.YuS.Yu(ICDM)服務(wù)貢獻(xiàn)獎(jiǎng):WeiWang教授(加州大學(xué)洛杉磯分校)(ServiceWeiWangKDDCUP競(jìng)賽第一名:burebistas隊(duì)(Adform公司VladSandulescu,Bitdevelop公司MihaiChiru)T310B隊(duì)(YujieQian,YinpengDong,YeMa,HailongJin,JuanziLi)browniepointsreturns隊(duì)(LatentViewAnalytics公司MohanManivannan,NachiappanPalaniappan)KDDCUP20168CUPAdformVladSandulescuYujieQianLatentViewMohanManivannanKDDCUPSIGKDD20172017813-1723(SIGKDD2017)SIGKDD2017StanMatwinLinkedInShipengYuIBMWatsonWatsonHealthFaisalFarooqGoogleRaviKumarTinaEliassi-RadGoogleRobertoJBayardoCharlesElkan2018511656SIGKDD2017研究領(lǐng)域的審核總論文數(shù)為748篇,收錄130篇,包括64篇oral,66篇poster8.6%8.8%3908636oral,50poster9.2%12.6%。SIGKDD2017CynthiaDworkBinYu教授,多倫多大學(xué)計(jì)算機(jī)科學(xué)系的J.MillerSIGKDD2017具體獲獎(jiǎng)情況為:最佳研究性論文最佳論文獎(jiǎng)AcceleratingInnovationThroughAnalogyMining通過(guò)類比挖掘加速創(chuàng)新作者:TomHope、JoelChan、AniketKittur、DafnaShahaf摘要:這篇論文探討了學(xué)習(xí)大型概念資源庫(kù)更簡(jiǎn)單的結(jié)構(gòu)表征的可行性和價(jià)值,特別是“問(wèn)題模式”,它規(guī)定了產(chǎn)品的目的,以及實(shí)現(xiàn)該目的的機(jī)制。論文中的方法結(jié)合眾包和CNN,提取產(chǎn)品描述中的目的和機(jī)制向量表示。地址:/archive/accelerating-innovation-through-analogy-mining/5992a1185ba2006b76482dcf最佳論文獎(jiǎng)第二名ToeplitzInverseCovariance-BasedClusteringofMultivariateTimeSeriesData多變量時(shí)間序列數(shù)據(jù)的Toeplitz逆協(xié)方差聚類作者:DavidHallac、SagarVare、StephenBoyd、JureLeskovec摘要(EM)算法的一個(gè)變化,通過(guò)交替最小化來(lái)解決ToeplitzInverseCovariance-basedTICCTICC地址:/archive/toeplitz-inverse-covariance-based-clustering-of-multivariate-time-series-data/599c798a601a182cd264948cHinDroid:AnIntelligentAndroidMalwareDetectionSystemBasedonStructuredHeterogeneousInformationNetworkHinDroid:基于結(jié)構(gòu)化的異構(gòu)信息網(wǎng)絡(luò)的智能Android惡意軟件檢測(cè)系統(tǒng)作者:ShifuHou、YanfangYe、YangqiuSong、MelihAbdulhayoglu摘要:這篇論文中,為了檢測(cè)Android惡意軟件,不再僅僅使用API調(diào)用,而是進(jìn)一步分析它們之間的不同關(guān)系,并創(chuàng)建更高層次的語(yǔ)義,這就讓攻擊者更難逃避被檢測(cè),將AndroidAPIAPI地址:https:///archive/hindroid-an-intelligent-android-malware-detection-system-based-on-structured-heterogeneous-information-network/59a02e2db161e8ad1a7b6db4最佳論文獎(jiǎng)第二名DeepSD:GeneratingHighResolutionClimateChangeProjectionsthroughSingleImageSuper-ResolutionDeepSD:基于單個(gè)圖像的超級(jí)解析生成高解析度的氣候變換預(yù)測(cè)作者:ThomasVandal、EvanKodra、SangramGanguly、AndrewMichaelis、RamakrishnaNemani、AuroopGangulySRCNN)DeepSDSRCNN1度(~100km)降至1/8度(~12.5km)的偏差校正空間分解和三種自動(dòng)統(tǒng)計(jì)降水量方法的比較。此外,還討論了一個(gè)使用美國(guó)國(guó)家航空航天局地球交換(NEX)平臺(tái)的框架,用于在多個(gè)發(fā)射場(chǎng)景下縮小20多個(gè)ESM模型。地址:https:///archive/deepsd-generating-high-resolution-climate-change-projections-through-single-image-super-resolution/599c796a601a182cd263b2d1最佳博士論文最佳博士畢業(yè)論文LocalModelingofAttributedGraphs:AlgorithmsandApplications屬性圖的局部建模:算法與應(yīng)用作者:BryanPerozzi博士,其導(dǎo)師為StevenSkiena教授地址:/publications/16_thesis.pdf最佳博士論文第二名UserBehaviorModelingwithLarge-ScaleGraphAnalysis用戶行為:基于大規(guī)模圖形分析的建模作者:AlexBeutel博士,導(dǎo)師為AlexSmola教授和ChristosFaloutsos教授。論文地址:/papers/CMU-CS-16-105.pdfMiningLargeMulti-AspectData:AlgorithmsandApplications挖掘多方面數(shù)據(jù):算法與應(yīng)用作者:EvangelosE.Papalexakis博士,其導(dǎo)師為ChristosFaloutsos教授。)地址:/EDpe時(shí)間檢驗(yàn)獎(jiǎng)(TestofTimeAward)TrainingLinearSVMsinLinearTime,KDD2006作者:ThorstenJoachims教授摘要:論文提出了第一種線性SVM的通用訓(xùn)練算法,這種縮放對(duì)于高維和稀疏數(shù)據(jù)非SVM地址:https:///archive/training-linear-svms-in-linear-time/53e9a5afb7602d9702edbd06SIGKDD創(chuàng)新和服務(wù)大獎(jiǎng)創(chuàng)新貢獻(xiàn)獎(jiǎng):裴健博士(西蒙弗雷澤大學(xué))(Innovation(FP-growthPrefixSpan服務(wù)貢獻(xiàn)獎(jiǎng):楊強(qiáng)博士(香港科技大學(xué))(Service(ACM2010PCACMKDD20122015IJCAIPCACMIUI2009,ACMRecSys2013IEEE2017ACMSIGKDD2017IJCAI2017IEEEAITen-to-WatchACM(ACMTIST)ACMTISTACMIEEESIGKDDKDDCUP競(jìng)賽旅行時(shí)間預(yù)測(cè)(TravelTimePrediction)組:第一名:Convolution隊(duì)(微軟的KeHu,北京航空航天大學(xué)的HuanChen,微軟的PanHuang,美團(tuán)公司的PengYan)第二名:好想有個(gè)隊(duì)友隊(duì)(浙江大學(xué)的HuangYide)體積預(yù)測(cè)(VolumePrediction)組:第一名:Convolution隊(duì)(微軟的KeHu,北京航空航天大學(xué)的HuanChen,微軟的PanHuang,美團(tuán)公司的PengYan)YitianJieJieLinHaoLinYangGuo)KDDCUP2017由阿里巴巴集團(tuán)云計(jì)算部門(mén)阿里巴巴云的團(tuán)隊(duì)組織,今年的競(jìng)賽題為KDDCUP2018(TravelTime(Volume3547Convolution(KeHuHuanChenPanHuangPengYan)SIGKDD20182018819-2324(SIGKDD2018)tranSMARTYi-KeGuoIBMWatsonWatsonHealthFaisalFarooqChih-JenHuiXiongGoogleAndreiBroderMyraSpiliopoulou993377名KDD2018。KDD2018共收到投稿論文1479篇,其中研究性論文983篇,創(chuàng)下新高,其中有107篇oral10.9%;74poster7.5%49640oral8.0%;72poster14.5%。KDD2018David2012AlvinE.RothDeepMindYeeWhyeThe,AvanessiansJeannetteM.Wing教授,進(jìn)行了四場(chǎng)大會(huì)主題報(bào)告。SIGKDD2018具體獲獎(jiǎng)情況為:最佳研究性論文最佳論文獎(jiǎng)AdversarialAttacksonClassificationModelsforGraphs對(duì)圖形分類模型的對(duì)抗性攻擊作者:DanielZügner、AmirAkbarnejad、StephanGünnemann摘要可轉(zhuǎn)移的:學(xué)到的攻擊方式可以推廣到其他最先進(jìn)的節(jié)點(diǎn)分類模型。地址:/uy96最佳學(xué)生論文獎(jiǎng)XiaoIceBand:AMelodyandArrangementGenerationFrameworkforPopMusicXiaoIceBand:流行音樂(lè)的旋律與編曲生成框架作者:HongyuanZhuQiNicholasJingYuanChuanJiawei、KunZhang、GuangZhou、FuruWei、YuanchunXuEnhongChen摘要()((MICA)。地址:https:///archive/xiaoice-band-a-melody-and-arrangement-generation-framework-for-pop-music/5b67b45517c44aac1c8607e9Real-timePersonalizationusingEmbeddingsforSearchRankingatAirbnb在Airbnb中使用嵌入式做搜索排名來(lái)實(shí)現(xiàn)實(shí)時(shí)的個(gè)性化作者:MihajloGrbovic(Airbnb)和HaibinCheng(Airbnb)摘要:嵌入式模型是為Airbnb量身定制的,能用于捕捉顧客的短期或長(zhǎng)期興趣,傳遞有效的住房推薦清單。在完全將他們部署到產(chǎn)品線上前,我們已經(jīng)做了嚴(yán)謹(jǐn)?shù)木€上線下測(cè)試。地址:https:///archive/real-time-personalization-using-embeddings-for-search-ranking-at-airbnb/5b67b45517c44aac1c8607cb最佳學(xué)生論文獎(jiǎng)ActiveRemediation:TheSearchforLeadPipesinFlint,Michigan積極整治:密歇根弗林特主管道搜索作者:JacobAbernethy(GeorgiaInstituteofTechnology)、AlexChojnacki(UniversityofMichigan)、AryaFarahi(UniversityofMichigan-AnnArbor)、EricSchwartz(UniversityofMichigan)和JaredWebb(BrighamYoungUniversity)摘要地址:https:///archive/activeremediation-the-search-for-lead-pipes-in-flint-michigan/5b67b45517c44aac1c860889最佳博士論文最佳博士畢業(yè)論文MiningEntityandRelationStructuresfromText:AnEffort-LightApproach從文本中挖掘?qū)嶓w和文本關(guān)系:一種輕松的方法作者:XiangRen博士,其導(dǎo)師為韓家煒(JiaweiHan)教授。地址:https:///bitstream/handle/2142/101001/REN-DISSERTATION-2018.pdf?sequence=1&isAllowed=y最佳博士論文第二名ProbabilisticModelsforCredibilityAnalysisinEvolvingOnlineCommunities用于線上社區(qū)可信度分析的概率模型作者:SubhabrataMurherjee博士,其導(dǎo)師為GerhardWeikum教授。摘要:我們提出了概率圖形模型,它可以利用在線社區(qū)中多個(gè)因素之間的聯(lián)合相互作用地址:/1137509414/34CharacterizationandDetectionofMaliciousBehaviorontheWeb網(wǎng)頁(yè)中惡意行為的特性描述和檢測(cè)作者:SrijanKumar博士,其導(dǎo)師為V.S.Subrahmanian教授。摘要web法的分析對(duì)網(wǎng)絡(luò)上的惡意行為形成了可解釋的理解。地址:/handle/1903/19420時(shí)間檢驗(yàn)獎(jiǎng)(TestofTimeAward)Factorizationmeetstheneighborhood:amultifacetedcollaborativefilteringmodel,KDD2008作者:YehudaKoren摘要Netflix100(地址:/archive/factorization-meets-the-neighborhood-a-multifaceted-collaborative-filtering-model/53e9bc74b7602d97048f4169SIGKDD創(chuàng)新和服務(wù)大獎(jiǎng)創(chuàng)新貢獻(xiàn)獎(jiǎng):劉兵教授(伊利諾伊大學(xué)芝加哥分校)創(chuàng)新獎(jiǎng)(InnovationAward)(UniversityofIllinoisatChicago2013ACMSIGKDD(2013712017630(SDM和PAKDD),他擔(dān)任TKDE,TWEB,DMKD等期刊的副主編;ACM、AAAI和IEEE的會(huì)士(Fellow)。服務(wù)獎(jiǎng):唐杰副教授(清華大學(xué))2018(ServiceAMiner2002010,0002018KDD'11-18TKDE/TBDPCACMTKDD/。KDDCUP競(jìng)賽FirstfloortoeatLatiao隊(duì)HaoranJiangBinliLuoJindongHan,JuanLiu,andQianqianZhang)getmaxZhipengJianqiangHuangfromKeHu)KDDCUP201848O3(PM2.5PM10)418056873000/49FirstfloortoeatLatiao微軟((GetmaxKDDCupConvolution團(tuán)隊(duì)也KDDCUP2017SGDD218eoeValkanas獲得,這一獎(jiǎng)項(xiàng)經(jīng)由SPC提名,審稿質(zhì)量及相應(yīng)討論表現(xiàn)突出。初創(chuàng)團(tuán)隊(duì)獎(jiǎng)(startupaaSDacMAAnlect及uga。1.4近年KDD部分文章解讀。SIGKDD2013論文解讀標(biāo)題:BigDataAnalyticswithSmallFootprint:SquaringtheCloud作者:JohnCannyHuashaZhao論文地址:/pdf/20160902/loc-conf/KDD/KDD-2013-1103.pdfBIDBIDMat工具包用于矩陣計(jì)算和BIDMath用于機(jī)器學(xué)習(xí),論文以聚類和分類算法為例,證明了這種新設(shè)計(jì)可以將單臺(tái)PC機(jī)處理數(shù)據(jù)的速度提高數(shù)十倍。KDD2013標(biāo)題:BigDataAnalyticswithSmallFootprint:SquaringtheCloud作者:JohnCannyHuashaZhao論文地址:/pdf/20160902/loc-conf/KDD/KDD-2013-1103.pdfBIDBIDMat工具包用于矩陣計(jì)算和BIDMath用于機(jī)器學(xué)習(xí),論文以聚類和分類算法為例,證明了這種新設(shè)計(jì)可以將單臺(tái)PC機(jī)處理數(shù)據(jù)的速度提高數(shù)十倍。標(biāo)題:BeyondMyopicInferenceinBigDataPipelines作者:KarthikRaman,AdithSwaminathan,JohannesGehrke,ThorstenJoachims論文地址:/upload/pdf/1365/1623/470/552e6c2545ce5a3f931832a0.pdf(ProbabilisticPipelineTop-K推斷、FixedBeam推斷以及Adaptive推斷的實(shí)際效果。標(biāo)題:TurboGraph:AFastParallelGraphEngineHandlingBillion-scaleGraphsinaSinglePC作者:Wook-ShinHan,SangyeonLee,KyungyeolPark,Jeong-HoonLee,Min-SooKim1,JinhaKim,HwanjoYu論文地址:/upload/pdf/365/1693/1669/552e7c5145ce5a3f931832ac.pdf論文解讀:相比傳統(tǒng)的圖計(jì)算引擎(如:GraphChi),TurboGraph有效的提高了輸入輸出的并發(fā)性。論文還提出一個(gè)叫做pin-and-slide的并行執(zhí)行模式,從引擎底層實(shí)現(xiàn)了大規(guī)模圖的并發(fā)分析。SessionSIGKDD2014論文解讀2014KDD6SIGKDDDataScienceforSocial3(UnitedNationsGlobalPulse)SIGKDD20055景下具有現(xiàn)實(shí)世界的可應(yīng)用性。以下是5篇論文簡(jiǎn)介:標(biāo)題:InferringUserDemographicsandSocialStrategiesinMobileSocialNetworks作者:YuxiaoDong,YangYang,JieTang,YangYang,NiteshV.Chawla論文地址:/archive/inferring-user-demographics-and-social-strategies-in-mobile-social-networks/5550453645ce0a409eb54966論文解讀:該文章發(fā)現(xiàn)了人類社交策略隨著其人生不同階段社交交往需求的變化過(guò)程,例如年輕人更趨向于不斷擴(kuò)展他們的朋友圈,并且積極與異性保持聯(lián)系;隨著年齡增長(zhǎng),當(dāng)人至中年或老年,則更多趨于保持小數(shù)量的但是更親密的同性朋友圈。基于此發(fā)現(xiàn),該團(tuán)隊(duì)根據(jù)人類手機(jī)的通話和短信使用模式準(zhǔn)確地預(yù)測(cè)了使用者的性別和年齡信息。標(biāo)題:EARSEarthquakeAlertandReportSystem):aRealTimeDecisionSupportSystemforEarthquakeCrisisManagement作者:MarcoAvvenuti,StefanoCresci,AndreaMarchetti,CarloMeletti,MaurizioTesconi論文地址:/archive/ears-earthquake-alert-and-report-system-a-real-time-decision-support-system-for-earthquake-crisis-management/5550453545ce0a409eb548e1論文解讀:該團(tuán)隊(duì)設(shè)計(jì)了一個(gè)基于實(shí)時(shí)社交媒體數(shù)據(jù)的地震預(yù)警和損害評(píng)估系統(tǒng),該系統(tǒng)可以實(shí)時(shí)地報(bào)告地震中人口和基礎(chǔ)設(shè)施層面的信息,并提供決策支持。標(biāo)題:PredictionofHumanEmergenceBehaviorandtheirMobilityfollowingLarge-scaleDisaster作者:XuanSong,QuanshiZhang,YoshihideSekimotoandRyosukeShibasaki論文地址:/archive/prediction-of-human-emergency-behavior-and-their-mobility-following-large-scale-disaster/5550453645ce0a409eb54982160GPS標(biāo)題:TargetingDirectCashTransferstotheExtremelyPoor作者:BrianAbelson,KushR.Varshney,JoySun論文地址:/archive/targeting-direct-cash-transfers-to-the-extremely-poor/5550453645ce0a409eb549aa論文解讀:他們的論文主要針對(duì)社會(huì)問(wèn)題,通過(guò)分析肯尼亞貧困村莊的衛(wèi)星遙感數(shù)據(jù)來(lái)鑒別極度貧窮家庭,以此為根據(jù)為他們提供無(wú)條件的人道主義關(guān)懷和金錢(qián)資助。標(biāo)題:InferringGasConsumptionandPollutionEmissionofVehiclesthroughoutaCity作者:JingboShang,YuZheng,WenzhuTong,EricChang,YongYu論文地址:/archive/inferring-gas-consumption-and-pollution-emission-of-vehicles-throughout-a-city/5550453545ce0a409eb548e232000GPSKDD2014JureLeskovecWeiWangSIGKDDGregoryPiatetskyrSIGKDDSIGKDD10年。2014253Session1第一個(gè)為基于統(tǒng)計(jì)技術(shù)的大數(shù)據(jù)挖掘?qū)?chǎng),該專場(chǎng)聚焦于并行吉布斯采樣,非參貝葉斯模型,在線中國(guó)餐館過(guò)程,以及概率知識(shí)融合等;Session2Session3Session1第一個(gè)為基于統(tǒng)計(jì)技術(shù)的大數(shù)據(jù)挖掘?qū)?chǎng),該專場(chǎng)聚焦于并行吉布斯采樣,非參貝葉斯模型,在線中國(guó)餐館過(guò)程,以及概率知識(shí)融合等;Session2Session3第三個(gè)為可擴(kuò)展大規(guī)模圖算法專場(chǎng),該專場(chǎng)報(bào)告了最新的圖節(jié)點(diǎn)Betweenness屬性,PageRank算法,圖采樣以及圖切分算法在大規(guī)模網(wǎng)絡(luò)或圖結(jié)構(gòu)中如何擴(kuò)展并進(jìn)行低時(shí)間復(fù)雜度計(jì)算;Session4第四個(gè)為大規(guī)模優(yōu)化和學(xué)習(xí)技術(shù)專場(chǎng),其主要重心為討論如何在大規(guī)模及流式數(shù)據(jù)上進(jìn)行隨機(jī)優(yōu)化,數(shù)據(jù)摘要以及在線機(jī)器學(xué)習(xí)等技術(shù)和模型的發(fā)展。SIGKDD2015論文解讀KDD2015Web5標(biāo)題:CoupledLP:LinkPredictioninCoupledNetworks作者:YuxiaoDong,JingZhang,JieTang,NiteshV.Chawla,BaiWang論文地址:/archive/coupledlp-link-prediction-in-coupled-networks/5736973c6e3b12023e62b5ca論文
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版小程序SDK接入授權(quán)合同模板3篇
- 2025年度美容院加盟店品牌形象保護(hù)合同范本4篇
- 2025版國(guó)際合同授權(quán)委托書(shū)定制模板3篇
- 城市配送與物流配送環(huán)節(jié)的信息互聯(lián)互通考核試卷
- 常州鋰電池生產(chǎn)廠2025年度消防設(shè)備采購(gòu)合同2篇
- 二零二五年度古法工藝木屋建造技藝傳承合同4篇
- 物業(yè)設(shè)施設(shè)備維護(hù)2025年度合同3篇
- 設(shè)備租賃公司二零二五年度施工塔吊租賃合同
- 2025年代理銷售分銷鏈銷售協(xié)議
- 2025年因施工責(zé)任賠償協(xié)議
- 開(kāi)展課外讀物負(fù)面清單管理的具體實(shí)施舉措方案
- 2025年云南中煙工業(yè)限責(zé)任公司招聘420人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025-2030年中國(guó)洗衣液市場(chǎng)未來(lái)發(fā)展趨勢(shì)及前景調(diào)研分析報(bào)告
- 2024解析:第三章物態(tài)變化-基礎(chǔ)練(解析版)
- 北京市房屋租賃合同自行成交版北京市房屋租賃合同自行成交版
- 《AM聚丙烯酰胺》課件
- 技術(shù)支持資料投標(biāo)書(shū)
- 老年人意外事件與與預(yù)防
- 預(yù)防艾滋病、梅毒和乙肝母嬰傳播轉(zhuǎn)介服務(wù)制度
- 《高速鐵路客運(yùn)安全與應(yīng)急處理》課程標(biāo)準(zhǔn)
- 23J916-1:住宅排氣道(一)
評(píng)論
0/150
提交評(píng)論