技術(shù):RapidMiner等大數(shù)據(jù)處理分析工具介紹
如上文所約,,合肥網(wǎng)站優(yōu)化公司佳達小編已經(jīng)為大家準備好了關(guān)于HPCC,、Pentaho BI和RapidMiner這三大大數(shù)據(jù)處理分析工具的介紹(目前來看,這個工具還太過專業(yè)和深入,希望后期能有些相對簡單和“傻瓜化”的工具來幫助我們體驗大數(shù)據(jù)帶來的美妙世界),。這三個與之前介紹的三個有什么不同和共同點呢?請大家對比發(fā)現(xiàn),,是不是有一點想大家來找茬,,哈哈!
1)HPCC
HPCC,,High Performance Computing and Communications(高性能計算與通信)的縮寫,。1993年,由美國科學(xué),、工程,、技術(shù)聯(lián)邦協(xié)調(diào)理事會向國會提交了“重大挑戰(zhàn)項目:高性能計算與 通信”的報告,也就是被稱為HPCC計劃的報告,,即美國總統(tǒng)科學(xué)戰(zhàn)略項目,,其目的是通過加強研究與開發(fā)解決一批重要的科學(xué)與技術(shù)挑戰(zhàn)問題。HPCC是美國 實施信息高速公路而上實施的計劃,,該計劃的實施將耗資百億美元,,其主要目標要達到:開發(fā)可擴展的計算系統(tǒng)及相關(guān)軟件,以支持太位級網(wǎng)絡(luò)傳輸性能,,開發(fā)千兆 比特網(wǎng)絡(luò)技術(shù),,擴展研究和教育機構(gòu)及網(wǎng)絡(luò)連接能力。
該項目主要由五部分組成:
1,、先進軟件技術(shù)與算法(ASTA),,內(nèi)容有巨大挑戰(zhàn)問題的軟件支撐、新算法設(shè)計,、軟件分支與工具,、計算計算及高性能計算研究中心等;
2、國家科研與教育網(wǎng)格(NREN),,內(nèi)容有中接站及10億位級傳輸?shù)难芯颗c開發(fā);
3,、高性能計算機系統(tǒng)(HPCS),內(nèi)容包括今后幾代計算機系統(tǒng)的研究,、系統(tǒng)設(shè)計工具,、先進的典型系統(tǒng)及原有系統(tǒng)的評價等;
4,、基本研究與人類資源(BRHR),內(nèi)容有基礎(chǔ)研究,、培訓(xùn),、教育及課程教材,被設(shè)計通過獎勵調(diào)查者-開始的,,長期 的調(diào)查在可升級的高性能計算中來增加創(chuàng)新意識流,,通過提高教育和高性能的計算訓(xùn)練和通信來加大熟練的和訓(xùn)練有素的人員的聯(lián)營,和來提供必需的基礎(chǔ)架構(gòu)來支 持這些調(diào)查和研究活動;
5,、信息基礎(chǔ)結(jié)構(gòu)技術(shù)和應(yīng)用(IITA ),,目的在于保證美國在先進信息技術(shù)開發(fā)方面的領(lǐng)先地位。
2)Pentaho BI
Pentaho BI 平臺不同于傳統(tǒng)的BI 產(chǎn)品,,它是一個以流程為中心的,,面向解決方案(Solution)的框架。其目的在于將一系列企業(yè)級BI產(chǎn)品,、開源軟件,、API等等組件集成起來,方便商務(wù)智能應(yīng)用的開發(fā),。它的出現(xiàn),,使得一系列的面向商務(wù)智能的獨立產(chǎn)品如Jfree、Quartz等等,,能夠集成在一起,,構(gòu)成一項項復(fù)雜的、完整的商務(wù)智能解決方案,。
Pentaho BI 平臺,,Pentaho Open BI 套件的核心架構(gòu)和基礎(chǔ),是以流程為中心的,,因為其中樞控制器是一個工作流引擎,。工作流引擎使用流程定義來定義在BI 平臺上執(zhí)行的商業(yè)智能流程。流程可以很容易的被定制,,也可以添加新的流程,。BI 平臺包含組件和報表,用以分析這些流程的性能,。目前,,Pentaho的主要組成元素包括報表生成、分析,、數(shù)據(jù)挖掘和工作流管理等等,。這些組件通過 J2EE、WebService、SOAP,、HTTP,、Java、JavaScript,、Portals等技術(shù)集成到Pentaho平臺中來,。 Pentaho的發(fā)行,主要以Pentaho SDK的形式進行,。
3)RapidMiner
RapidMiner是世界領(lǐng)先的數(shù)據(jù)挖掘解決方案,在一個非常大的程度上有著先進技術(shù),。它數(shù)據(jù)挖掘任務(wù)涉及范圍廣泛,,包括各種數(shù)據(jù)藝術(shù),能簡化數(shù)據(jù)挖掘過程的設(shè)計和評價,。其功能和特點有:數(shù)據(jù)挖掘過程簡單,,強大和直觀、免費提供數(shù)據(jù)挖掘技術(shù)和庫,、100%用Java代碼(可運行在操作系統(tǒng)),、可以用簡單腳本語言自動進行大規(guī)模進程、圖形用戶界面的互動原型,、命令行(批處理模式)自動大規(guī)模應(yīng)用,、Java API(應(yīng)用編程接口)、簡單的插件和推廣機制和強大的可視化引擎,,許多尖端的高維數(shù)據(jù)的可視化建模等,。ML保證了標
耶魯大學(xué)已成功地應(yīng)用在許多不同的應(yīng)用領(lǐng)域,包括文本挖掘,,多媒體挖掘,,功能設(shè)計,數(shù)據(jù)流挖掘,,集成開發(fā)的方法和分布式數(shù)據(jù)挖掘,。
至此,六大大數(shù)據(jù)處理分析工具已經(jīng)由合肥網(wǎng)站優(yōu)化公司佳達小編為大家介紹完畢,,小編又可以為下一個主題準備了,。會是什么主題呢?下周見分曉吧,。
轉(zhuǎn)載請注明出處?合肥網(wǎng)絡(luò)公司佳達科技專注于網(wǎng)站推廣?wanfangdada.com.cn