首頁(yè)新聞動(dòng)態(tài)正文

數(shù)據(jù)挖掘工具有哪些?[2020新版匯總]

更新時(shí)間:2019-12-11 來(lái)源:黑馬程序員 瀏覽量:

1. Rapid Miner

Rapid Miner是一個(gè)數(shù)據(jù)科學(xué)軟件平臺(tái),為數(shù)據(jù)準(zhǔn)備、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、文本挖掘和預(yù)測(cè)分析提供一種集成環(huán)境。它是領(lǐng)先的數(shù)據(jù)挖掘開源系統(tǒng)之一。該程序完全用Java編程語(yǔ)言編寫。該程序提供了一個(gè)選項(xiàng),以便用戶試用大量可任意嵌套的操作符,這些操作符在XML文件中有詳細(xì)說(shuō)明,可由Rapid Miner的圖形用戶界面來(lái)構(gòu)建。

2. Oracle Data Mining

它是Oracle高級(jí)分析數(shù)據(jù)庫(kù)的代表。市場(chǎng)領(lǐng)先的公司用它最大限度地發(fā)掘數(shù)據(jù)的潛力,做出準(zhǔn)確的預(yù)測(cè)。該系統(tǒng)配合強(qiáng)大的數(shù)據(jù)算法,鎖定最佳客戶。此外,它可識(shí)別異常情況和交叉銷售機(jī)會(huì),讓用戶能夠根據(jù)需要運(yùn)用不同的預(yù)測(cè)模型。此外,它以所需的方式定制客戶畫像。

1576046306641_數(shù)據(jù)挖掘工具.jpg


3. IBM SPSS Modeler

說(shuō)到大規(guī)模項(xiàng)目,IBM SPSS Modeler最適合。在這個(gè)建模器中,文本分析及其最先進(jìn)的可視化界面極具價(jià)值。它有助于生成數(shù)據(jù)挖掘算法,基本上不需要編程。它可廣泛用于異常檢測(cè)、貝葉斯網(wǎng)絡(luò)、CARMA、Cox回歸以及使用多層感知器和反向傳播學(xué)習(xí)的基本神經(jīng)網(wǎng)絡(luò)。

4. KNIME

Konstanz Information Miner是一個(gè)開源數(shù)據(jù)分析平臺(tái)。你可以迅速在其中部署、擴(kuò)展和熟悉數(shù)據(jù)。在商業(yè)智能界,KNIME號(hào)稱是有助于為毫無(wú)經(jīng)驗(yàn)的用戶提供預(yù)測(cè)智能的平臺(tái)。此外,數(shù)據(jù)驅(qū)動(dòng)的創(chuàng)新系統(tǒng)有助于發(fā)掘數(shù)據(jù)潛力。此外,它包括數(shù)千個(gè)模塊和隨時(shí)可用的示例以及一大批集成的工具和算法。

5. Python

Python是一種免費(fèi)的開源語(yǔ)言,因易用性常常與R相提并論。與R不同,Python學(xué)起來(lái)往往很容易上手,易于使用。許多用戶發(fā)現(xiàn)可以在幾分鐘內(nèi)開始構(gòu)建數(shù)據(jù),并進(jìn)行極其復(fù)雜的親和度分析。只要你熟悉變量、數(shù)據(jù)類型、函數(shù)、條件語(yǔ)句和循環(huán)等基本編程概念,最常見的業(yè)務(wù)用例數(shù)據(jù)可視化就很簡(jiǎn)單。

6. Orange

Orange是一個(gè)開源數(shù)據(jù)可視化、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘工具包。它有一個(gè)可視化編程前端,可用于探索性數(shù)據(jù)分析和交互式數(shù)據(jù)可視化。Orange是一個(gè)基于組件的可視化編程軟件包,用于數(shù)據(jù)可視化、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘和數(shù)據(jù)分析。Orange組件稱為窗口組件,范圍廣泛:從簡(jiǎn)單的數(shù)據(jù)可視化、子集選擇和預(yù)處理,到學(xué)習(xí)算法和預(yù)測(cè)建模的評(píng)估,不一而足。Orange的可視化編程通過(guò)界面來(lái)進(jìn)行,其中工作流程通過(guò)連接預(yù)定義或用戶設(shè)計(jì)的窗口組件來(lái)創(chuàng)建,而高級(jí)用戶可以將Orange用作Python庫(kù),以便操縱數(shù)據(jù)和更改窗口組件。

7. Kaggle

Kaggle是世界上最大的數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)者社區(qū)。Kaggle以開設(shè)機(jī)器學(xué)習(xí)競(jìng)賽起家,但現(xiàn)在逐漸變成基于公共云的數(shù)據(jù)科學(xué)平臺(tái)。Kaggle是一個(gè)平臺(tái),有助于解決難題、招募強(qiáng)大的團(tuán)隊(duì)并宣傳數(shù)據(jù)科學(xué)的力量。推薦了解黑馬程序員大數(shù)據(jù)培訓(xùn)課程。

8. Rattle

Rattle GUI是一個(gè)開放的免費(fèi)軟件包,使用Togaware提供的R統(tǒng)計(jì)編程語(yǔ)言,為數(shù)據(jù)挖掘提供圖形用戶界面。Rattle借助圖形用戶界面展示了R的強(qiáng)大功能,從而提供了豐富的數(shù)據(jù)挖掘功能。Rattle還被用作是學(xué)習(xí)R的教學(xué)工具。有一個(gè)名為L(zhǎng)og Code選項(xiàng)卡的選項(xiàng),它可以在GUI中為進(jìn)行的任何活動(dòng)復(fù)制R代碼,代碼可以復(fù)制粘貼。Rattle可以用于統(tǒng)計(jì)分析或模型生成。Rattle允許數(shù)據(jù)集劃分成訓(xùn)練、驗(yàn)證和測(cè)試等部分,可以查看和編輯數(shù)據(jù)集。

9. Weka

懷卡托知識(shí)分析環(huán)境(Weka)是新西蘭懷卡托大學(xué)開發(fā)的一套機(jī)器學(xué)習(xí)軟件。該軟件用Java編寫。它含有一系列面向數(shù)據(jù)分析和預(yù)測(cè)建模的可視化工具和算法,附帶圖形用戶界面。Weka支持幾種標(biāo)準(zhǔn)數(shù)據(jù)挖掘任務(wù),更具體地說(shuō)是指數(shù)據(jù)預(yù)處理、聚類、分類、回歸、可視化和特征選擇。

10. Teradata

Teradata分析平臺(tái)提供了最佳功能和領(lǐng)先引擎,讓用戶能夠針對(duì)不同類型的數(shù)據(jù),可以大規(guī)模利用他們選擇的工具和語(yǔ)言。這是通過(guò)以下幾步來(lái)實(shí)現(xiàn)的:讓分析工具貼近數(shù)據(jù),無(wú)需移動(dòng)數(shù)據(jù),并允許用戶以更高的速度和準(zhǔn)確度對(duì)更龐大的數(shù)據(jù)集運(yùn)行分析。

猜你喜歡:

數(shù)據(jù)挖掘十大經(jīng)典算法,想從事數(shù)據(jù)挖掘就不得不看


分享到:
在線咨詢 我要報(bào)名
和我們?cè)诰€交談!