Hive是基于Hadoop的一個(gè)數(shù)據(jù)倉庫工具,主要用來對數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、加載操作。HiveQL可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)表,允許熟悉SQL的用戶查詢數(shù)據(jù),也允許熟悉MapReduce的開發(fā)者開發(fā)自定義的mapper和reducer來處理內(nèi)建的mapper和 reducer無法完成的復(fù)雜的分析工作,相對于Java代碼編寫的MapReduce來說,Hive的優(yōu)勢更加明顯。Hive利用Hadoop的HDFS存儲數(shù)據(jù),利用Hadoop的MapReduce執(zhí)行查詢。查看全文>>
在之前的Python培訓(xùn)?課程中,我們實(shí)現(xiàn)了為3D散點(diǎn)圖增加動(dòng)畫,今天我們講一下basemap安裝方法。在數(shù)據(jù)可視化中,人們有時(shí)需要將采集的數(shù)據(jù)按照其他地理位置顯示到地圖上,常見于城市人口、飛機(jī)航線、礦藏分布等,有助于用戶理解與空間有關(guān)的信息。basemap是matplotlib中的地圖工具包查看全文>>
數(shù)據(jù)發(fā)布與訂閱模型,即所謂的全局配置中心,就是發(fā)布者將需要全局統(tǒng)一管理的數(shù)據(jù)發(fā)布到Zookeeper節(jié)點(diǎn)上,供訂閱者動(dòng)態(tài)獲取數(shù)據(jù),實(shí)現(xiàn)配置信息的集中式管理和動(dòng)態(tài)更新查看全文>>
自2013年6月百度EFE(ExcellentFrontEnd)數(shù)據(jù)可視化團(tuán)隊(duì)研發(fā)的ECharts1.0發(fā)布到GitHub網(wǎng)站以來,ECharts一直備受業(yè)界權(quán)威的關(guān)注并獲得廣泛好評,成為目前成熟且流行的數(shù)據(jù)可視化圖表工具,被應(yīng)用到諸多數(shù)據(jù)可視化的開發(fā)領(lǐng)域。Python作為數(shù)據(jù)分析領(lǐng)域最受歡迎的語言查看全文>>
程序的編碼風(fēng)格是一個(gè)人編寫程序時(shí)表現(xiàn)出來的特點(diǎn)、習(xí)慣邏輯思路等。我們在程序開發(fā)時(shí)要重視其編寫規(guī)范,程序不僅應(yīng)該能夠在機(jī)器上正確執(zhí)行,還應(yīng)便于調(diào)試、維護(hù)及閱讀。下面舉例說明一些編程規(guī)范。查看全文>>
?Python官方網(wǎng)站中可以下載Python解釋器以搭建Python開發(fā)環(huán)境。下面以Windows系統(tǒng)為例演示Python的下載與安裝過程。具體操作步驟如下:查看全文>>