數(shù)據(jù)的一致性有3種類型,即強(qiáng)一致性、弱一致性以及最終一致性,具體介紹如下。查看全文>>
我們知道,Python語(yǔ)言當(dāng)前同時(shí)支持Python2和Python3兩個(gè)版本,這兩個(gè)版本的語(yǔ)法不完全兼容,因此在執(zhí)行其他版本的程序時(shí)很可能會(huì)報(bào)錯(cuò)。查看全文>>
Pandas中的索引都是Index類對(duì)象,又稱為索引對(duì)象,該對(duì)象是不可以進(jìn)行修改的,以保障數(shù)據(jù)的安全。例如,創(chuàng)建一個(gè)Series類對(duì)象,為其指定索引,然后再對(duì)索引重新賦值后會(huì)提示“索引不支持可變操作”的錯(cuò)誤信息,示例代碼如下。查看全文>>
在計(jì)算機(jī)使用中,目錄構(gòu)成了我們獲取文件的基礎(chǔ),一般來(lái)說(shuō)所有的文件都會(huì)存儲(chǔ)在特定的目錄之下。接下來(lái),筆者先來(lái)介紹一下使用Python獲取目錄相關(guān)信息的方法。查看全文>>
Serde是Serializer and Deserializer(序列化和反序列化)的簡(jiǎn)稱,Hive 通過(guò)Serde處理Hive數(shù)據(jù)表中每一行數(shù)據(jù)的讀取和寫(xiě)入,例如查詢Hive數(shù)據(jù)表數(shù)據(jù)時(shí),HDFS中存放的數(shù)據(jù)表數(shù)據(jù)會(huì)通過(guò)Serializer序列化為字節(jié)流便于數(shù)據(jù)傳輸;向Hive數(shù)據(jù)表插入數(shù)據(jù)時(shí),會(huì)通過(guò)Deserializer將數(shù)據(jù)反序列化成Hive數(shù)據(jù)表的每一行值,方便將數(shù)據(jù)加載到數(shù)據(jù)表中,不需要對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換。查看全文>>
當(dāng)我們?nèi)粘S肞ython做數(shù)據(jù)分析的時(shí)候,會(huì)利用Python的基礎(chǔ)語(yǔ)法來(lái)實(shí)現(xiàn)我們需要的功能。除此之外,技術(shù)人員也會(huì)通過(guò)第三方庫(kù)已經(jīng)封裝的功能,更快速、高效地處理和分析數(shù)據(jù)。查看全文>>