前期采集到的數據,或多或少都存在一些瑕疵和不足,比如數據缺失、極端值、數據格式不統(tǒng)一等問題。因此,在分析數據之前需要對數據進行預處理,包括數據的清洗、合并、重塑與轉換。Pandas中專門提供了用于數據預處理的很多函數與方法,用于替換異常數據、合并數據、重塑數據。查看全文>>
斐波那契數列(Fibonacci sequence),又稱黃金分割數列、因數學家萊昂納多·斐波那契(Leonardoda Fibonacci)以兔子繁殖為例子而引入,故又稱為“兔子數列”。查看全文>>
MySQL屬于關系型數據庫,Mongodb屬于非關系型數據庫,兩者有不同的特點,為什么選擇Mongodb而非MySQL存儲爬蟲數據呢?本節(jié)課就對這一問題做詳細解答。查看全文>>
Python中的模塊可分為三類,分別是內置模塊、第三方模塊和自定義模塊,相關介紹如下。查看全文>>
Python程序中最常見的錯誤為語法錯誤。語法錯誤又稱為解析錯誤,它是指開發(fā)人員編寫了不符合Python語法格式的代碼所引起的錯誤。含有語法錯誤的程序會拋出異常,無法運行。如下所示為一段包含語法問題的代碼:查看全文>>
程序被執(zhí)行后成為了一個活動的實體,這個實體就是進程。換言之,操作系統(tǒng)調度并執(zhí)行程序,這個“執(zhí)行中的程序”稱為進程。進程是操作系統(tǒng)進行資源分配和調度的基本單位。一般情況下,進程占據的內存空間由控制塊、程序段和數據段三個部分組成,各部分的介紹如下。查看全文>>