通用網(wǎng)絡(luò)爬蟲(chóng)(General Purpose Web Crawler)又稱(chēng)全網(wǎng)爬蟲(chóng)(Scalable Web Crawler),是指訪問(wèn)全互聯(lián)網(wǎng)資源的網(wǎng)絡(luò)爬蟲(chóng)。通用網(wǎng)絡(luò)爬蟲(chóng)是“互聯(lián)網(wǎng)時(shí)代”早期出現(xiàn)的傳統(tǒng)網(wǎng)絡(luò)爬蟲(chóng),它是搜索引擎(如百度、谷歌、雅虎等)抓取系統(tǒng)的重要組成部分...查看全文>>
在數(shù)據(jù)量比較大時(shí),如果進(jìn)行l(wèi)imit分頁(yè)查詢(xún),在查詢(xún)時(shí),越往后,分頁(yè)查詢(xún)效率越低。執(zhí)行l(wèi)imit分頁(yè)查詢(xún)耗時(shí)對(duì)比如下:查看全文>>
操作系統(tǒng)(operating system,簡(jiǎn)稱(chēng)OS)是管理計(jì)算機(jī)硬件與軟件資源的程序,需要處理如:管理與配置內(nèi)存、決定系統(tǒng)資源供需的優(yōu)先次序、控制輸入設(shè)備與輸出設(shè)備、操作網(wǎng)絡(luò)與管理文件系統(tǒng)等基本事務(wù);沒(méi)有操作系統(tǒng)的機(jī)器稱(chēng)之為裸機(jī),不管是開(kāi)發(fā)還是使用都十分不便。操作系統(tǒng)也提供一個(gè)讓用戶(hù)與系統(tǒng)交互的操作界面。查看全文>>
CPython是官方的Python解釋器,由 C 語(yǔ)言實(shí)現(xiàn),它是Python語(yǔ)言中使用最廣泛的解釋器。CPython 解釋器在執(zhí)行 Python 代碼時(shí),將其編譯成字節(jié)碼,然后通過(guò)解釋器執(zhí)行該字節(jié)碼。查看全文>>
Hadoop MapReduce是一個(gè)分布式計(jì)算框架,用于輕松編寫(xiě)分布式應(yīng)用程序,這些應(yīng)用程序以可靠,容錯(cuò)的方式并行處理大型硬件集群(數(shù)千個(gè)節(jié)點(diǎn))上的大量數(shù)據(jù)(多TB數(shù)據(jù)集)。MapReduce是一種面向海量數(shù)據(jù)處理的一種指導(dǎo)思想,也是一種用于對(duì)大規(guī)模數(shù)據(jù)進(jìn)行分布式計(jì)算的編程模型。查看全文>>
VMware Workstation是一款虛擬機(jī)軟件,允許用戶(hù)將Linux、Windows等多個(gè)操作系統(tǒng)作為虛擬機(jī)在單臺(tái)PC上運(yùn)行; 用戶(hù)可以在虛擬機(jī)上重現(xiàn)服務(wù)器、桌面和平板電腦環(huán)境,無(wú)需重新啟動(dòng)即可跨不同操作系統(tǒng)同時(shí)運(yùn)行應(yīng)用。在PC上安裝VMware Workstation虛擬機(jī)軟件的詳細(xì)安裝過(guò)程如下查看全文>>