首頁最新資訊

全部 常見問題 新聞動態(tài) 技術文章 技術問答

    • HBase單行數據插入和刪除方法

      在 HBase 中,所有突變要么存儲數據,要么將數據標記為刪除;沒有就地更新或刪除之類的東西。 HappyBase 提供了進行單次插入或刪除的方法,以及一次執(zhí)行多個突變的批處理 API。查看全文>>

      技術文章2023-03-13 |黑馬程序員 |HBase單行數據插入和刪除
    • 寫爬蟲應該用多線程還是多進程?為什么?

      多進程爬蟲一般也被視為分布式爬蟲的基礎,在單機上可以使用。通常來說大型網站采用分布式來部署服務器,能夠采用多進程同時間在不同的服務器上進行爬取。查看全文>>

      常見問題2023-03-13 |黑馬程序員 |寫爬蟲,多線程,多進程
    • 什么是增量爬取?

      增量爬取就是保存上一次狀態(tài),在本次抓取的時候首先會與上次進行對比,若是不在上次的狀態(tài)中,那么便會被視為增量,并且進行保存。查看全文>>

      常見問題2023-03-10 |黑馬程序員 |增量爬取,特征數據
    • 常用的爬蟲框架或者模塊有哪些?簡述它們的優(yōu)缺點

      Python自帶的urllib和urllib2,也可以使用requests這種第三方庫,或者Scrapy框架。urllib和urllib2模塊都可以做與請求URL相關的操作,但它們提供了不同的功能。查看全文>>

      常見問題2023-03-10 |黑馬程序員 |爬蟲框架,爬蟲模塊
    • 分庫分表能解決MySQL哪些問題?

      根據以往的MySQL使用經驗,MySQL單表在 5000 萬行以內時,性能較好,單表超過5000萬行后,數據庫性能、可維護性都會極劇下降。當然這時候可以做MySQL分庫分表,如使用Mycat或Sharding-jdbc,分庫分表能否能解決MySQL的問題呢?查看全文>>

      技術文章2023-03-09 |黑馬程序員 |分庫分表優(yōu)點,MySQL分庫分表
    • 雙M結構的循環(huán)復制問題

      循環(huán)復制是指將一個序列循環(huán)地復制多次,形成一個更長的序列。而雙M結構是指將一個序列分為兩個子序列,然后將它們交錯組合,形成一個新的序列。查看全文>>

      常見問題2023-03-09 |黑馬程序員 |雙M結構的循環(huán)復制問題
和我們在線交談!