首頁(yè)最新資訊

全部 常見(jiàn)問(wèn)題 新聞動(dòng)態(tài) 技術(shù)文章 技術(shù)問(wèn)答

    • HBase單行數(shù)據(jù)插入和刪除方法

      在 HBase 中,所有突變要么存儲(chǔ)數(shù)據(jù),要么將數(shù)據(jù)標(biāo)記為刪除;沒(méi)有就地更新或刪除之類的東西。 HappyBase 提供了進(jìn)行單次插入或刪除的方法,以及一次執(zhí)行多個(gè)突變的批處理 API。查看全文>>

      技術(shù)文章2023-03-13 |黑馬程序員 |HBase單行數(shù)據(jù)插入和刪除
    • 寫爬蟲(chóng)應(yīng)該用多線程還是多進(jìn)程?為什么?

      多進(jìn)程爬蟲(chóng)一般也被視為分布式爬蟲(chóng)的基礎(chǔ),在單機(jī)上可以使用。通常來(lái)說(shuō)大型網(wǎng)站采用分布式來(lái)部署服務(wù)器,能夠采用多進(jìn)程同時(shí)間在不同的服務(wù)器上進(jìn)行爬取。查看全文>>

      常見(jiàn)問(wèn)題2023-03-13 |黑馬程序員 |寫爬蟲(chóng),多線程,多進(jìn)程
    • 什么是增量爬取?

      增量爬取就是保存上一次狀態(tài),在本次抓取的時(shí)候首先會(huì)與上次進(jìn)行對(duì)比,若是不在上次的狀態(tài)中,那么便會(huì)被視為增量,并且進(jìn)行保存。查看全文>>

      常見(jiàn)問(wèn)題2023-03-10 |黑馬程序員 |增量爬取,特征數(shù)據(jù)
    • 常用的爬蟲(chóng)框架或者模塊有哪些?簡(jiǎn)述它們的優(yōu)缺點(diǎn)

      Python自帶的urllib和urllib2,也可以使用requests這種第三方庫(kù),或者Scrapy框架。urllib和urllib2模塊都可以做與請(qǐng)求URL相關(guān)的操作,但它們提供了不同的功能。查看全文>>

      常見(jiàn)問(wèn)題2023-03-10 |黑馬程序員 |爬蟲(chóng)框架,爬蟲(chóng)模塊
    • 分庫(kù)分表能解決MySQL哪些問(wèn)題?

      根據(jù)以往的MySQL使用經(jīng)驗(yàn),MySQL單表在 5000 萬(wàn)行以內(nèi)時(shí),性能較好,單表超過(guò)5000萬(wàn)行后,數(shù)據(jù)庫(kù)性能、可維護(hù)性都會(huì)極劇下降。當(dāng)然這時(shí)候可以做MySQL分庫(kù)分表,如使用Mycat或Sharding-jdbc,分庫(kù)分表能否能解決MySQL的問(wèn)題呢?查看全文>>

      技術(shù)文章2023-03-09 |黑馬程序員 |分庫(kù)分表優(yōu)點(diǎn),MySQL分庫(kù)分表
    • 雙M結(jié)構(gòu)的循環(huán)復(fù)制問(wèn)題

      循環(huán)復(fù)制是指將一個(gè)序列循環(huán)地復(fù)制多次,形成一個(gè)更長(zhǎng)的序列。而雙M結(jié)構(gòu)是指將一個(gè)序列分為兩個(gè)子序列,然后將它們交錯(cuò)組合,形成一個(gè)新的序列。查看全文>>

      常見(jiàn)問(wèn)題2023-03-09 |黑馬程序員 |雙M結(jié)構(gòu)的循環(huán)復(fù)制問(wèn)題
和我們?cè)诰€交談!