首頁技術(shù)文章正文

Python分庫分表的幾種常見形式

更新時間:2017-12-21 來源:黑馬程序員 瀏覽量:

“分庫分表”是談論數(shù)據(jù)庫架構(gòu)和優(yōu)化時經(jīng)常聽到的關(guān)鍵詞。那么對于這些業(yè)務量正在高速增長的公司,它有那么容易實踐嗎?

垂直分表

垂直分表在日常開發(fā)和設計中比較常見,通俗的說法叫做“大表拆小表”,拆分是基于關(guān)系型數(shù)據(jù)庫中的“列”(字段)進行的。通常情況,某個表中的字段比較多,可以新建立一張“擴展表”,將不經(jīng)常使用或者長度較大的字段拆分出去放到“擴展表”中,如下圖所示:

Python分庫分表

在字段很多的情況下,拆分開確實更便于開發(fā)和維護。

拆分字段的操作建議在數(shù)據(jù)庫設計階段就做好。如果是在發(fā)展過程中拆分,則需要改寫以前的查詢語句,會額外帶來一定的成本和風險,建議謹慎。

垂直分庫

垂直分庫在“微服務”盛行的今天已經(jīng)非常普及了?;镜乃悸肪褪前凑諛I(yè)務模塊來劃分出不同的數(shù)據(jù)庫,而不是像早期一樣將所有的數(shù)據(jù)表都放到同一個數(shù)據(jù)庫中。如下圖:

Python分庫分表

系統(tǒng)層面的“服務化”拆分操作,能夠解決業(yè)務系統(tǒng)層面的耦合和性能瓶頸,有利于系統(tǒng)的擴展維護。也能對不同業(yè)務類型的數(shù)據(jù)進行“分級”管理、維護、監(jiān)控、擴展等。

在高并發(fā)場景下,垂直分庫一定程度上能夠突破IO、連接數(shù)及單機硬件資源的瓶頸,是大型分布式系統(tǒng)中優(yōu)化數(shù)據(jù)庫架構(gòu)的重要手段。

水平分表

水平分表也稱為橫向分表,比較容易理解,就是將表中不同的數(shù)據(jù)行按照一定規(guī)律分布到不同的數(shù)據(jù)庫表中(這些表保存在同一個數(shù)據(jù)庫中),這樣來降低單表數(shù)據(jù)量,優(yōu)化查詢性能。最常見的方式就是通過主鍵或者時間等字段進行Hash和取模后拆分。如下圖所示:

Python分庫分表

水平分表,能夠降低單表的數(shù)據(jù)量,一定程度上可以緩解查詢性能瓶頸。

水平分庫分表

水平分庫分表與上面講到的水平分表的思想相同,唯一不同的就是將這些拆分出來的表保存在不同的數(shù)據(jù)中。這也是很多大型互聯(lián)網(wǎng)公司所選擇的做法。如下圖:

Python分庫分表

某種意義上來講,有些系統(tǒng)中使用的“冷熱數(shù)據(jù)分離”(將一些使用較少的歷史數(shù)據(jù)遷移到其他的數(shù)據(jù)庫中。而在業(yè)務功能上,通常默認只提供熱點數(shù)據(jù)的查詢),也是類似的實踐。

在高并發(fā)和海量數(shù)據(jù)的場景下,分庫分表能夠有效緩解單機和單庫的性能瓶頸和壓力,突破IO、連接數(shù)、硬件資源的瓶頸。當然,投入的硬件成本也會更高。同時,這也會帶來一些復雜的技術(shù)問題和挑戰(zhàn)(例如:跨分片的復雜查詢,跨分片事務等)

總結(jié)和實踐建議

1. 我們目前的數(shù)據(jù)庫是否需要進行分庫分表?

根據(jù)系統(tǒng)架構(gòu)和公司實際情況來,如果你們的系統(tǒng)還是個簡單的單體應用,并且沒有什么訪問量和數(shù)據(jù)量,那就別著急折騰“垂直分庫”了,否則沒有任何收益,也很難有好結(jié)果。

切記,“過度設計”和“過早優(yōu)化”是很多架構(gòu)師和技術(shù)人員常犯的毛病。

2. 有沒有原則或者技巧?

沒有什么黃金法則和標準答案。一般是參考系統(tǒng)的業(yè)務模塊拆分來進行數(shù)據(jù)庫的拆分。比如“用戶服務”,對應的可能就是“用戶數(shù)據(jù)庫”。但是也不一定嚴格一一對應。

3. 后臺系統(tǒng)中join的表都有n個了,其實互聯(lián)網(wǎng)的業(yè)務系統(tǒng)中,本來就應該盡量避免join的,如果有多個join的,要么是設計不合理,要么是技術(shù)選型有誤。


本文版權(quán)歸黑馬程序員人工智能+Python學院所有,歡迎轉(zhuǎn)載,轉(zhuǎn)載請注明作者出處。謝謝!


作者:黑馬程序員人工智能+Python培訓學院


首發(fā):http://python.itheima.com/


分享到:
在線咨詢 我要報名
和我們在線交談!