首頁技術文章正文

大型PHP網(wǎng)站性能和并發(fā)訪問優(yōu)化方案(完整篇)

更新時間:2017-11-20 來源:黑馬程序員 瀏覽量:

網(wǎng)站性能優(yōu)化對于大型網(wǎng)站來說非常重要,一個網(wǎng)站的訪問打開速度影響著用戶體驗度,網(wǎng)站訪問速度慢會造成高跳出率,小網(wǎng)站很好解決,那對于大型網(wǎng)站由于欄目多,圖片和圖像都比較龐大,那該怎么進行整體性能優(yōu)化呢?


一、大型網(wǎng)站性能提高策略


1、HTML靜態(tài)化


其實大家都知道,效率最高、消耗最小的就是純靜態(tài)化的html頁面,所以我們盡可能使我們的網(wǎng)站上的頁面采用靜態(tài)頁面來實現(xiàn),這個最簡單的方法其實也是最有效的方法。


2、圖片服務器分離


大家知道,對于Web服務器來說,不管是Apache、IIS還是其他容器,圖片是最消耗資源的,于是我們有必要將圖片與頁面進行分離,這是基本上大型網(wǎng)站都會采用的策略,他們都有獨立的、甚至很多臺的圖片服務器。這樣的架構可以降低提供頁面訪問請求的服務器系統(tǒng)壓力,并且可以保證系統(tǒng)不會因為圖片問題而崩潰。在應用服務器和圖片服務器上,可以進行不同的配置優(yōu)化,比如apache在配置ContentType的時候可以盡量少支持、盡可能少的LoadModule,保證更高的系統(tǒng)消耗和執(zhí)行效率。


3、數(shù)據(jù)庫集群、庫表散列


大型網(wǎng)站都有復雜的應用,這些應用必須使用數(shù)據(jù)庫,那么在面對大量訪問的時候,數(shù)據(jù)庫的瓶頸很快就能顯現(xiàn)出來,這時一臺數(shù)據(jù)庫將很快無法滿足應用,于是我們需要使用數(shù)據(jù)庫集群或者庫表散列。


在數(shù)據(jù)庫集群方面,很多數(shù)據(jù)庫都有自己的解決方案,常用的MySQL提供的Master/Slave也是類似的方案。


集群通常會使用CDN與GSBL與DNS負載均衡技術,每個地區(qū)一組前臺服務器群,例如:網(wǎng)易,百度使用了DNS負載均衡技術,每個頻道一組前臺服務器,一搜使用了DNS負載技術,所有頻道共用一組前臺服務器集群。


庫表散列是常用并且最有效的解決方案。


我們在應用程序中安裝業(yè)務和應用或者功能模塊將數(shù)據(jù)庫進行分離,不同的模塊對應不同的數(shù)據(jù)庫或者表,再按照一定的策略對某個頁面或者功能進行更小的數(shù)據(jù)庫散列,比如用戶表,按照用戶ID進行表散列,這樣就能夠低成本的提升系統(tǒng)的性能并且有很好的擴展性。


sohu的論壇就是采用了這樣的架構,將論壇的用戶、設置、帖子等信息進行數(shù)據(jù)庫分離,然后對帖子、用戶按照板塊和ID進行散列數(shù)據(jù)庫和表,最終可以在配置文件中進行簡單的配置便能讓系統(tǒng)隨時增加一臺低成本的數(shù)據(jù)庫進來補充系統(tǒng)性能。


4、緩存


緩存一詞搞技術的都接觸過,很多地方用到緩存。網(wǎng)站架構和網(wǎng)站開發(fā)中的緩存也是非常重要。這里先講述最基本的兩種緩存。高級和分布式的緩存在后面講述。架構方面的緩存,對Apache比較熟悉的人都能知道Apache提供了自己的緩存模塊,也可以使用外加的Squid模塊進行緩存,這兩種方式均可以有效的提高Apache的訪問響應能力。


網(wǎng)站程序開發(fā)方面的緩存,Linux上提供的Memory Cache是常用的緩存接口,可以在web開發(fā)中使用,比如用Java開發(fā)的時候就可以調(diào)用MemoryCache對一些數(shù)據(jù)進行緩存和通訊共享,一些大型社區(qū)使用了這樣的架構。另外,在使用web語言開發(fā)的時候,各種語言基本都有自己的緩存模塊和方法,PHP有Pear的Cache模塊,Java就更多了,.net不是很熟悉,相信也肯定有。


5、鏡像


鏡像是大型網(wǎng)站常采用的提高性能和數(shù)據(jù)安全性的方式,鏡像的技術可以解決不同網(wǎng)絡接入商和地域帶來的用戶訪問速度差異,比如ChinaNet和EduNet之間的差異就促使了很多網(wǎng)站在教育網(wǎng)內(nèi)搭建鏡像站點,數(shù)據(jù)進行定時更新或者實時更新。


6、負載均衡


負載均衡將是大型網(wǎng)站解決高負荷訪問和大量并發(fā)請求采用的高端解決辦法。負載均衡技術發(fā)展了多年,有很多專業(yè)的服務提供商和產(chǎn)品可以選擇。


二、PHP代碼編寫優(yōu)化:


1. echo比print要快很多。


兩個方法都會在頁面上打印東西,不過echo不返回任何值,print會在成功或失敗的時候返回0或1。


2. include_once比include更加耗時。


因為它需要去檢查你要包含的class是否已經(jīng)被包含進來。


3. 對于長段落的字符串一定要使用單引號,而不是雙引號。


因為雙引號會去搜索字符串中的變量。比如:echo ‘This is long string’.$name就比echo “This is long string $name”要快很多。


4. 不要再循環(huán)中嵌套使用for循環(huán)


5. 如果能將函數(shù)定義為靜態(tài)的,那么就不要定義成為成員函數(shù),靜態(tài)函數(shù)比成員函數(shù)快33%。


6. 如果你可以不通過正則表達式就能解決問題,那么就別用正則。


正則表達式比PHP原生的函數(shù)要慢一些。例如使用str_replace取代preg_replae。


7. 盡量不要使用相對路徑來包含文件


在相對路徑中查找文件,會現(xiàn)在當前目錄中查找,然后依次再查找。這樣查找文件就很 慢。最好是先定義WEB_ROOT這樣的常量,然后使用這個常量來包含文件。


8. 全等符號===比相等==要快


而且if(1 == ’1′)會返回true,if(0 == ”)也會返回true,而當你使用全等符號的時候if(1 ===’1′)和if(0===”)都會返回false。所以當你在程序中需要檢測一些布爾變量 的時候最好使用全等符號。


三、針對thinkphp 有以下幾種方式


1. 關閉調(diào)試模式


由于關閉調(diào)試模式之后,系統(tǒng)會自動生成項目編譯緩存以及關閉日志寫 入,這樣可以減少很多的IO加載和日志寫入的開銷。


2. 開啟頁面壓縮輸出


3.1版本開始,增加了OUTPUT_ENCODE配置參數(shù),用于控制頁面壓縮輸出。


3. 開啟緩存


在網(wǎng)站部署環(huán)境安裝APC或者Xcache緩存能夠有效提升網(wǎng)站運行性能和內(nèi)存占用,XCache 是一個開源的 opcode 緩存器/優(yōu)化器, 這意味著他能夠提高您服務器上 的 PHP 性能. 他通過把編譯 PHP后的數(shù)據(jù)緩沖到共享內(nèi)存從而避免重復的編譯 過程, 能夠直接使用緩沖區(qū)已編譯的代碼從而提高速度. 通常能夠提高您的頁面生 成速率 2 到5 倍, 降低服務器負載.Alternative PHP Cache (APC)是一種對PHP有效的開放源高速緩沖儲存器工具,它能夠緩存opcode的php中間碼。


4. 字段緩存


默認情況下,字段緩存是自動生成的,在開發(fā)完成之后,基本上數(shù)據(jù)庫的變動變得 比較少,因此可以考慮合并字段緩存到對應的模型類,這樣能夠減少每次讀取字段 緩存的IO開銷。合并的方法是在Runtime/Data/_fields下面找到對應的字段緩存文件


四、 數(shù)據(jù)庫優(yōu)化


1、選擇正確的存儲引擎


以 MySQL為例,包括有兩個存儲引擎 MyISAM 和 InnoDB,每個引擎都有利有弊。MyISAM 適合于一些需要大量查詢的應用。InnoDB 的趨勢會是一個非常復雜的存儲引擎,對于一些小的應用,它會比 MyISAM 還慢。但是它支持“行鎖” ,支持事務。


2、優(yōu)化字段的數(shù)據(jù)類型


記住一個原則,越小的列會越快。對于大多數(shù)的數(shù)據(jù)庫引擎來說,硬盤操作可能是最重大的瓶頸。所以,把你的數(shù)據(jù)變得緊湊會對這種情況非常有幫助,因為這減少了對硬盤的訪問。如果一個表只會有幾列罷了(比如說字典表,配置表),那么,我們就沒有理由使用 INT 來做主鍵,使用MEDIUMINT, SMALLINT 或是更小的 TINYINT 會更經(jīng)濟一些。如果你不需要記錄時間,使用 DATE 要比DATETIME 好得多。當然,你也需要留夠足夠的擴展空間。


3、為搜索字段添加索引


索引并不一定就是給主鍵或是唯一的字段。如果在你的表中,有某個字段你總要會經(jīng)常用來做搜索,那么最好是為其建立索引,除非你要搜索的字段是大的文本字段,那應該建立全文索引。


4、避免使用Select *從數(shù)據(jù)庫里讀出越多的數(shù)據(jù),那么查詢就會變得越慢。


并且,如果你的數(shù)據(jù)庫服務器和WEB服務器是兩臺獨立的服務器的話,這還會增加網(wǎng)絡傳輸?shù)呢撦d。即使你要查詢數(shù)據(jù)表的所有字段,也盡量不要用*通配符,善用內(nèi)置提供的字段排除定義也許能給帶來更多的便利。


5、使用 ENUM 而不是 VARCHAR


ENUM 類型是非??旌途o湊的。在實際上,其保存的是 TINYINT,但其外表上顯示為字符串。這樣一來,用這個字段來做一些選項列表變得相當?shù)耐昝?。例如,性別、民族、部門和狀態(tài)之類的這些字段的取值是有限而且固定的,那么,你應該使用 ENUM 而不是 VARCHAR。


6、盡可能的使用 NOT NULL


除非你有一個很特別的原因去使用 NULL 值,你應該總是讓你的字段保持 NOT NULL。 NULL其實需要額外的空間,并且,在你進行比較的時候,你的程序會更復雜。 當然,這里并不是說你就不能使用NULL了,現(xiàn)實情況是很復雜的,依然會有些情況下,你需要使用NULL值。


7、固定長度的表會更快


如果表中的所有字段都是“固定長度”的,整個表會被認為是 “static” 或 “fixed-length”。 例如,表中沒有如下類型的字段: VARCHAR,TEXT,BLOB。只要你包括了其中一個這些字段,那么這個表就不是“固定長度靜態(tài)表”了,這樣,MySQL 引擎會用另一種方法來處理。


固定長度的表會提高性能,因為MySQL搜尋得會更快一些,因為這些固定的長度是很容易計算下一個數(shù)據(jù)的偏移量的,所以讀取的自然也會很快。而如果字段不是定長的,那么,每一次要找下一條的話,需要程序找到主鍵。


并且,固定長度的表也更容易被緩存和重建。不過,唯一的副作用是,固定長度的字段會浪費一些空間,因為定長的字段無論你用不用,他都是要分配那么多的空間。


8、使用“垂直分割”技術


你可以分割你的表成為兩個一個是定長的,一個則是不定長的。垂直分割 “垂直分割”是一種把數(shù)據(jù)庫中的表按列變成幾張表的方法,這樣可以降低表的復雜度和字段的數(shù)目,從而達到優(yōu)化的目的。例如:在User表中有一個字段是家庭地址,這個字段是可選字段,相比起,而且你在數(shù)據(jù)庫操作的時候除了個人信息外,你并不需要經(jīng)常讀取或是改寫這個字段。那么,為什么不把他放到另外一張表中呢? 這樣會讓你的表有更好的性能,大家想想是不是,大量的時候,我對于用戶表來說,只有用戶ID,用戶名,口令,用戶角色等會被經(jīng)常使用。小一點的表總是會有好的性能。另外,你需要注意的是,這些被分出去的字段所形成的表,你不會經(jīng)常性地去Join他們,不然的話,這樣的性能會比不分割時還要差,而且,會是極數(shù)級的下降。


9、EXPLAIN 你的 SELECT 查詢


使用 EXPLAIN 關鍵字可以讓你知道MySQL是如何處理你的SQL語句的。這可以幫你分析你的查詢語句或是表結構的性能瓶頸。EXPLAIN 的查詢結果還會告訴你你的索引主鍵被如何利用的,你的數(shù)據(jù)表是如何被搜索和排序的……等等,等等。通常我們可以對比較復雜的尤其是涉及到多表的SELECT語句,把關鍵字EXPLAIN加到前面。你可以使用phpmyadmin來做這個事。


五、前端優(yōu)化


優(yōu)化完后端和數(shù)據(jù)庫之后,我們緊接著要做的就是針對輸出的頁面優(yōu)化你的前端頁面和資源文件,主要包括對圖片、JS和樣式文件的優(yōu)化。建議采用下列網(wǎng)頁性能測試工具進行檢測和分析,會給出相關的優(yōu)化建議:


PageSpeed 谷歌開發(fā)的工具


開發(fā)人員可以使用PageSpeed來評估他們網(wǎng)頁的性能,并獲得有關如何改進性能的建議。


yslow YSlow


可以對網(wǎng)站的頁面進行分析,并告訴你為了提高網(wǎng)站性能,如何基于某些規(guī)則而進行優(yōu)化。


本文版權歸黑馬程序員PHP學院所有,歡迎轉載,轉載請注明作者出處。謝謝!


作者:黑馬程序員PHP培訓學院


首發(fā):http://php.itheima.com/


分享到:
在線咨詢 我要報名
和我們在線交談!