對于大多數web應用來說,數據庫都是一個十分基礎性的部分。如果你在使用PHP,那么你很可能也在使用MySQL—LAMP系列中舉足輕重的一份子。
對于很多新手們來說,使用PHP可以在短短幾個小時之內輕松地寫出具有特定功能的代碼。但是,構建一個穩(wěn)定可靠的數據庫卻需要花上一些時日和相關技 能。下面列舉了我曾經犯過的最嚴重的11個MySQL相關的錯誤(有些同樣也反映在其他語言/數據庫的使用上)。。。
1.使用MyISAM而不是InnoDB
MySQL有很多數據庫引擎,但是你最可能碰到的就是MyISAM和InnoDB。
MySQL默認使用的是MyISAM。但是,很多情況下這都是一個很糟糕的選擇,除非你在創(chuàng)建一個非常簡單抑或實驗性的數據庫。外鍵約束或者事務處 理對于數據完整性是非常重要的,但MyISAM都不支持這些。另外,當有一條記錄在插入或者更新時,整個數據表都被鎖定了,當使用量增加的時候這會產生非 常差的運行效率。
結論很簡單:使用InnoDB。
2.使用PHP的mysql函數PHP自產生之日就提供了MySQL庫函數(or near as makes no difference)。很多應用仍然在使用類似mysql_connect、mysql_query、mysql_fetch_assoc等的函數,盡 管PHP手冊上說:如果你在使用MySQL v4.1.3或者更新版本,強烈推薦使用您使用mysqli擴展。
mysqli(MySQL的加強版擴展)有以下幾個優(yōu)點:
可選的面向對象接口
prepared表達式,這有利于阻止SQL注入攻擊,還能提高性能
支持更多的表達式和事務處理
另外,如果你想支持多種數據庫系統(tǒng),你還可以考慮PDO。3.沒有處理用戶輸入這或者可以這樣說#1:永遠不要相信用戶的輸入。用服務器端的PHP驗證每個字符串,不要寄希望與JavaScript。最簡單的SQL注入攻擊會利用如下的代碼:
$username = $_POST["name"]; $password = $_POST["password"]; $sql = "SELECT userid FROM usertable WHERE username='$username' AND password='$password';"; // run query...
只要在username字段輸入“admin';--”,這樣就會被黑到,相應的SQL語句如下:
SELECT userid FROM usertable WHERE username='admin';
狡猾的黑客可以以admin登錄,他們不需要知道密碼,因為密碼段被注釋掉了。4.沒有使用UTF-8 美國、英國和澳大利亞的我們很少考慮除英語之外的其他語言。我們很得意地完成了自己的“杰作”卻發(fā)現(xiàn)它們并不能在其他地方正常運行。
UTF-8解決了很多國際化問題。雖然在PHP v6.0之前它還不能很好地被支持,但這并不影響你把MySQL字符集設為UTF-8。
5.相對于SQL,偏愛PHP 如果你接觸MySQL不久,那么你會偏向于使用你已經掌握的語言來解決問題,這樣會導致寫出一些冗余、低效率的代碼。比如,你不會使用MySQL自帶的AVG()函數,卻會先對記錄集中的值求和然后用PHP循環(huán)來計算平均值。
此外,請注意PHP循環(huán)中的SQL查詢。通常來說,執(zhí)行一個查詢比在結果中迭代更有效率。
所以,在分析數據的時候請利用數據庫系統(tǒng)的優(yōu)勢,懂一些SQL的知識將大有裨益。
6.沒有優(yōu)化數據庫查詢99%的PHP性能問題都是由數據庫引起的,僅僅一個糟糕的SQL查詢就能讓你的web應用徹底癱瘓。MySQL的EXPLAIN statement、Query Profiler,還有很多其他的工具將會幫助你找出這些萬惡的SELECT。7.不能正確使用數據類型MySQL提供了諸如numeric、string和date等的數據類 型。如果你想存儲一個時間,那么使用DATE或者DATETIME類型。如果這個時候用INTEGER或者STRING類型的話,那么將會使得SQL查詢 非常復雜,前提是你能使用INTEGER或者STRING來定義那個類型。
很多人傾向于擅自自定義一些數據的格式,比如,使用string來存儲序列化的PHP對象。這樣的話數據庫管理起來可能會變得簡單些,但會使得MySQL成為一個糟糕的數據存儲而且之后很可能會引起故障。8.在查詢中使用* 永遠不要使用*來返回一個數據表所有列的數據。這是懶惰:你應該提取你需要的數據。就算你需要所有字段,你的數據表也不可避免的會產生變化。
9.不使用索引或者過度使用索引 一般性原則是這樣的:select語句中的任何一個where子句表示的字段都應該使用索引。
舉個例子,假設我們有一個user表,包括numeric ID(主鍵)和email address。登錄的時候,MySQL必須以一個email為依據查找正確的ID。如果使用了索引的話(這里指email),那么MySQL就能夠使用 更快的搜索算法來定位email,甚至可以說是即時實現(xiàn)。否則,MySQL就只能順序地檢查每一條記錄直到找到正確的email address。
有的人會在每個字段上都添加索引,遺憾的是,執(zhí)行了INSERT或者UPDATE之后這些索引都需要重新生成,這樣就會影響性能。所以,只在需要的時候添加索引。10.忘記備份!雖然比較罕見,但是數據庫還是有崩潰的危險。硬盤有可能損壞,服務器有可能崩潰,web主機提供商有可能會破產!丟失MySQL數據將會是災難性的,所以請確保你已經使用了自動備份或者已經復制到位。11.Bonus mistake-不考慮使用其他數據庫 對于PHP開發(fā)人員來說,MySQL可能是使用最廣泛的數據庫系統(tǒng),但并不是唯一的選擇。PostgreSQL和Firebird是最強有力的競爭 者:這個兩者都是開源的,而且都沒有被公司收購。微軟提供了sql server Express,甲骨文提供了10g Express,這兩者都是企業(yè)級數據庫的免費版本。有時候,對于一個較小的web應用或者嵌入式應用,SQLite也不失為一個可行的替代方案。