綠色資源網(wǎng):您身邊最放心的安全下載站! 最新軟件|熱門排行|軟件分類|軟件專題|廠商大全

綠色資源網(wǎng)

技術(shù)教程
您的位置:首頁服務(wù)器類其它相關(guān) → 管理服務(wù)器:服務(wù)器死機(jī)的常見六種原因

管理服務(wù)器:服務(wù)器死機(jī)的常見六種原因

我要評論 2010/11/07 22:23:33 來源:綠色資源網(wǎng) 編輯:綠色軟件站 [ ] 評論:0 點擊:328次

如果沒有任何經(jīng)驗,學(xué)習(xí)如何擴(kuò)展一個網(wǎng)站是相當(dāng)困難的。假設(shè)現(xiàn)在你有很多像highscalability.com那樣網(wǎng)站,你需要一些好的解決方案來擴(kuò)展它們,但是世上沒有“萬能藥”,沒有哪個解決方案可以適應(yīng)所有網(wǎng)站的需要。你不得不自己動手,通過不斷地思考來找到一個能滿足你的需求的解決方案。我也是這樣做的。

幾年以前,我的老板來找我,然后對我說:“我們有一個新項目想交給你來做。主要是一個網(wǎng)站的重構(gòu),在一個月內(nèi),這個站點已經(jīng)擁有100萬個用戶了。你必須重新構(gòu)建這個網(wǎng)站,來確保我們可以應(yīng)對將來逐漸增加的用戶數(shù)量。”我已經(jīng)是一個有經(jīng)驗的程序員了,但是在這些方面并不擅長,所以我不得不開始學(xué)習(xí)如何擴(kuò)展一個網(wǎng)站——整個過程歷盡了艱難困苦。(相關(guān)文章推薦:重構(gòu):“為什么”和“怎么做”)

這個網(wǎng)站的后臺軟件是一個PHP內(nèi)容管理系統(tǒng),基于Smarty和MySQL。第一個任務(wù)是找到一個合適的托管公司,這個公司需要具有豐富的經(jīng)驗,可以為我們管理服務(wù)器。經(jīng)過一番調(diào)查研究,我們找到了一家這樣的公司,然后告訴他們我們的需求,他們給我們推薦的配置如下:

負(fù)載均衡器 (+Fallback)
2個Web服務(wù)器
MySQL服務(wù)器(+Fallback)
開發(fā)機(jī)器
他們說,這就是我們需要的所有東西了——對此,我們深信不疑。我們最后得到的配置是:

負(fù)載均衡器 (單核, 1GB 內(nèi)存, Pound)
2個Web服務(wù)器 (雙核, 4GB 內(nèi)存, Apache)
MySQL服務(wù)器 (四核, 8GB 內(nèi)存)
開發(fā)機(jī)器 (單核, 1GB 內(nèi)存)
這個配置十分的基礎(chǔ),并沒有做進(jìn)一步優(yōu)化。為了同步文件(PHP和媒體文件),他們建立了一個active-active DRBD。最后,重構(gòu)開始了——當(dāng)然,我們很興奮。一大早,我們把域名切換到了新的IP上,運(yùn)行我們的監(jiān)控腳本,然后盯著屏幕看。我們馬上在這些機(jī)器上看到了流量,一切似乎都工作的很好。頁面載入的很快,MySQL負(fù)擔(dān)了大量的查詢?nèi)蝿?wù),我們所有人都很高興。

然后,突然我們的電話開始響個不停:“我們不能訪問你們的網(wǎng)站了,這是怎么回事?”我們看了一下我們的監(jiān)控軟件,事實的確如此——服務(wù)器都被frozen了,站點處于離線狀態(tài)!當(dāng)然,我們做的第一件事情是打電話給我們的托管服務(wù)提供商:“我們的所有服務(wù)器都死機(jī)了。這是怎么回事?”他們答應(yīng)檢查一下機(jī)器,一會再打過來。這個電話來了:“你的系統(tǒng)根本就無法插手。你做了什么?它完全被搞砸了。”他們停止了負(fù)載均衡器,然后讓我觀察一下其中一個Web服務(wù)器。看到那個index.php文件,我大吃一驚。它包含一些奇怪的C代碼片段,錯誤消息和一些看起來像日志文件的東西。經(jīng)過進(jìn)一步的調(diào)查,我們發(fā)現(xiàn)是DRBD引發(fā)了這次事故。

"殺死"你的服務(wù)器的方法之一

把Smarty compile和模板緩存放到一個高負(fù)載的active-active DRBD集群上,那么你的服務(wù)器將會掛掉!當(dāng)我們的托管服務(wù)提供商修復(fù)了Web服務(wù)器的時候,為了在這些服務(wù)器的本地文件系統(tǒng)上存儲Smarty緩存文件,我重寫了部分CMS代碼。我們再次上線了!

現(xiàn)在是午后。這個網(wǎng)站通常在下午的晚些時候到傍晚達(dá)到峰值。晚上,幾乎沒有什么流量。我們一直盯著監(jiān)控軟件,我們所有人都緊張得不得了。這個網(wǎng)站可以被載入,但是后來,系統(tǒng)負(fù)載越高,響應(yīng)就越慢。我增加了Smarty模板緩存的生存期,希望這能產(chǎn)生效果——但是很可惜,這并沒有產(chǎn)生效果!不久,服務(wù)器開始給出超時提示,空白頁面和錯誤信息。有兩臺機(jī)器不能處理負(fù)載。

我們的客戶這個時候有一點緊張,但是他說:OK,重構(gòu)通常會引發(fā)一些問題的。只要你能很快地修復(fù)它,那就沒事了!

我們需要一個計劃來減少負(fù)載,然后,我們和我們的托管服務(wù)提供商討論了這個問題。他們的一個系統(tǒng)管理員提出了一個好主意:“伙計,你的服務(wù)器現(xiàn)在運(yùn)行在一個非常常見的Apache+mod_php架構(gòu)上。把你的Web服務(wù)器換成Lighttpd怎么樣?它是一個相當(dāng)小項目,但是維基百科都在使用它。”我們同意了。(相關(guān)文章推薦:更好的選擇 細(xì)數(shù)Apache服務(wù)器的四個替代者)

"殺死"你的服務(wù)器的方法之二

把一個開箱即用的Web服務(wù)器架設(shè)在你的機(jī)器上,并且一點也沒有對它進(jìn)行優(yōu)化,那么你的服務(wù)器將會掛掉!那個管理員盡了他的最大努力,盡快地重新配置了所有的Web服務(wù)器。他拋棄了Apache,然后切換到Lighttpd+FastCGI+Xcache上來。后來,當(dāng)我們重新上線的時候,我們幾乎沒有再感受到壓力。這次,這些服務(wù)器會維持多長時間呢?

這些服務(wù)器運(yùn)行的出奇地好。負(fù)載比以前低很多,平均響應(yīng)時間也不錯。我們徹底放心了,然后我們都回家睡覺了。天已經(jīng)很晚了,我們認(rèn)為沒有其他的事情需要我們做了。第二天,網(wǎng)站運(yùn)行的相當(dāng)好,但是在高峰時段,它一直接近于崩潰的邊緣。我們發(fā)現(xiàn)MySQL是瓶頸,我們再次打電話給我們的托管服務(wù)提供商。他們建議在每個Web服務(wù)器上用MySQL從服務(wù)器進(jìn)行MySQL的主-從同步。

"殺死"你的服務(wù)器的方法之三

再強(qiáng)大的數(shù)據(jù)庫服務(wù)器也有它的極限,當(dāng)你到達(dá)它的極限的時候,你的服務(wù)器將會掛掉!在這種情況下,某些時候你的數(shù)據(jù)庫會變得十分緩慢,以至于隊列中大量的網(wǎng)絡(luò)連接會再次“殺死”我們的Web服務(wù)器。不幸的是這個問題很難修復(fù)。內(nèi)容管理系統(tǒng)在這方面十分的簡單,它本身并不支持單獨地讀取和寫入SQL查詢。重寫這一切花了很長時間,但是相對于每分鐘都遭遇到掛起休眠來說,是相當(dāng)值得的。

MySQL同步真的成功了,網(wǎng)站最終穩(wěn)定了!在接下來的幾周,幾個月里,網(wǎng)站取得了成功,用戶的數(shù)量開始不斷地增加。流量再次超過我們的資源限制,這只是時間的問題。

"殺死"你的服務(wù)器的方法之四

不提前作規(guī)劃,你的服務(wù)器可能會掛掉!

幸運(yùn)的是,我們一直在思考,并且一直在做規(guī)劃。我們優(yōu)化了代碼,減少了每個頁面載入的時候需要的SQL查詢的數(shù)量,我們意外地發(fā)現(xiàn)了MemCached這個好東東。首先,我們在一些核心功能上添加了對MemCached的支持,在一些重量級(運(yùn)行緩慢)的功能上我們也添加了對MemCached的支持。當(dāng)我們把這些變更部署以后,我們簡直不能相信這個結(jié)果——這感覺有點像發(fā)現(xiàn)了“圣杯”。我們每秒查詢的數(shù)量至少降低了50%。我們決定更多地使用MemCached,而不是購買另外一個Web服務(wù)器。

"殺死"你的服務(wù)器的方法之五

忘記做緩存,你會浪費(fèi)很多錢,而且,你的服務(wù)器還會掛掉!事實證明,MemCached幫助我們減少了70%-80%的MySQL服務(wù)器上負(fù)載,同時,在Web服務(wù)器上,也產(chǎn)生了巨大的性能提升。頁面載入的相當(dāng)快。

最終,我們的配置看起來似乎是完美的。即使在高峰時段,我們也無須再擔(dān)心崩潰或頁面響應(yīng)緩慢了。我們搞定它了嗎?不!一臺藍(lán)色的Web服務(wù)器開始有一點響應(yīng)緩慢了。然后出現(xiàn)了一些錯誤消息,空白頁面等等。這個系統(tǒng)負(fù)載能力很不錯,在大多數(shù)情況下服務(wù)器也都在工作,但是只是在“大多數(shù)情況下”而已。

"殺死"你的服務(wù)器的方法之六

把成百上千個小文件放在一個文件夾里,當(dāng)索引節(jié)點耗盡的時候,你的服務(wù)器將會掛掉!

是的,你沒有看錯。我們過去只是關(guān)注MySQL,PHP和Web服務(wù)器本身,并沒有太關(guān)注文件系統(tǒng)。Smarty緩存文件存儲在本地文件系統(tǒng)里——所有的緩存文件都存儲在同一個目錄下。解決方案是把Smarty放在一個專用的ReiserFS分區(qū)里。另外,我們還打開了Smarty的“use_subdirs”選項。

在過去的幾年里,我們一直在優(yōu)化頁面。我們把Smarty緩存放到了memcached中。為了更快速地處理靜態(tài)文件,我們安裝了Varnish來減少I/O負(fù)載。我們還切換到了Nginx(Lighttpd會隨機(jī)的產(chǎn)生error 500的消息),安裝了更多的內(nèi)存,購買了更好的硬件,更多的硬件......這個列表永遠(yuǎn)不會結(jié)束。

總結(jié)

擴(kuò)展一個網(wǎng)站是一個永遠(yuǎn)不會結(jié)束的過程。當(dāng)你解決了一個瓶頸以后,很可能馬上會遇到下一個瓶頸。永遠(yuǎn)都不要這樣想:“就是這樣,我們大功告成了”然后就靠邊站了。這會“殺死”你的服務(wù)器,甚至是你的業(yè)務(wù)。規(guī)劃和學(xué)習(xí)是一個持續(xù)的過程。如果你因為缺乏經(jīng)驗或資源而不能自己完成這個工作,那么可以找一個有能力勝任這個工作,而且很可靠的合作伙伴,和它一起來做這個工作。永遠(yuǎn)都不要停止和你的團(tuán)隊和合作伙伴溝通當(dāng)前遇到的一些問題和即將會遇到的一些問題。思考在前才能爭取主動。

關(guān)鍵詞:服務(wù)器

閱讀本文后您有什么感想? 已有 人給出評價!

  • 0 歡迎喜歡
  • 0 白癡
  • 0 拜托
  • 0 哇
  • 0 加油
  • 0 鄙視