十大步驟提高Domino郵件服務(wù)器性能
通過性能監(jiān)測和分析,您可以知道服務(wù)器的運(yùn)行狀況,即在當(dāng)前的工作負(fù)載下服務(wù)器是否出色運(yùn)行。正如網(wǎng)絡(luò)中的瓶頸一樣,它可以幫助您找到服務(wù)器配置中的限制因素。
通過下面十個步驟,您可以最大限度地提高Domino服務(wù)器的性能:
一、了解您的配置
Domino管理員應(yīng)該知道所支持的服務(wù)器的配置。任何一個服務(wù)器的主要元件有內(nèi)存、CPU、磁盤(包括邏輯的和物理的),其它元件諸如在線緩沖內(nèi)存以及磁盤控制器的數(shù)量等,也是比較重要的。
下面是一些附加的注意事項,可以使您避免發(fā)生配置相關(guān)的問題:
1)使用盡可能快的磁盤(例如10,000 RPMs)。
2)在軟件RAID上使用硬件RAID,這樣速度更快,并且可以減少CPU的負(fù)載。
3)一個充足的磁盤子系統(tǒng)可以減少內(nèi)存需求,因為較少的臨時I/O來占用內(nèi)存。
4)對于Windows NT平臺,整理磁盤碎片能充分提高性能。建議每周整理磁盤碎片一次。
5)確保服務(wù)器即使是在最大負(fù)載時,也至少有4MB內(nèi)存可用(10到20MB更好)。要注意的是,平臺的緩存策略有可能會起阻礙作用。
6)標(biāo)準(zhǔn)的服務(wù)器配置對于Domino服務(wù)器不一定是最優(yōu)的,重要的事情是足夠的磁盤和控制器。您可以使用硬件銷售商的NotesBench基準(zhǔn)數(shù)據(jù)作為指導(dǎo)。
二、通過物理磁盤來分配I/O
通常物理的和邏輯的磁盤結(jié)構(gòu)是人們經(jīng)常忽略的系統(tǒng)資源,是最經(jīng)常過載使用的。在很多Domino服務(wù)器上提高性能的最好辦法是通過不同的物理磁盤來分配I/O。
理想的情況是,將下面與I/O相關(guān)的文件放在不同的物理磁盤上:
1)不同平臺的頁面文件
2)您的NSF文件
3)Domino R5 事務(wù)日志
如果您能將它們放在不同的控制器上,那是最好的。這個方法是通過在總線、控制器、端口和磁盤上分發(fā)負(fù)載來提高I/O吞吐量。因此,最好是使用幾個小磁盤,而不是一個容量大的磁盤。特別地,您將R5 事務(wù)日志與其它磁盤活動隔離地越開,您的服務(wù)器性能就越好。
注意,對于某些系統(tǒng),例如AS/400,操作系統(tǒng)能在可用的磁盤和控制器間自動優(yōu)化數(shù)據(jù)分布 。
三、經(jīng)常對性能方面的衡量數(shù)據(jù)做日志
如果您不做性能方面衡量數(shù)據(jù)的日志,您就不能衡量您的調(diào)整是成功或失敗。如果您經(jīng)常做日志,您不但對您所做的事情有一個更好的理解,更為額外的支出提供了詳細(xì)的文件證明。
您需要從操作系統(tǒng)和Domino兩方面來度量。下面是主要的衡量標(biāo)準(zhǔn)(根據(jù)平臺):
1)全部的CPU使用率(以百分?jǐn)?shù)表示)。如果該值大于70%或80%,則在很多平臺上就會有一個紅色的標(biāo)志來警告,例如Windows NT。
2)可用內(nèi)存或使用率。記住,當(dāng)可用內(nèi)存小于4MB時,減少緩存需求。
3)磁盤序列長度(通常在序列中應(yīng)該小于2項)和平均磁盤服務(wù)時間(對于NT應(yīng)該小于70%)。
4)頁面文件尺寸和使用率。使用率應(yīng)該正當(dāng)?shù)氐鸵恍?,或值得評估您的磁盤子系統(tǒng)的使用率和效率。例如,對于NT平臺上的Domino郵件服務(wù)器來說,頁面使用率一般應(yīng)小于150頁/秒。
5)關(guān)于郵件吞吐量、復(fù)制、Web服務(wù)器活動、數(shù)據(jù)庫活動等方面的Domino統(tǒng)計和事件。
6)Domino日志(log.nsf),很煩瑣但的確很有用(注意僅當(dāng)需要時才啟用日志,因為它會影響服務(wù)器性能)。
注意經(jīng)常收集和分析數(shù)據(jù),在做重大配置改變之前或之后,捕獲性能方面的數(shù)據(jù)是很必要的。
四、優(yōu)化Domino R5
在自動配置和動態(tài)重新配置關(guān)鍵參數(shù)以達(dá)到最大性能方面,Domino R5做了很多工作。下面是關(guān)于如何優(yōu)化Domino R5服務(wù)器本身的一些建議:
1)正確設(shè)置mailbox的數(shù)量。多個mail.box文件可以減少存放郵件和其它郵件相關(guān)的活動對mail.box文件的爭奪。當(dāng)您添加第二個 mail.box時,就可以很大地改善性能。經(jīng)驗是我們使用一個mail.box支持1~200個用戶,兩個或更多的mail.box支持 200~1000個用戶,最多十個mail.box支持1000個以上的用戶。
2)對于非分區(qū)的系統(tǒng),讓Domino動態(tài)設(shè)置NSF_Buffer_Pool_Size變量。對于低內(nèi)存的服務(wù)器配置,這一點特別重要,大的緩沖區(qū)會妨礙核心的內(nèi)存管理。
3)對于分區(qū)的系統(tǒng),您需要分配NSF_Buffer_Pool_Size,因為Domino不能自動決定每個分區(qū)中實際可用的內(nèi)存。我們推薦的公式是:(系統(tǒng)內(nèi)存/分區(qū)數(shù)量)/4。
4)基于可用內(nèi)存,讓Domino根據(jù)需要來分配郵件傳輸線程(為了本地傳輸)。
5)根據(jù)需要,讓Domino路由器來分配郵件傳輸線程(為了發(fā)送到其它服務(wù)器)。
6)使用R5事物日志。它提供給您大批完整的數(shù)據(jù),可以使服務(wù)器快速啟動,將性能提高10%~20%。
適當(dāng)?shù)嘏渲靡粋€Domino R5服務(wù)器運(yùn)行在中檔的Windows NT機(jī)器上,每分鐘能傳輸20,000條消息(每條消息平均10K字節(jié))!
五、使用NotesBench基準(zhǔn)數(shù)據(jù)
很多基準(zhǔn)只是告訴您銷售商想要您知道的東西,但是NotesBench基準(zhǔn)卻與眾不同。 NotesBench基準(zhǔn)數(shù)據(jù)可以讓您對不同銷售商的不同硬件配置上的Domino容量做一個詳細(xì)的比較,您甚至可以用這些數(shù)據(jù)估計出總成本。仔細(xì)閱讀 NotesBench數(shù)據(jù)和由它得到的詳細(xì)報告,是一個非常好的收集信息的方法。通過它,您可以優(yōu)化您的系統(tǒng)配置。檢測專家們使用(或未用)的磁盤結(jié)構(gòu)、內(nèi)核設(shè)置、補(bǔ)丁程序等,從他們的系統(tǒng)中得到最大的性能參數(shù)。
六、從信號中分析
信號是用于處理線程的一個通信機(jī)制。本質(zhì)上信號是使用握手機(jī)制來決定對資源的使用。當(dāng)服務(wù)器超負(fù)荷工作時,管理員可能會從控制臺收到信號。下面是通過觀察Domino 4.6而得到的一些常見的信號,并解釋了從性能方面考慮,它們意味著什么:
1)Collection (0x30B) 和 Collection Queue (0x309).:暗示了CPU和內(nèi)存達(dá)到了瓶頸。最好的解決辦法是將管理進(jìn)程活動延期到空閑的時間,優(yōu)化I/O子系統(tǒng)。
2)DB (0x245) 和 DB Queue (0x244):暗示了數(shù)據(jù)庫緩存和磁盤I/O 達(dá)到了瓶頸。 最好的解決辦法是增加更多的內(nèi)存,優(yōu)化I/O字系統(tǒng)。啟用域級的復(fù)制也會有所幫助。
3)BTree (0x255):暗示了怎樣存儲視圖和刷新視圖索引的問題。最好的解決辦法是將刷新視圖索引延期到空閑的時間,優(yōu)化I/O子系統(tǒng)。
七、了解服務(wù)器過載使用時的癥狀
對服務(wù)器來說典型的問題是速度慢或郵件傳輸失敗,延長了用戶的響應(yīng)時間和查找郵件地址的時間。
為檢查郵件傳輸,您可以通過查看您的磁盤使用時間的百分比和郵件序列的長度。對于R5,您也可以檢查 mail.box 文件的數(shù)量和本地郵件傳輸線程的數(shù)量。
為了提高響應(yīng)時間,應(yīng)盡可能優(yōu)化與I/O相關(guān)的文件在磁盤子系統(tǒng)中分布的方式。
如果地址搜索很慢,可以使用戶在自己的客戶機(jī)上使用輕量目錄,這樣會減少服務(wù)器和網(wǎng)絡(luò)的負(fù)載。您也可以檢查姓名搜索緩存(Name Lookup Cache)的點擊率,一個好 的點擊率值應(yīng)該是85%。
如果問題是很慢的頁面刷新率或不響應(yīng)的Web服務(wù)器,檢查HTTP線程的數(shù)量和磁盤使用時間的百分比。設(shè)置HTTP線程的數(shù)量為1:10 (每十個用戶使用一個線程)。
如何來確定一個服務(wù)器沒有被充分使用?對于NT,指數(shù)是CPU的使用率低于50%,磁盤訪問率低于50%,或者經(jīng)常有多于200MB的可用內(nèi)存。但是注意新添加的用戶所需要的資源可能不等于您當(dāng)前用戶的平均資源。例如,隨著用戶數(shù)量的增加,每個用戶的內(nèi)存需求會減少,因為固定的內(nèi)存被分配給了更多的用戶。
八、考慮群集
群集是Domino企業(yè)服務(wù)器的主要特征。群集能幫助您實現(xiàn)動態(tài)負(fù)載均衡,在群集中可以自動優(yōu)化資源的使用。在群集中還可以實現(xiàn)郵件和應(yīng)用的失效轉(zhuǎn)移,包括Web應(yīng)用。您可以將Domino支持的任何平臺上的R4和R5服務(wù)器集合在一個群集中,也可以將分區(qū)服務(wù)器和未分區(qū)的服務(wù)器群集在一起。
Domino群集是增加服務(wù)器資源的魯棒性和可靠性的最好方法,也是將R5服務(wù)器加入到R4群集中的最安全的方法。
根據(jù)您的平臺,一個低價格系統(tǒng)的群集能以較低的初始成本提供比一個單獨龐大的服務(wù)器更好的可靠性。另外,群集大大減少了連接服務(wù)器失敗的用戶數(shù)量。例如,在Windows NT平臺上,如果一個系統(tǒng)中激活的用戶超過750個,我們推薦使用群集。
九、考慮分區(qū)
分區(qū)能提高資源使用率和高端Domino系統(tǒng)的可靠性,也可以使您在維持合并利益的同時,按部門或功能來分布服務(wù)器。一些組織甚至使用分區(qū)來創(chuàng)建“服務(wù)級選項”(即將一些重要的經(jīng)理人員放在一個分區(qū),其他人放在另一個分區(qū))。
通常,系統(tǒng)中分區(qū)的數(shù)量不應(yīng)該超過CPU的數(shù)量。AS/400系統(tǒng)是一個例外,它非常適合做分區(qū)。AS/400平臺本身從邏輯上也將分區(qū)隔離開,所以即使一個分區(qū)壞了,其它的分區(qū)仍可以正常工作。
十、知道何時聯(lián)合何時分布
除非您有令人信服的理由,否則選擇在分布之上聯(lián)合作為增長策略。聯(lián)合總是降低成本并提高可靠性:較少的服務(wù)器意味著不太復(fù)雜的服務(wù)器拓?fù)洹⑤^少的服務(wù)器對服務(wù)器之間的活動、較少的網(wǎng)絡(luò)流通、較少的復(fù)制、服務(wù)器之間較少的郵件傳輸。
什么時候選擇分布服務(wù)器而不是將它們聯(lián)合在一起?您可能有地理上的分布要求,本地的服務(wù)器以低成本來處理本地的用戶和數(shù)據(jù)?;蛘吣_始的拓展比較小,但是增長很快,所以添加更多的服務(wù)器來容納新用戶,或為了更好地利用當(dāng)前的投資。
關(guān)鍵詞:Domino,郵件服務(wù)器
閱讀本文后您有什么感想? 已有 人給出評價!
- 1
- 1
- 2
- 2
- 2
- 2