- 軟件大?。?span>19.11M
- 軟件語言:中文
- 軟件類型:國產(chǎn)軟件
- 軟件類別:免費(fèi)軟件 / 編程工具
- 更新時(shí)間:2017-06-20 09:31
- 運(yùn)行環(huán)境:WinAll, WinXP, Win7, Win8, Win10
- 軟件等級:
- 軟件廠商:
- 官方網(wǎng)站:暫無
9.00M/中文/8.0
19.53M/中文/0.0
34.17M/中文/10.0
316KB/中文/1.7
45KB/中文/1.3
騰訊Angel是騰訊發(fā)布一款開源高性能分布式計(jì)算平臺,可以更加高速精確的處理數(shù)據(jù)材料,其能力超過各類同行軟件,如果你有興趣,就來綠色資源網(wǎng)下載,學(xué)習(xí)源碼吧!
騰訊Angel 1.0是騰訊數(shù)據(jù)平臺部與香港科技大學(xué)合作、北京大學(xué)參與共同開發(fā)的分布式計(jì)算框架,它的主要設(shè)計(jì)目標(biāo)是為了支持超大維度的機(jī)器學(xué)習(xí)模型運(yùn)算。
【網(wǎng)絡(luò)優(yōu)化】
Angel的網(wǎng)絡(luò)解決方案使用的是香港科技大學(xué)的Chukonu。借助Chukonu,Angel可以通過網(wǎng)絡(luò)流量再分配的方式,解決半同步的運(yùn)算協(xié)調(diào)機(jī)制SSP中可能出現(xiàn)的快節(jié)點(diǎn)等待慢節(jié)點(diǎn)的問題,減少了窗口空閑等待時(shí)間。
【整體架構(gòu)】
Angel的整體架構(gòu)參考了谷歌的DistBelief,這是一種最初為了深度學(xué)習(xí)而設(shè)計(jì)、使用了參數(shù)服務(wù)器來解決巨大模型在訓(xùn)練時(shí)更新問題的架構(gòu)。參數(shù)服務(wù)器同樣可用于機(jī)器學(xué)習(xí)中非深度學(xué)習(xí)的模型,如SGD、ADMM、LBFGS的優(yōu)化算法在面臨在每輪迭代上億個(gè)參數(shù)更新的場景中,需要參數(shù)分布式緩存來拓展性能。
1.Angel的核心設(shè)計(jì)理念圍繞模型。它將高維度的大模型切分到多個(gè)參數(shù)服務(wù)器節(jié)點(diǎn),并通過高效的模型更新接口和運(yùn)算函數(shù),以及靈活的同步協(xié)議,實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法的高效運(yùn)行
2.Angel基于Java和Scala開發(fā),能在社區(qū)的Yarn上直接調(diào)度運(yùn)行,并基于PS Service,支持Spark on Angel,未來將會支持圖計(jì)算和深度學(xué)習(xí)框架集成。
3.Angel采用的Parameter Sever架構(gòu)相比其它類型的架構(gòu)更適合解決巨大模型中的參數(shù)更新問題;實(shí)際運(yùn)行中相比參數(shù)更新方面有單點(diǎn)瓶頸的Spark平臺,Angel能夠取得成倍的性能優(yōu)勢,而且模型越大優(yōu)勢越明顯。
4.騰訊開源的Angel給頭疼于大規(guī)模機(jī)器學(xué)習(xí)模型計(jì)算的業(yè)內(nèi)人員提供了一個(gè)新選擇。發(fā)展自己技術(shù)、擴(kuò)大自己的平臺的同時(shí),騰訊也承諾未來的開源力度只會越來越大。
5.圍繞Angel,騰訊還建立了一個(gè)小生態(tài)圈,可以支持Spark之上的MLLib,支持上億的維度的訓(xùn)練;也支持更復(fù)雜的圖計(jì)算模型。
去年Angel發(fā)布時(shí),騰訊平臺部總經(jīng)理、首席數(shù)據(jù)專家蔣杰對騰訊計(jì)算平臺的發(fā)展歷程做過介紹。2009到2011年的第一代平臺主要目標(biāo)是規(guī)模化,形成了TDW(騰訊分布式數(shù)據(jù)倉庫)這樣的架構(gòu);2012到2014年第二代平臺主要是實(shí)時(shí)化,把大規(guī)模計(jì)算搬到平臺上,支持了實(shí)時(shí)性強(qiáng)、規(guī)模大的業(yè)務(wù)需求,但是基于Spark的數(shù)據(jù)訓(xùn)練就遇到了超大維度時(shí)出現(xiàn)瓶頸的問題。
這樣,騰訊開始建設(shè)新的高性能計(jì)算框架,要能支持超大規(guī)模數(shù)據(jù)集,能完成十億級別維度的訓(xùn)練。這就是騰訊的第三臺計(jì)算平臺Angel。圍繞Angel,騰訊還建立了一個(gè)小生態(tài)圈,可以支持Spark之上的MLLib,支持上億的維度的訓(xùn)練;也支持更復(fù)雜的圖計(jì)算模型。
也就是依靠Angel,騰訊獲得了2016年的Sort benchmark的排序的4項(xiàng)冠軍,用98.8秒時(shí)間完成了100T數(shù)據(jù)的排序,刷新了四項(xiàng)世界紀(jì)錄。2015年的這項(xiàng)排序時(shí)間還高達(dá)329秒。
請描述您所遇到的錯(cuò)誤,我們將盡快予以修正,謝謝!
*必填項(xiàng),請輸入內(nèi)容