AWS在中國:拆掉機器學(xué)習成本“高墻”
近日在2020 AWS技術(shù)峰會(huì )與合作伙伴峰會(huì )上,關(guān)于中國市場(chǎng),AWS宣布了一個(gè)重要動(dòng)作:發(fā)布百家APN(AWS合作伙伴網(wǎng)絡(luò ))合作伙伴聯(lián)合解決方案。
具體來(lái)講,AWS在中國將從四個(gè)方面推動(dòng)APN的構建:一是加快AWS云服務(wù)和功能落地中國;二是推動(dòng)跨區域業(yè)務(wù)擴展,包括伙伴出海、ISV落地中國、和區域伙伴合作服務(wù)客戶(hù);三是與伙伴著(zhù)力傳統企業(yè)上云遷移;四是打造垂直行業(yè)解決方案。
AWS大中華區專(zhuān)業(yè)服務(wù)事業(yè)部總經(jīng)理王承華表示,AWS僅在今年在中國區就一共落地了150多項服務(wù)和功能,主要原因有三點(diǎn):
一是大數據分析,通過(guò)大數據分析挖掘商機,是數字原生企業(yè)的成功之處。這也是如今大量傳統企業(yè)在思考的事情,他們希望通過(guò)大數據運營(yíng)解決日常運營(yíng)中的問(wèn)題,同時(shí)進(jìn)行創(chuàng )新。比如很多快消企業(yè)在嘗試如何直達消費者(B2C),涉及到大量數據與運算。
二是AWS在中國區引入了Amazon Athena、AWS Glue、Amazon MSK,與此前的Amazon S3、Amazon Elasticsearch、Amazon Redshift、Amazon EMR等組成一套數據湖解決方案,為向行業(yè)推進(jìn)奠定了技術(shù)基礎。
三是機器學(xué)習方面,目前各行業(yè)也在探索如何從海量數據集過(guò)往經(jīng)驗中總結出適合于自身行業(yè)突破的機器學(xué)習解決方案。今年4月,AWS中國區引入了一項重要服務(wù)SageMaker,以減少對傳統科學(xué)家和工程算法的依賴(lài),有效節省科學(xué)家和數據工程師的時(shí)間。
顯然,受?chē)鴥纫咔閹?lái)的數字化需求浪潮推動(dòng),借助光環(huán)新網(wǎng)(北京)、西云數據(寧夏)的運營(yíng),AWS正在加快在中國市場(chǎng)的落地與布局。
企業(yè)數字化的增長(cháng)引擎
提起SageMaker,對于中國的企業(yè)可能還是個(gè)新鮮事物。
SageMaker于2017年公布,2020年4月正式上線(xiàn)中國區。據介紹,SageMaker是一項完全托管的服務(wù),可以幫助開(kāi)發(fā)者和數據科學(xué)家快速構建、訓練和部署機器學(xué)習模型。SageMaker為開(kāi)發(fā)者提供了彈性筆記本、實(shí)驗管理、自動(dòng)模型創(chuàng )建、模型調試分析,以及模型概念漂移檢測等功能,并將這些功能封裝在首個(gè)面向機器學(xué)習的集成開(kāi)發(fā)環(huán)境SageMaker Studio中。
這種類(lèi)似于“中央廚房”的模式,消除了機器學(xué)習過(guò)程中的繁重工作,讓開(kāi)發(fā)高質(zhì)量模型變得更加輕松。
此次活動(dòng)上,AWS中國區生態(tài)系統級合作伙伴總經(jīng)理汪勇進(jìn)一步說(shuō)明了企業(yè)選擇SageMaker的理由:“數字化已經(jīng)成為新常態(tài),為加強在垂直行業(yè)的深耕,AWS已經(jīng)通過(guò)與中科創(chuàng )達、行者AI、東軟、德勤等技術(shù)/咨詢(xún)合作伙伴的合作,幫助客戶(hù)定制開(kāi)發(fā)人工智能、機器學(xué)習解決方案,加大創(chuàng )新速度和在本地服務(wù)落地的速度?!?br/> 談及這一點(diǎn),作為與AWS合作近10年的客戶(hù)伙伴之一的德比軟件,其最佳實(shí)踐或許比AWS的闡釋更具有借鑒性。
基于SageMaker的實(shí)踐創(chuàng )新:酒店庫存智能緩存
德比軟件是一家為酒店、OTA提供訂單分銷(xiāo)技術(shù)的企業(yè),其客戶(hù)遍布全球,包括希爾頓、洲際、萬(wàn)豪等國際著(zhù)名連鎖酒店。分銷(xiāo)技術(shù),簡(jiǎn)而言之,就是當消費者通過(guò)攜程或谷歌搜索預定酒店時(shí),需要保證對酒店庫存、價(jià)格等實(shí)時(shí)信息的更新,德比軟件相當于這樣一個(gè)信息的對接平臺。
據德比軟件副總裁夏衛介紹,“德比軟件平臺上,每分鐘有一百多份訂單,至少需要2000臺服務(wù)器來(lái)處理業(yè)務(wù)。除了在中國市場(chǎng),在亞洲、歐洲、美洲等地都需要部署服務(wù)器,每天處理的數據量也達到了近200TB以上。如果使用傳統服務(wù)器進(jìn)行部署,那么系統架構將變得非常復雜,且企業(yè)運營(yíng)成本也居高不下?!?br/> 為此,德比軟件從2011年開(kāi)始就使用AWS,如今其業(yè)務(wù)幾乎100%都跑在A(yíng)WS云上,對德比軟件全球的擴張起到很大的支撐作用。隨著(zhù)2020年SageMaker在中國市場(chǎng)的落地,AWS上海人工智能研究院機器學(xué)習解決方案實(shí)驗室基于SageMaker,為德比軟件開(kāi)發(fā)了一款酒店庫存智能緩存系統。
夏衛告訴雷鋒網(wǎng),在使用SageMaker之前,德比軟件也曾嘗試引入機器學(xué)習應用在某些項目中,如智能運維、容量預測、異常檢測等?!捌鸪?,我們還做了一個(gè)庫存預測和異常檢測的神經(jīng)網(wǎng)絡(luò )模型,運行在A(yíng)WS EC2上。如果是小規模運算,針對某個(gè)產(chǎn)品、項目沒(méi)什么問(wèn)題,計算資源也耗費不多,但如果需要在整個(gè)公司內部運作起來(lái),調度幾千臺服務(wù)器,這種方法肯定就不行了,首先成本就非常高。此外,數據調用、數據量、安全合規等問(wèn)題都是需要考慮的問(wèn)題?!?br/> 夏衛表示,酒店庫存的變化有很多要素影響,包括不同的入住日期、入住天數、成人數量、兒童數量甚至兒童的年齡段、不同房型、不同價(jià)格計劃,以及針對不同的渠道等等,這些要素組合起來(lái),當對接一家有6000家連鎖酒店的集團集團酒店時(shí),差不多有一萬(wàn)多億的變化。
考慮一番后,德比軟件遷移到SageMaker 的Pipeline上實(shí)現。
通過(guò)酒店庫存智能緩存系統,可以實(shí)現分析實(shí)時(shí)查詢(xún)價(jià)格的請求數據,以及十多年來(lái)的歷史訂單數據,從而自動(dòng)找到酒店庫存變化的規律;然后通過(guò)周期性訓練,最終得到能夠預測除熱門(mén)以及易變化酒店的酒店產(chǎn)品模式,實(shí)現及時(shí)更新緩存,并根據預測的產(chǎn)品狀態(tài)過(guò)期時(shí)間,快速推送給渠道。
接下來(lái),德比軟件還規劃通過(guò)SageMaker構建以下幾方面核心能力:一是酒店內容上,包括圖片、文字描述,如房型名稱(chēng)可以通過(guò)NLP進(jìn)行訓練生成;二是如何將原先需要手工錄入的信息實(shí)現自動(dòng)化;三是在智能客服方面,通過(guò)技術(shù)推廣到更多中小酒店。
據初步測試,這套算法可以幫助德比軟件提高準確率20%以上。盡管還是初步的嘗試,完全成效還未體現出來(lái),但按照德比軟件目前在全球的訂單量,在全面部署后,哪怕僅提高1%,也可能為客戶(hù)帶來(lái)上億美元的額外收入。
這次峰會(huì )上AWS還宣布與畢馬威、神州數碼簽署戰略合作關(guān)系,在更多領(lǐng)域深化合作。例如,東軟集團基于A(yíng)WS構建了云原生的汽車(chē)在線(xiàn)導航業(yè)務(wù)(NOS),速石科技構建的基于A(yíng)WS云上資源和用戶(hù)本地算力的一站式交付平臺,外研在線(xiàn)在A(yíng)WS上構建的Unipus智慧教學(xué)解決方案等等……
不難發(fā)現,包括AWS這樣的云巨頭服務(wù)商在內,當下云市場(chǎng)已經(jīng)從單純云技術(shù)的輸出,真正轉變?yōu)樵粕鷳B(tài)之間的競爭。
評論