追逐時尚是女生間永恒的話題,但是“選擇困難癥”卻常常困擾著她們。蘑菇街實現了自動推送用戶關注風格的產品,當用戶看到一件中意的衣服時,將衣服照片上傳至蘑菇街,就能找到適合自己的同款產品。這讓女生的購物選擇更加簡單,但是簡單用戶體驗的背后,有著不簡單的應用技術。“不解風情”的攻城獅、程序猿們是如何利用高大上的技術討得無數女生歡心呢?言歸正傳,下面開啟科普模式!
深度學習加速圖像識別和處理
不管是通過圖片上傳尋找目標圖片,還是協同過濾、內容推薦算法等,都需要強大的高性能計算集群。如何將計算所耗費時間縮短,如何占用的更少服務器,是蘑菇街面臨的首要挑戰。
深度學習(DeepLearning)是近年來高性能計算的熱點應用,在圖像識別等領域有著尤其突出的優勢,蘑菇街采用大數據+深度神經網絡模型相結合,實現圖像加速識別和分析。
神經網絡模型
困擾——超時的訓練時間
但是,通用服務器執行神經網絡模型的效率較低,舉個例子:在雙路的服務器環境下,如果對于某一個類目的7.4GB規模的數據12線程需要超過40小時的訓練時間。與預期整個流程(包括訓練和其他部分的處理時間)在24小時內處理完的目標有很大差距。
因此蘑菇街希望能夠運用更高效的計算集群來解決這些問題。鑒于推薦算法和圖片搜索中存在大量的浮點計算,那么就需要有一個具有高效并行計算能力的服務器集群。相比較于僅能有很少線程同時工作的多核CPU而言,GPU的特性是可以同時執行數千個線程,這將令蘑菇街的系統能處理更多的信息流。
商品推薦算法架構
CPU+GPU加速深度學習
蘑菇街選擇浪潮NF5588M3作為其商品推薦系統的主流機型。NF5588M3改變了傳統單一的計算單元,采用Intel最新處理器核心與NVIDIATesla/Kepler加速計算技術的協同,讓CPU和GPU各司其職,CPU主要承擔更加擅長的邏輯選擇、判斷跳轉和IO通信方面的職責,而GPU則專職計算密集型、高度并行的計算工作,使得計算資源合理的分配,計算性能達到從幾倍到幾百倍的增長。
浪潮NF5588M3服務器
據蘑菇街實際測試數據顯示,在相同計算能力下,浪潮高性能服務器NF5588M3節點提供的精度是傳統兩路服務器的2倍,GPU節點的性能功耗成本是純CPU節點的2倍。有效的降低了直接采購成本、機房空間和設備能耗。
浪潮NF5588M3服務器的產品參數
大數據+大規模計算能力+復雜模型+高效算法讓深度學習真正成為可被應用的技術。浪潮擁有從萬億次到千萬億次的超級計算機產品研發、系統建設、運維服務能力,以及完備的軟硬件產品線。目前,浪潮為百度、阿里、奇虎等互聯網企業的人臉識別、智能搜索業務提供大規模計算支撐平臺。