7月30日消息,在CVPR 2019的低功耗圖像識別挑戰(zhàn)賽(LPIRC ,Low-Power Image Recognition Challenge)上,阿里AI獲得在線圖像分類任務(wù)第一名。阿里AI識別百萬圖像的算法,在手機(jī)上也能跑起來了。
CVPR是計(jì)算機(jī)視覺領(lǐng)域的頂級學(xué)術(shù)會議,低功耗圖像識別挑戰(zhàn)賽由IEEE Rebooting Computing (RC)項(xiàng)目負(fù)責(zé)發(fā)起,通過識別準(zhǔn)確率、執(zhí)行速度和能量消耗三項(xiàng)指標(biāo),考察AI視覺識別技術(shù)在輕量級設(shè)備上的表現(xiàn)。
阿里AI參加了挑戰(zhàn)賽三項(xiàng)任務(wù)之一的在線圖像分類。比賽使用Pixel 2 手機(jī),要求AI在 10 分鐘內(nèi)分類20000 張圖像,考察分類速度和精度。

挑戰(zhàn)賽使用Imagenet數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù),AI學(xué)習(xí)了約 120 萬張涵蓋1000個(gè)類別的圖像,實(shí)現(xiàn)67.4%的分類精度,比官方提供的基準(zhǔn)線高3.5%。在最終的測試中,阿里AI實(shí)現(xiàn)了23ms的單張圖片分類速度,排名第一。
這項(xiàng)技術(shù)可將深度學(xué)習(xí)算法壓縮40到100倍,便捷地部署于端側(cè)設(shè)備,在智能手機(jī)、自動駕駛、工業(yè)自動化等領(lǐng)域應(yīng)用前景廣闊。
好的深度學(xué)習(xí)模型通常擁有復(fù)雜的結(jié)構(gòu)和巨大的參數(shù)量,必須借助云端的大數(shù)據(jù)處理能力和高性能芯片的算力運(yùn)行。如果移到端側(cè),就得搭載體積大、功耗高的設(shè)備。比如無人車,它們在行駛過程中實(shí)時(shí)收集大量路況數(shù)據(jù),一部分在云端處理,一部分在本地處理。相比云端計(jì)算,本地計(jì)算不容易受時(shí)延影響,但受限于功耗,本地服務(wù)器能夠承擔(dān)的任務(wù)很有限。

阿里達(dá)摩院線下智能團(tuán)隊(duì)為端側(cè)人工智能提供了解決方案。基于目前主流的移動端輕量級網(wǎng)絡(luò),該團(tuán)隊(duì)設(shè)計(jì)了一個(gè)快速小型網(wǎng)絡(luò),在低分辨率圖像輸入情況下仍能保持較高的分類精度。利用量化技術(shù),該模型還可進(jìn)一步壓縮,在幾乎無損精度的同時(shí)提升速度。
如果把該算法部署于無人車,就能在維持原有性能的前提下大大降低處理器功耗;或在不犧牲功耗的情況下大大提升處理器性能,甚至將部分云端處理任務(wù)挪到本地。
目前,這項(xiàng)技術(shù)已在衛(wèi)星遙感影像分析上顯示威力。衛(wèi)星遙感影像常被用來監(jiān)測土地、河流等自然資源,單張影像大小以GB為單位。同樣規(guī)模的影像分析任務(wù),傳統(tǒng)人力方法需要幾個(gè)月,交給AI則只要幾分鐘。部署在GPU服務(wù)器、TX2端上盒子等的低功耗圖像識別技術(shù),能以非常高的精度、極速完成海量圖片識別。