中國人工智能崛起直追美國 但在這些方面還有差距

來源:網(wǎng)絡(luò) 時(shí)間:2017-04-13 15:38:08

中國人工智能崛起直追美國 但在這些方面還有差距

作為人工智能國際頂級(jí)會(huì)議,由美國人工智能協(xié)會(huì)(American Association for Artificial Intelligence)組織的AAAI大會(huì)在美國舊金山召開,在今年的大會(huì)上中國面孔成為不可忽視的力量。在2571篇投稿論文中,中國和美國的投稿數(shù)量分別占到31%和30%,雖然在被接收論文數(shù)量上,中國還是低于美國,但數(shù)量已經(jīng)大幅提升。

一個(gè)小插曲則是,今年的AAAI大會(huì)原計(jì)劃在新奧爾良召開,由于和中國春節(jié)沖突,AAAI Fellow、AAAI現(xiàn)任執(zhí)委楊強(qiáng)教授和幾位教授緊急向組委會(huì)發(fā)送郵件,使得最終破格更改了時(shí)間和地點(diǎn)。

可見,中國在AI領(lǐng)域正在蓄勢(shì),逐步成長為中堅(jiān)力量。據(jù)《烏鎮(zhèn)指數(shù):全球人工智能發(fā)展報(bào)告》,在全球人工智能專利數(shù)量方面,中國以15745個(gè)緊跟在美國26891個(gè)之后位列第二,日本以14604個(gè)排名第三。值得一提的是,三國占總體專利的73.85%。

華人勢(shì)力

“不僅僅是學(xué)者,來參會(huì)的中國公司也變多了?!睏顝?qiáng)表示。從今年的活動(dòng)贊助商而言,百度、騰訊和亞馬遜、IBM一并成為金牌贊助商,小i機(jī)器人、今日頭條也躋身銀牌贊助商之列。在今年收錄的論文中,百度、騰訊、華為、360、今日頭條、攜程等中國公司的人工智能團(tuán)隊(duì)也有出現(xiàn)。

百度研究院院長林元慶對(duì)第一財(cái)經(jīng)記者說,過去幾年里,她在參加國際上人工智能領(lǐng)域的頂級(jí)會(huì)議中,確實(shí)可以看到參加會(huì)議的華人非常多,而且在過去幾年里增長很快。他認(rèn)為這同時(shí)也和國內(nèi)幾家公司在人工智能領(lǐng)域的投入有關(guān)系。

“中國人適合做人工智能,世界上43%的人工智能論文都是中國人寫的?!眲?chuàng)新工場(chǎng)創(chuàng)始人李開復(fù)(微博)曾向第一財(cái)經(jīng)表示。根據(jù)美國白宮此前發(fā)布的《國家人工智能研究與發(fā)展策略規(guī)劃》來看,從2013年到2015年,SCI收錄的論文中,“深度學(xué)習(xí)”或“深度神經(jīng)網(wǎng)絡(luò)”的文章增長了約6倍,按照文章數(shù)量計(jì)算,美國已經(jīng)不再是世界第一。在增加“文章必須至少被引用過一次”附加條件后,中國在2014年和2015年都超過美國,位居前列。

“這一輪人工智能并不是一個(gè)新的革命,而是18世紀(jì)工業(yè)革命自動(dòng)化的一個(gè)延續(xù),技術(shù)一旦掌握到手里,可以迅速擴(kuò)展到做全世界的生意,所以這對(duì)于中國起到了一個(gè)彎道超車的作用?!睏顝?qiáng)表示。

中國人數(shù)學(xué)好、刻苦努力無疑為中國發(fā)展人工智能提供了良好的基礎(chǔ),但更大的驅(qū)動(dòng)力在于產(chǎn)業(yè)需求。一方面對(duì)于傳統(tǒng)企業(yè)而言,需要新技術(shù)來推動(dòng)產(chǎn)業(yè)變革,“中國的經(jīng)濟(jì)結(jié)構(gòu)還有很多不合理、低效率的地方,通過人工智能浪潮,就形成了一種新的競(jìng)爭(zhēng)?!睏顝?qiáng)強(qiáng)調(diào)。

對(duì)于互聯(lián)網(wǎng)巨頭或新興獨(dú)角獸公司而言,同樣需要借助人工智能技術(shù),激發(fā)已經(jīng)存儲(chǔ)的海量數(shù)據(jù),提升服務(wù)精準(zhǔn)度,創(chuàng)造潛在盈利機(jī)會(huì),“互聯(lián)網(wǎng)大市場(chǎng)孕育的應(yīng)用到C輪需要人工智能?!崩铋_復(fù)表示。例如今日頭條在借助人工智能技術(shù),將新聞內(nèi)容和視頻進(jìn)行重新排序,實(shí)現(xiàn)資訊分發(fā)的千人千面,美圖也利用人像數(shù)據(jù)庫,對(duì)數(shù)據(jù)進(jìn)行標(biāo)記、結(jié)構(gòu)化,優(yōu)化圖像算法。

“全世界只有中美兩國有如此大量的數(shù)據(jù)、大規(guī)模的計(jì)算和應(yīng)用場(chǎng)景,在應(yīng)用層面中美基本處于同一起跑線?!钡仄骄€機(jī)器人技術(shù)創(chuàng)始人兼首席執(zhí)行官余凱向第一財(cái)經(jīng)表示。余凱曾擔(dān)任百度研究院副院長、深度學(xué)習(xí)實(shí)驗(yàn)室(IDL)主任,帶領(lǐng)的團(tuán)隊(duì)將深度學(xué)習(xí)技術(shù)成功應(yīng)用于廣告、搜索、圖像、語音等方面,在此之前他也曾在美國NEC研究院、西門子數(shù)據(jù)研究部、微軟亞洲研究院工作。

在余凱看來,中國有世界上最大的互聯(lián)網(wǎng)公司,且擁有搜索、社交、電商、互聯(lián)網(wǎng)金融等很好的應(yīng)用場(chǎng)景,“大規(guī)模的計(jì)算平臺(tái)都需要大規(guī)模的應(yīng)用場(chǎng)景,在小實(shí)驗(yàn)室是做不了的,年輕人在這樣的工作環(huán)境中會(huì)得到持續(xù)的鍛煉,包括工程實(shí)驗(yàn)?zāi)芰?、?duì)算法的理解等。”

“最大的優(yōu)勢(shì)是人多,這種優(yōu)勢(shì)體現(xiàn)在三個(gè)層面,人多意味著市場(chǎng)大,有更強(qiáng)的驅(qū)動(dòng)力去把這件事情做好。其次針對(duì)社會(huì)服務(wù)層面,需要很多數(shù)據(jù)。第三,人才基數(shù)比較大,冒出頂尖人才相對(duì)多一些?!钡谒姆妒絼?chuàng)始人、首席執(zhí)行官戴文淵告訴記者,“從數(shù)據(jù)量、投入的人力財(cái)力來看,中美之間沒有多少差距,且中國更有優(yōu)勢(shì)?!?/p>

中美差異

但將論文數(shù)量視為中國人工智能發(fā)展水平有失公允,雖然在靠近商業(yè)價(jià)值應(yīng)用層面中美并駕齊驅(qū),但在基礎(chǔ)性、原創(chuàng)性研究、創(chuàng)新土壤、人才儲(chǔ)備層面,中國相較美國還存在不小的差距。

“國內(nèi)更多是技術(shù)的落地、產(chǎn)業(yè)化和應(yīng)用,國外仍然有很多人在公司和研究院做前沿研究,包括尋求方法論上的突破,我們擅長把事情做得更細(xì)致,相對(duì)而言突破性和奠基性的工作還不夠多?!钡仄骄€機(jī)器人技術(shù)聯(lián)合創(chuàng)始人、算法副總裁黃暢告訴第一財(cái)經(jīng)。

黃暢畢業(yè)于清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系,曾在美國南加州大學(xué)和NEC美國研究院擔(dān)任研究員,2012年加入百度美國研發(fā)中心,2013年和余凱參與組建百度深度學(xué)習(xí)研究院,任高級(jí)科學(xué)家、主任研發(fā)架構(gòu)師。在黃暢看來,做研究無外乎尋找新的問題和研究新的方法,而在這兩方面國內(nèi)和國外相比還存在不小的差距。

楊強(qiáng)認(rèn)為,深度學(xué)習(xí)是不斷發(fā)展的,研究領(lǐng)域的領(lǐng)導(dǎo)者應(yīng)該是開拓新的領(lǐng)域,而不是在原有的基礎(chǔ)上深挖。“把一個(gè)10層的深度模型拓展到100層甚至1000層,我覺得這個(gè)確實(shí)是一個(gè)進(jìn)步,中國人目前是這個(gè)層次,但這些在我看來并不是一個(gè)原創(chuàng)?!睏顝?qiáng)舉例說道。

“現(xiàn)在很多高校是看教授和學(xué)生的論文達(dá)標(biāo)情況,頂級(jí)會(huì)議論文的發(fā)表對(duì)學(xué)生申請(qǐng)?jiān)盒?、教授評(píng)級(jí)、申請(qǐng)科研經(jīng)費(fèi)等都有幫助,真正做出突破性理論研究,不迎合考核體系的非常少?!贝魑臏Y直言。在他看來,雖然有相當(dāng)數(shù)量的人參與到人工智能研究,但優(yōu)秀的研究成果并不與參與人數(shù)的激增成正比。

余凱認(rèn)為,有一些中國學(xué)生很擅長“刷分”、“刷榜”。“別人做到99.5%,我做了99.7%,并不一定有實(shí)質(zhì)性突破,世界也沒有因?yàn)檫@個(gè)刷分而變得不一樣。原創(chuàng)性的創(chuàng)新需要不一樣的思考,現(xiàn)在講深度學(xué)習(xí)比較多,所有的人都進(jìn)行深度學(xué)習(xí),而不是思考What is wrong ?How to be different?”余凱強(qiáng)調(diào)。

在人工智能領(lǐng)域浸染十年有余的戴文淵也有同樣的感受,“很多人用力的方向有問題,準(zhǔn)確率達(dá)到99.1%、99.15%或者99.2%,其實(shí)沒有什么差別,并不應(yīng)該把精力用在這些地方,而應(yīng)該關(guān)注不到60分的領(lǐng)域,去把它做及格?!?/p>

回歸至深度學(xué)習(xí)的歷史發(fā)展脈絡(luò)來看,正是一個(gè)邊緣化課題走向主流技術(shù)的路徑。早在上世紀(jì)80年代初期,深度學(xué)習(xí)學(xué)派的開山人物Hinton一直堅(jiān)持神經(jīng)網(wǎng)絡(luò)的探索,但受限于當(dāng)時(shí)的電腦速度、數(shù)據(jù)量等問題,深度學(xué)習(xí)理論是一項(xiàng)邊緣化的研究,當(dāng)時(shí)AI的主流研究方向與之截然相反,推崇小樣本學(xué)習(xí),主推SVM學(xué)習(xí)。

正是以Hinton為代表的一群人對(duì)深度學(xué)習(xí)的堅(jiān)持,才一步步將邊緣課題變成人工智能核心技術(shù)?!笆昵斑M(jìn)入這個(gè)領(lǐng)域,中國學(xué)生都在學(xué)優(yōu)化理論,現(xiàn)在一窩蜂地學(xué)習(xí)深度學(xué)習(xí),很少有人在懷疑深度學(xué)習(xí)是不是最優(yōu)解,就像之前很少有人去思考優(yōu)化是不是最優(yōu)解?!贝魑臏Y說道。

人員成本居高不下

在余凱看來,中美之間的差距表現(xiàn)在兩方面,一方面是人才儲(chǔ)備的匱乏,很多高校在很長時(shí)間內(nèi)并沒有人工智能專業(yè),而在美國基本上大的院校都有人工智能教授。以美國卡梅隆大學(xué)為例,設(shè)有專門的機(jī)器人研究所,其中光教授就有100多位,縱向而言,中國布局的時(shí)間也比較晚。

早在2012年余凱回國在百度成立了人工智能團(tuán)隊(duì),擔(dān)任百度人工智能研究院執(zhí)行院長,在他的記憶里,當(dāng)時(shí)在高校招人非常困難,很多是在招進(jìn)百度之后再自己培養(yǎng)。

其次從產(chǎn)業(yè)鏈而言,谷歌(微博)或者Facebook的人工智能團(tuán)隊(duì)不僅可以從斯坦福等院校招人,還可以從微軟、IBM、HP等大公司挖走人工智能領(lǐng)域的人才,“當(dāng)時(shí)別的企業(yè)還想著從百度挖人,無論從科研教育還是整個(gè)產(chǎn)業(yè)界,起步都是晚的,規(guī)模還是小的?!?/p>

至今余凱仍會(huì)頻繁去美國參加一些學(xué)術(shù)會(huì)議,讓自己保持更多的思考,“國外技術(shù)創(chuàng)業(yè)比較多,大家探討的是數(shù)學(xué)公式及算法,而在中國大部分在講趨勢(shì)、概念,如果PPT上放上公式就變得很無聊,心態(tài)比較浮躁?!?/p>

資本驅(qū)動(dòng)之下,人工智能成為創(chuàng)業(yè)最火熱的領(lǐng)域,也在加速人才的流動(dòng)。根據(jù)華創(chuàng)資本發(fā)布的《2016早期企業(yè)薪酬調(diào)研報(bào)告》來看,人工智能和大數(shù)據(jù)領(lǐng)域類的早期企業(yè)在過去一年的員工離職率高達(dá)44%,人員流動(dòng)活躍。

“付不起工資、搶不到人”成為人工智能企業(yè)在人才招聘方面面臨的最大博弈?!叭瞬疟容^少,需要的公司又多,人工智能的人員成本因此居高不下?!贝魑臏Y表示,“我們想要尋找突破常規(guī)的人才,需要找到能夠?qū)?0分的東西做到60分甚至80分的人才,例如目前做深度學(xué)習(xí)的人有很多,但遷移學(xué)習(xí)的人才就非常少?!?/p>

“德才兼?zhèn)洹笔怯鄤P選人的標(biāo)準(zhǔn),所謂德即對(duì)人工智能本身的熱情,愿意為之做長期奮斗,而不是短期的。“大部分人是在趕時(shí)髦,如果冰天雪地的時(shí)候心還是熱的,那才叫熱情”,才則是數(shù)學(xué)功底、統(tǒng)計(jì)功底、編程能力等等。

“優(yōu)秀的人才、優(yōu)質(zhì)的研究成果永遠(yuǎn)匱乏,好比人工智能領(lǐng)域論文從每年800篇漲到3000篇,但真正出色的論文在數(shù)量上基本不會(huì)有太大變化,許多人是在隨大流、挖坑灌水、解決細(xì)枝末節(jié)的問題,產(chǎn)生的真實(shí)價(jià)值并不大?!秉S暢補(bǔ)充道。

與O2O、電商等產(chǎn)業(yè)不同,人工智能的技術(shù)創(chuàng)新仍舊需要長期且基礎(chǔ)性的理論研究工作,如何從頂層設(shè)計(jì)出發(fā),加強(qiáng)人工智能基礎(chǔ)理論研究和核心技術(shù)突破,加強(qiáng)人工智能科研人才、技術(shù)人才的培養(yǎng)與引進(jìn),才是人工智能發(fā)展的持續(xù)動(dòng)力。

人工智能挑戰(zhàn)

一派繁榮之下,正視人工智能的作用變得更為重要。“相較于告訴人們?nèi)斯ぶ悄苣茏鍪裁?,目前更重要的反倒是告訴人們,人工智能不能做什么?!庇鄤P笑著說道。結(jié)合當(dāng)下的發(fā)展情況人工智能仍然面臨諸多挑戰(zhàn)。

首要挑戰(zhàn)就是數(shù)據(jù)不足的問題。眾所周知,人工智能建立在海量數(shù)據(jù)基礎(chǔ)之上,通過大數(shù)據(jù)訓(xùn)練,來優(yōu)化算法模型,以人臉識(shí)別技術(shù)為例,訓(xùn)練這一算法模型需要至少百萬級(jí)別的圖片數(shù)據(jù)。

目前人工智能主要是監(jiān)督式學(xué)習(xí),有監(jiān)督的訓(xùn)練就需要帶標(biāo)簽的數(shù)據(jù),因此數(shù)據(jù)的質(zhì)量和精準(zhǔn)度及輸出結(jié)果密切相關(guān)。“如何剔除數(shù)據(jù)中的噪音、垃圾信息,獲取優(yōu)質(zhì)且?guī)в袠?biāo)簽的數(shù)據(jù)成為新挑戰(zhàn),也正是因?yàn)檫@個(gè)原因,半監(jiān)督式甚至無監(jiān)督式學(xué)習(xí)方法必然成為未來的研究熱點(diǎn)。”黃暢說道。

另一大挑戰(zhàn)在于深度學(xué)習(xí)的推廣和場(chǎng)景遷移能力不足,每個(gè)領(lǐng)域的數(shù)據(jù)都需要重新收集、標(biāo)準(zhǔn)和再訓(xùn)練,很難進(jìn)行跨領(lǐng)域推廣。這些挑戰(zhàn)也是人工智能工業(yè)界和學(xué)術(shù)界急需突破的問題?!霸谡衅傅倪^程中,學(xué)習(xí)深度學(xué)習(xí)的人很多,而懂得遷移學(xué)習(xí),具備思辨能力的人很少。”戴文淵表示。反映到人才培養(yǎng)和教育而言,如何引導(dǎo)并鼓勵(lì)學(xué)生進(jìn)行跨領(lǐng)域、原創(chuàng)性的探索研究尤為重要。

例如今年AAAI最佳論文來自斯坦福大學(xué)計(jì)算機(jī)科學(xué)系的Russell Stewart、Stefano Drmon,他們所撰寫的論文《用物理和特定領(lǐng)域知識(shí)讓神經(jīng)網(wǎng)絡(luò)進(jìn)行不帶標(biāo)簽的監(jiān)督學(xué)習(xí)》,就是將物理知識(shí)與深度學(xué)習(xí)相結(jié)合,通過跨領(lǐng)域研究給AI帶來新的啟發(fā)。

繼續(xù)閱讀與本文標(biāo)簽相同的文章

分享至:

你可能感興趣 換一換

分享到微信朋友圈 ×
打開微信,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。