身為全球最大社交網(wǎng)絡(luò),F(xiàn)acebook的人工智能究竟是什么水平?

來源:網(wǎng)絡(luò) 時(shí)間:2017-03-01 14:10:17

身為全球最大社交網(wǎng)絡(luò),F(xiàn)acebook的人工智能究竟是什么水平?

【AI世代編者按】美國科技新聞網(wǎng)站BackChannel近日刊文,介紹了Facebook內(nèi)部的人工智能團(tuán)隊(duì)及其發(fā)展現(xiàn)狀。

以下為AI世代(微信:tencentAI)編譯整理的文章內(nèi)容:

在被任命為Facebook應(yīng)用機(jī)器學(xué)習(xí)事業(yè)部(以下簡稱“AML”)負(fù)責(zé)人,幫助這家全球最大社交網(wǎng)絡(luò)部署人工智能技術(shù)時(shí),杰奎因·奎諾內(nèi)羅·坎德拉(Joaquin Quinonero Candela)有些遲疑。

杰奎因·坎德拉,F(xiàn)acebookAML事業(yè)部工程總監(jiān)

坎德拉是一位出生在西班牙的科學(xué)家,他總是自稱“機(jī)器學(xué)習(xí)人士”。之所以有所遲疑,并不是因?yàn)樗麤]有目睹人工智能給Facebook帶來了多大的幫助。自從2012年加盟這家社交網(wǎng)絡(luò)巨頭以來,他已經(jīng)見證了該公司廣告業(yè)務(wù)的轉(zhuǎn)變——他們利用機(jī)器學(xué)習(xí)技術(shù)提升了贊助內(nèi)容的相關(guān)性和營銷效果。

更重要的是,他通過一種獨(dú)特的方式用技術(shù)武裝自己部門的下屬——即便這些人并沒有接受過專業(yè)的人工智能技術(shù)培訓(xùn)。不僅如此,他還擴(kuò)大了機(jī)器學(xué)習(xí)技術(shù)在整個(gè)廣告部門的普及程度。

但他并不確定同樣的“魔法”能在更大范圍內(nèi)展現(xiàn)出來,因?yàn)檫@個(gè)平臺(tái)上的數(shù)十億用戶之間的聯(lián)系取決于模糊的價(jià)值觀,而不是用來衡量廣告的硬性數(shù)據(jù)。“我需要確定這么做的確有價(jià)值?!彼岬竭@次任命時(shí)如是說。

盡管有些懷疑,坎德拉還是接受了任命。而現(xiàn)在雖然距離那時(shí)僅僅過去兩年時(shí)間,但他當(dāng)初的遲疑卻變得非常可笑。

究竟有多可笑?坎德拉上月在紐約的一次會(huì)議上對臺(tái)下的一眾工程師發(fā)表了演講?!拔乙l(fā)表一份重要聲明?!彼嬲f,“如果沒有人工智能,F(xiàn)acebook如今已經(jīng)無法存在下去。你或許并未意識(shí)到,但每當(dāng)你使用Facebook或Instagram或Messenger時(shí),你的使用體驗(yàn)都有人工智能的一份功勞?!?/p>

去年11月,我來到Facebook位于門羅帕克的總部采訪坎德拉和他的團(tuán)隊(duì)時(shí),便得以目睹人工智能如何在突然之間成為Facebook的生存養(yǎng)料。目前為止,提到Facebook在這一領(lǐng)域的發(fā)展,很多目光都會(huì)集中于該公司組建的世界級Facebook人工智能研究事業(yè)部(以下簡稱“FAIR”),該部門的領(lǐng)導(dǎo)者是著名的神經(jīng)網(wǎng)絡(luò)專家嚴(yán)·勒坤(Yann LeCun)。

與谷歌(微博)微軟、百度、亞馬遜和蘋果(這家以保密著稱的公司如今也允許其科學(xué)家發(fā)布研究成果)等競爭對手一樣,F(xiàn)AIR也成為供不應(yīng)求的頂尖人工智能項(xiàng)目畢業(yè)生優(yōu)先選擇的公司。計(jì)算機(jī)在視覺、聽覺甚至對話能力上取得的進(jìn)步都得益于這種類似于大腦的數(shù)字神經(jīng)網(wǎng)絡(luò),而FAIR則是這方面研究成果最為豐厚的機(jī)構(gòu)之一。

但坎德拉的AML事業(yè)部則負(fù)責(zé)將FAIR的研究成果與Facebook的實(shí)際產(chǎn)品融合到一起,更重要的是,他們還將幫助該公司的所有工程師,把機(jī)器學(xué)習(xí)技術(shù)融合到自己的工作中。

由于Facebook已經(jīng)離不開人工智能,所以所有工程師都必須使用這項(xiàng)技術(shù)。

把人工智能塞到每個(gè)人手中

就在我造訪Facebook前兩天,美國剛剛結(jié)束總統(tǒng)大選,而該公司CEO馬克·扎克伯格(Mark Zuckerberg)也剛剛在一天前回應(yīng)稱,那些宣稱Facebook傳播假新聞幫助唐納德·特朗普(Donald Trump)當(dāng)選美國總統(tǒng)的想法“太瘋狂”。由于人們之前就對Facebook的假新聞泛濫狀況心懷不滿,所以扎克伯格的這番評論無異于火上澆油。

盡管很多爭議并不在坎德拉的職責(zé)范圍內(nèi),但他知道,F(xiàn)acebook需要借助機(jī)器學(xué)習(xí)技術(shù)來解決假新聞危機(jī),而這恰恰是他團(tuán)隊(duì)的職責(zé)之一。

但為了讓公司內(nèi)部的公關(guān)人員安心,坎德拉還向我展示其他一些東西,以此體現(xiàn)他的團(tuán)隊(duì)正在從事的工作。令我意外的是,這其實(shí)是一套有點(diǎn)無聊的把戲:它可以將一張照片或一段視頻按照某位著名畫家的獨(dú)特風(fēng)格進(jìn)行渲染。這很容易讓我們想起Snapchat上的各種噱頭——把照片轉(zhuǎn)化成畢加索風(fēng)格的畫作早已不是什么新鮮技術(shù)。

“這種技術(shù)名為神經(jīng)風(fēng)格轉(zhuǎn)移?!彼忉尩溃熬褪且惶状笠?guī)模的神經(jīng)網(wǎng)絡(luò),它可以通過訓(xùn)練將一張照片重新繪制成特定風(fēng)格的畫作?!?他掏出自己的手機(jī),拍了一張照片,然后在屏幕上操作了一番,照片很快就被渲染稱梵高名畫《星夜》(The Starry Night)的風(fēng)格。

更令人驚奇的是,他還能在視頻播放過程中將內(nèi)容渲染成類似的風(fēng)格。但他表示,真正重要的東西其實(shí)是在肉眼無法看到的:Facebook開發(fā)的神經(jīng)網(wǎng)絡(luò)已經(jīng)可以在手機(jī)上獨(dú)立運(yùn)行。

這同樣不算新奇——蘋果之前也宣稱已經(jīng)可以在iPhone上完成一些神經(jīng)網(wǎng)絡(luò)計(jì)算。但由于Facebook并不控制硬件,所以他們面臨的難度要大得多。坎德拉表示,他的團(tuán)隊(duì)之所以能完成這套“把戲”,是因?yàn)樗麄兎e累了大量經(jīng)驗(yàn)——每個(gè)項(xiàng)目都可以降低其他項(xiàng)目的工作難度,每個(gè)項(xiàng)目也都可以讓未來的產(chǎn)品在接受更少培訓(xùn)的情況下,開發(fā)類似的產(chǎn)品——從而加快類似項(xiàng)目的開發(fā)速度。

“從啟動(dòng)項(xiàng)目到公開測試,我只花了8個(gè)星期,這太瘋狂了?!彼f。

他表示,在這么短時(shí)間內(nèi)完成任務(wù)還有另外一個(gè)秘訣,那就是合作——這也恰恰是Facebook文化的基石。具體到這個(gè)項(xiàng)目,正是因?yàn)槟軌蜉p易接觸到其他事業(yè)部的研究成果——尤其是熟悉iPhone硬件的移動(dòng)部門——才使得他們能夠把原本需要借助數(shù)據(jù)中心才能完成的圖像渲染任務(wù),通過手機(jī)來獨(dú)立實(shí)現(xiàn)。

從左到右依次為AML事業(yè)部工程總監(jiān)杰奎因·坎德拉,應(yīng)用計(jì)算機(jī)視覺團(tuán)隊(duì)負(fù)責(zé)人馬諾哈·帕魯麗,技術(shù)產(chǎn)品精力里塔·阿奎諾,工程經(jīng)理拉簡·蘇巴

這項(xiàng)技術(shù)不僅可以方便用戶為自己的親友拍攝《吶喊》風(fēng)格的短片,還能讓整個(gè)Facebook變得更加強(qiáng)大。從短期來看,這讓該公司得以更好地解讀語言、理解文本。從長期來看,他還能對你的所見、所言展開實(shí)時(shí)分析。

“我們以秒為單位,甚至比秒還短——必須實(shí)時(shí)完成。”他說,“我們是社交網(wǎng)絡(luò),如果我要預(yù)測人們對某段內(nèi)容的反饋,我的系統(tǒng)就要立刻作出反應(yīng),對嗎?”

坦德勒又看了一眼他剛才拍的那張梵高風(fēng)格的自拍像,完全不屑于掩飾自豪之情?!澳軌蛟谑謾C(jī)上運(yùn)行復(fù)雜的神經(jīng)網(wǎng)絡(luò),便能將人工智能放到所有人的手上。”他說,“這并不是偶然發(fā)生的,這都得益于我們在公司內(nèi)部展示人工智能的方式?!?/p>

“這是一場漫長的旅程?!彼a(bǔ)充道。

微軟老兵大顯神威

坎德拉出生在西班牙,他3歲時(shí)隨家人搬到摩洛哥,在那里的法語學(xué)校就讀。盡管畢業(yè)時(shí)的文理學(xué)科都獲得高分,但他還是決定入讀馬德里的一所學(xué)校,學(xué)習(xí)一門在他看來最難的學(xué)科:通信工程。這門學(xué)科不僅需要掌握天線和放大器等物理知識(shí),還要對數(shù)據(jù)有充分的理解,他認(rèn)為這“很酷”。

坎德拉對開發(fā)自適應(yīng)系統(tǒng)的教授非常著迷。他自己開發(fā)了一套系統(tǒng),利用智能過濾器來改善手機(jī)漫游信號,他現(xiàn)在將其稱做“嬰兒階段的神經(jīng)網(wǎng)絡(luò)”。他對訓(xùn)練算法格外著迷,而不太喜歡大量編寫代碼。2000年在丹麥度過的一個(gè)學(xué)期進(jìn)一步激發(fā)了他在這方面的興趣,他在那里見到了機(jī)器學(xué)習(xí)教授卡爾·拉斯穆森(Carl Rasmussen)。

拉斯姆森曾在多倫多師從傳奇人物、機(jī)器學(xué)習(xí)鼻祖吉奧夫·辛頓(Geoff Hinton)。畢業(yè)前夕的坎德拉原本要參加寶潔的領(lǐng)導(dǎo)力項(xiàng)目,但卻接到了拉斯姆森的博士項(xiàng)目邀請。于是,他選擇了機(jī)器學(xué)習(xí)。

2007年,他來到位于英國劍橋的微軟研究院工作。入職后不久,他獲悉微軟正在舉行一項(xiàng)面向所有員工的競賽:該公司即將推出必應(yīng)搜索,所以需要對關(guān)鍵字搜索廣告進(jìn)行改進(jìn)——精確預(yù)測用戶何時(shí)會(huì)點(diǎn)擊一則廣告。

優(yōu)勝團(tuán)隊(duì)的方案將被投入實(shí)體測試,以便了解它是否有最終發(fā)布的價(jià)值。而優(yōu)勝團(tuán)隊(duì)本身也將獲得免費(fèi)的夏威夷旅行作為獎(jiǎng)勵(lì)。共有19個(gè)團(tuán)隊(duì)參與競賽,坎德拉的團(tuán)隊(duì)與另外一個(gè)團(tuán)隊(duì)并列第一。他獲得了免費(fèi)旅行的機(jī)會(huì),但由于微軟遲遲沒有推進(jìn)更重要的獎(jiǎng)勵(lì),導(dǎo)致他感覺自己被欺騙了——微軟一直沒有對他的方案展開測試,以判斷這個(gè)方案能否最終作為產(chǎn)品推出。

接下來發(fā)生的事情展示出坎德拉的堅(jiān)決態(tài)度。他展開了一場“瘋狂的運(yùn)動(dòng)”,說服微軟給他一次機(jī)會(huì)。他在微軟內(nèi)部展開了五十多次對話,還開發(fā)了一個(gè)模擬器來展示自己算法的優(yōu)越性。他甚至找到直接負(fù)責(zé)這項(xiàng)決策的副總裁:他在吃自助餐時(shí)主動(dòng)坐到那位副總裁身邊,甚至?xí)プ「黄鹕蠋臋C(jī)會(huì)向其宣傳自己的方案。他還在沒有事先請示的情況下闖入這位高管的辦公室,聲稱說話必須算數(shù),他的算法的確更好。

最終,坎德拉的算法在2009年隨同必應(yīng)一起推出。

Facebook 20號樓內(nèi)景

2012年初的一個(gè)周五,坎德拉到Facebook門羅帕克園區(qū)拜訪了一個(gè)朋友。讓他震驚的是,他聽說該公司的員工不需要獲得上司批準(zhǔn),也可以測試自己的項(xiàng)目。他們就是這么做的。于是他星期一便去Facebook參加面試,周末就拿到了錄取通知。

加入Facebook廣告團(tuán)隊(duì)后,坎德拉的工作是領(lǐng)導(dǎo)一個(gè)小組來展示相關(guān)性更強(qiáng)的廣告。當(dāng)時(shí)的確使用了機(jī)器學(xué)習(xí)技術(shù),“但我們當(dāng)時(shí)使用的模型不算先進(jìn),太過簡單”??驳吕f。

還有一位與坎德拉同時(shí)加盟Facebook的工程師,他叫侯賽因·梅哈納(Hussein Mehanna),他對該公司在人工智能集成度方面的落后程度同樣感到驚訝?!耙酝馊说纳矸菘创麄兊漠a(chǎn)品質(zhì)量時(shí),我以為一切都已成型,但顯然并非如此?!泵饭{說,“沒過幾個(gè)星期,我就告訴杰奎因,F(xiàn)acebook真正缺乏的是一個(gè)行之有效的世界級機(jī)器學(xué)習(xí)平臺(tái)。我們雖然擁有機(jī)器,但卻沒有合適的軟件幫助機(jī)器對數(shù)據(jù)展開盡可能深入的學(xué)習(xí)。”(目前擔(dān)任Facebook核心機(jī)器學(xué)習(xí)負(fù)責(zé)人的梅哈納同樣是微軟老兵——接受本文采訪的其他幾名工程師也都有著相同的身份。這僅僅是巧合嗎?)

梅哈納所說的“機(jī)器學(xué)習(xí)平臺(tái)”指的是部署一套最先進(jìn)的人工智能范式:憑借著基于人腦行為模式的幾種模型,這種范式把這項(xiàng)技術(shù)從上個(gè)世紀(jì)的“寒冬”(當(dāng)時(shí),早期的“思維機(jī)”想法已經(jīng)提不起人們的興趣)帶到了最近的繁榮時(shí)期。

具體到廣告業(yè)務(wù),F(xiàn)acebook需要讓它的系統(tǒng)完成一些人力無法企及的任務(wù):實(shí)時(shí)而精確地預(yù)測有多少人會(huì)點(diǎn)擊某一條廣告??驳吕退膱F(tuán)隊(duì)希望根據(jù)機(jī)器學(xué)習(xí)流程開發(fā)一套新系統(tǒng)。而由于該團(tuán)隊(duì)希望以平臺(tái)的方式來打造這套系統(tǒng),讓該部門內(nèi)的所有工程師都可以使用,所以他們在開發(fā)過程中努力確保建模和訓(xùn)練都能廣泛推廣和復(fù)制。

構(gòu)建機(jī)器學(xué)習(xí)系統(tǒng)的重要因素之一便是獲得海量數(shù)據(jù)——數(shù)據(jù)越多,效果越好。幸運(yùn)的是,這恰恰是Facebook最大的資產(chǎn)之一:如果每天都有十多億人與你的產(chǎn)品互動(dòng),你就可以收集大量培訓(xùn)資料,獲得數(shù)不清的用戶行為范例。

這也讓整個(gè)廣告團(tuán)隊(duì)的開發(fā)速度從幾個(gè)星期推出一個(gè)新模型,變成了每個(gè)星期推出幾個(gè)新模型。而由于這將成為一個(gè)平臺(tái),讓其他人也可以在內(nèi)部開發(fā)自己的產(chǎn)品,所以坎德拉必須在開發(fā)過程中讓多個(gè)團(tuán)隊(duì)都參與其中。他們把整個(gè)過程精確地分成三個(gè)步驟:“先關(guān)注性能,再關(guān)注實(shí)用性,然后構(gòu)建一個(gè)社區(qū)?!彼f。

坎德拉的廣告團(tuán)隊(duì)已經(jīng)證明機(jī)器學(xué)習(xí)給Facebook帶來的巨大轉(zhuǎn)變?!拔覀冊陬A(yù)測點(diǎn)擊、點(diǎn)贊、轉(zhuǎn)化等指標(biāo)時(shí)實(shí)現(xiàn)了不可思議的成功?!彼f。接下來自然是將這種方法延伸到更多服務(wù)中。事實(shí)上,F(xiàn)AIR負(fù)責(zé)人勒坤一直主張?jiān)O(shè)立一個(gè)與之配合的部門,負(fù)責(zé)將人工智能技術(shù)應(yīng)用到實(shí)際產(chǎn)品中。

“我非常希望成立這樣一個(gè)部門,因?yàn)槟阈枰M織一群頂尖工程師,雖然他們不必直接關(guān)注產(chǎn)品,但卻需要關(guān)注基礎(chǔ)技術(shù),好讓很多產(chǎn)品部門都可以對其加以利用?!崩绽ふf。

2015年10月,坎德拉成為新成立的AML團(tuán)隊(duì)負(fù)責(zé)人(但只擔(dān)任了一段時(shí)間,原因在于他很謹(jǐn)慎,而且同時(shí)保留了廣告部門的職位,需要同時(shí)身兼二職。)他與FAIR保持了密切關(guān)系,后者在紐約、巴黎、門羅帕克都設(shè)立了辦事處。事實(shí)上,無論FAIR的研究員與AML的工程師在哪里比鄰而坐,就相當(dāng)于在那里設(shè)立了一個(gè)FAIR辦事處。

雙方的合作方式可以通過一款正在開發(fā)的產(chǎn)品全面體現(xiàn)出來:這款產(chǎn)品可以針對用戶發(fā)表在Facebook上的照片提供語音描述。過去幾年,訓(xùn)練一套系統(tǒng)識(shí)別某個(gè)場景中的物體,并得出一般性的結(jié)論,已經(jīng)成為標(biāo)準(zhǔn)的人工智能實(shí)踐模式。例如,可以通過這項(xiàng)技術(shù)判斷一張照片究竟是在室內(nèi)還是室外拍攝的。

但FAIR的科學(xué)家最近發(fā)現(xiàn)了一些方式來訓(xùn)練神經(jīng)網(wǎng)絡(luò),幾乎可以描述一張圖片中所有有趣的問題,并通過這些物體在圖片中的位置以及與其他物體的關(guān)系,判斷這張照片的主題——從而精確分析出某張照片的主題是人與人的擁抱,還是某人正在騎馬。

“我們把這項(xiàng)成果展示給AML的人。”勒坤說,“他們想了一會(huì)兒說,‘你知道,這在一種情況下非常有用?!?他們之后便開發(fā)了一款原型功能,當(dāng)盲人和視力受損的人將手指放在一張照片上時(shí),便可用手機(jī)為其描繪照片上的內(nèi)容。

“我們一直在溝通?!笨驳吕岬紽AIR時(shí)說道,“整體目標(biāo)是把基礎(chǔ)科學(xué)轉(zhuǎn)化成具體項(xiàng)目,這就需要一種粘合劑,對吧?我們就是粘合劑?!?/p>

把基礎(chǔ)研究用于實(shí)踐

坎德拉將人工智能應(yīng)用分為四大領(lǐng)域:視覺、語言、語音和拍攝效果。他表示,這四大領(lǐng)域都可以促成一套“內(nèi)容理解引擎”。Facebook希望了解如何才能真正理解某段內(nèi)容的含義,從而判斷評論背后的細(xì)微意圖;參透語言背后的精確含義;在飛速而過的視頻畫面中識(shí)別朋友的面部;解讀你的面部表情并將其復(fù)制到虛擬現(xiàn)實(shí)的化身上。

“我們希望實(shí)現(xiàn)人工智能技術(shù)的通用應(yīng)用?!笨驳吕f,“我們需要理解和分析的內(nèi)容呈現(xiàn)爆炸式增長,但我們添加標(biāo)簽和區(qū)分事物的能力卻沒有同步提升?!?要解決這個(gè)問題,就要開發(fā)一套通用系統(tǒng),使得一個(gè)項(xiàng)目的成果可以進(jìn)行累積,還能為其他從事相關(guān)項(xiàng)目的團(tuán)隊(duì)提供幫助。

坎德拉說:“如果我能開發(fā)許多算法,把一項(xiàng)任務(wù)的知識(shí)轉(zhuǎn)移到另一項(xiàng)任務(wù),那豈不是很了不起?”

這種轉(zhuǎn)化可以對Facebook推出產(chǎn)品的速度產(chǎn)生重大影響。以Instagram為例。自從推出以來,這款圖片服務(wù)都以逆向時(shí)間順序展示用戶的照片。但在2016年初,該公司決定使用相關(guān)性算法展示圖片。

好消息是,由于AML已經(jīng)在News Feed等產(chǎn)品中應(yīng)用了這種算法,“不必從頭開始?!笨驳吕f,“他們有一兩個(gè)精通機(jī)器學(xué)習(xí)的工程師與幾十個(gè)正在部署各種排名應(yīng)用的團(tuán)隊(duì)展開聯(lián)系。之后便可復(fù)制這些模式,一旦有問題,還可以與這些模式的負(fù)責(zé)人溝通?!闭蛉绱?,Instagram才得以在短短幾個(gè)月內(nèi)完成如此重大的轉(zhuǎn)變。

AML團(tuán)隊(duì)一直在探索各種用例,用自己的神經(jīng)網(wǎng)絡(luò)與不同團(tuán)隊(duì)的成果進(jìn)行結(jié)合,從而開發(fā)一項(xiàng)適用于“Facebook規(guī)模”的獨(dú)特功能。“我們在使用機(jī)器學(xué)習(xí)技術(shù)構(gòu)建自己的核心能力,同時(shí)取悅我們的用戶?!盇ML感知團(tuán)隊(duì)首席工程師唐默·萊萬德(Tommer Leyvand)說。(他同樣來自微軟。)

最近推出的一項(xiàng)名為“社交推薦”(Social Recommendations)的功能就是典型例子。大約一年前,一位AML工程師跟一位Facebook共享團(tuán)隊(duì)產(chǎn)品經(jīng)理談到了人們在向好友征求當(dāng)?shù)氐牟宛^和服務(wù)建議時(shí)展開的深度互動(dòng)。

“問題在于如何向用戶展示相關(guān)信息?!盇ML自然語言團(tuán)隊(duì)產(chǎn)品經(jīng)理里塔·阿奎諾(Rita Aquino)說。共享團(tuán)隊(duì)曾經(jīng)嘗試對特定短語進(jìn)行文字匹配。“當(dāng)你每天接受10億個(gè)帖子時(shí),這未必很精確,也未必可以大范圍應(yīng)用?!卑⒖Z說。

Facebook技術(shù)產(chǎn)品經(jīng)理里塔·阿奎諾

通過訓(xùn)練神經(jīng)網(wǎng)絡(luò),然后用實(shí)時(shí)行為來測試各種模型,該團(tuán)隊(duì)便可察覺細(xì)微的語言差異,從而精確判斷用戶何時(shí)針對某一區(qū)域詢問就餐或購物建議。這便會(huì)觸發(fā)一條請求,顯示在相應(yīng)聯(lián)系人的News Feed信息流中。接下來,仍然由機(jī)器學(xué)習(xí)來判斷他人何時(shí)提供有用的建議,并將企業(yè)或餐廳的地點(diǎn)顯示在用戶News Feed信息流里的地圖上。

阿奎諾表示,她在Facebook任職的一年半期間,人工智能從產(chǎn)品中難得一見的元素,變成了從初始階段就融入其中的技術(shù)。“人們希望與之互動(dòng)的產(chǎn)品更加智能?!彼f,“其他團(tuán)隊(duì)看到社交推薦功能和我們的代碼后會(huì)問:‘你們我們?nèi)绾尾拍茏龅??’你不必非得是機(jī)器學(xué)習(xí)專家,也可以根據(jù)自己所在部門的經(jīng)驗(yàn)進(jìn)行嘗試。”

具體到自然語言處理領(lǐng)域,該團(tuán)隊(duì)也開發(fā)了一套可以方便其他團(tuán)隊(duì)使用的Deep Text系統(tǒng)。它對Facebook翻譯功能使用的機(jī)器學(xué)習(xí)技術(shù)起到了幫助,這項(xiàng)技術(shù)每天被應(yīng)用到40多億帖子中。

在圖片和視頻領(lǐng)域,AML團(tuán)隊(duì)則開發(fā)了一套名為Lumos的機(jī)器學(xué)習(xí)視覺平臺(tái)。這個(gè)平臺(tái)最早源自馬諾哈·帕魯麗(Manohar Paluri),當(dāng)時(shí)身為FAIR實(shí)習(xí)生的他負(fù)責(zé)開發(fā)一個(gè)宏偉的機(jī)器學(xué)習(xí)項(xiàng)目,他稱之為“Facebook的視覺皮質(zhì)”——其目的是處理和理解Facebook上發(fā)布的所有圖片和視頻內(nèi)容。

應(yīng)用計(jì)算機(jī)視覺團(tuán)隊(duì)負(fù)責(zé)人馬諾哈·帕魯麗

在2014年的一場黑客松活動(dòng)上,帕魯麗和同事尼基爾·喬里(Nikhil Johri)用一天半時(shí)間開發(fā)了一個(gè)原型產(chǎn)品,并將結(jié)果展示給滿懷熱情的扎克伯格和Facebook COO雪莉·桑德伯格(Sheryl Sandberg)。

當(dāng)坎德拉組建AML事業(yè)部后,帕魯麗與他一同領(lǐng)導(dǎo)計(jì)算機(jī)視覺團(tuán)隊(duì),并開發(fā)了Lumos,幫助所有Facebook工程師(包括Instagram、Messenger、WhatsApp和Oculus)充分利用這個(gè)視覺皮質(zhì)。

有了Lumos,“公司里的任何人都可以使用這些多樣化的神經(jīng)網(wǎng)絡(luò)上的功能,然后針對他們特定的場景構(gòu)建各種模型,了解實(shí)際運(yùn)行效果?!迸留旣愓f,他同時(shí)任職于AML和FAIR兩個(gè)團(tuán)隊(duì),“最后可以讓一個(gè)人來給系統(tǒng)糾錯(cuò),對其重新訓(xùn)練,然后推動(dòng)它進(jìn)步,不需要AML團(tuán)隊(duì)再介入其中?!?/p>

帕魯麗給我簡單地展示了效果。他在筆記本上啟動(dòng)Lumos,然后運(yùn)行了一個(gè)樣本任務(wù):提煉神經(jīng)網(wǎng)絡(luò)對直升機(jī)的識(shí)別能力。有一個(gè)頁面上包含很多圖片——如果我們不斷滾屏,大約會(huì)有5000張圖片——里面有很多直升機(jī)照片,還有一些類似直升機(jī)的東西。(一個(gè)是玩具直升機(jī),還有一些則是像直升機(jī)一樣飄在空中的物體。)

在訓(xùn)練過程中,F(xiàn)acebook使用了公開發(fā)布的圖片(不包括僅限于好友或部分用戶查看的內(nèi)容)。即便我并不是工程師,對人工智能技術(shù)更談不上精通,但我卻可以輕而易舉地找到負(fù)面例子來訓(xùn)練系統(tǒng)構(gòu)建“直升機(jī)圖片分類器”。

最終,這個(gè)被稱作“監(jiān)督式學(xué)習(xí)”的歸類步驟可能更加自動(dòng)化,因?yàn)樵摴菊谧非髾C(jī)器學(xué)習(xí)領(lǐng)域的圣杯——“非監(jiān)督式學(xué)習(xí)”——在這種模式下,神經(jīng)網(wǎng)絡(luò)可以自己判斷這些圖片中究竟是什么內(nèi)容。帕魯麗表示,該公司已經(jīng)取得了一些進(jìn)展?!拔覀兊哪繕?biāo)是在未來1年將人類的注釋減少100倍?!彼f。

從長遠(yuǎn)來看,F(xiàn)acebook認(rèn)為視覺皮質(zhì)將與自然語言平臺(tái)共同成為坎德拉所謂的通用內(nèi)容理解引擎。“我們最終無疑會(huì)將它們?nèi)跒橐惑w?!迸留旣愓f,“到那時(shí),我們就會(huì)直接開發(fā)‘皮質(zhì)’?!?/p>

Facebook希望他們在技術(shù)進(jìn)步中使用的核心原則可以通過發(fā)表論文等方式傳播到公司外部,利用這種民主化模式更加廣泛地傳播機(jī)器學(xué)習(xí)技術(shù)?!澳悴槐卦倩ㄙM(fèi)漫長的時(shí)間開發(fā)智能應(yīng)用,速度可以大幅加快。”梅哈納說,“想象一下這項(xiàng)技術(shù)對制藥、安全和交通的影響。我認(rèn)為,在這些領(lǐng)域開發(fā)應(yīng)用的速度可以加快好幾百個(gè)量級?!?/p>

面臨無解難題

盡管AML已經(jīng)深度融合到研發(fā)流程之中,為該公司的產(chǎn)品賦予了視覺、分析甚至語言能力,但該公司CEO扎克伯格還認(rèn)為,在他努力利用Facebook為社會(huì)創(chuàng)造福利的過程中,這項(xiàng)技術(shù)將起到至關(guān)重要的作用。

在扎克伯格之前發(fā)表的5700字宣言中,這位CEO 7次提到了“人工智能”或“AI”,都是在描述如何利用機(jī)器學(xué)習(xí)和其他技術(shù)提升社會(huì)安全性和信息量的背景下提到的。

要實(shí)現(xiàn)這些目標(biāo)并非易事,這與坎德拉最初對AML的職位猶豫不決時(shí)的原因相同。如果你試圖成為主要的信息來源,并為數(shù)十億用戶構(gòu)建個(gè)人關(guān)系,即使是機(jī)器學(xué)習(xí)也無法解決這一過程中面臨的所有人為問題。正因如此,F(xiàn)acebook才不斷修改News Feed算法——當(dāng)你自己都無法真正確定時(shí),又該如何通過訓(xùn)練讓系統(tǒng)給出最優(yōu)組合呢?

“我認(rèn)為這個(gè)問題幾乎無解。”坎德拉說,“如果隨機(jī)展示新聞,你會(huì)覺得浪費(fèi)時(shí)間。如果只展示來自朋友的新聞,那就會(huì)贏家通吃。最終會(huì)不停地討論兩種極端情況之間的哪個(gè)狀態(tài)才是最好的。我們試圖展開一些探索。”

Facebook將繼續(xù)使用人工智能來解決這個(gè)問題,這已經(jīng)成為其在每個(gè)領(lǐng)域發(fā)展的基礎(chǔ)動(dòng)力?!皺C(jī)器學(xué)習(xí)和人工智能領(lǐng)域有很多研究都希望能夠優(yōu)化合適的探索水平?!笨驳吕瓭M懷希望地說。

當(dāng)Facebook被人當(dāng)做假新聞的元兇時(shí),他們自然會(huì)要求人工智能團(tuán)隊(duì)盡快從該平臺(tái)上清洗所有的新聞毒瘤。這是一場罕見的全員行動(dòng),甚至連一向著眼長期前景的FAIR團(tuán)隊(duì)也參與進(jìn)來。勒坤表示,該團(tuán)隊(duì)擔(dān)任顧問的角色。

結(jié)果,在FAIR的努力下,他們已經(jīng)開發(fā)出一款有助于解決該問題的工具:一個(gè)名為WorldVec(vec是“向量”的縮寫)的工具。WorldVec為神經(jīng)網(wǎng)絡(luò)增加了某種記憶能力,幫助Facebook給所有內(nèi)容都貼上信息標(biāo)簽,例如它的來源,以及都有哪些人分享過這些內(nèi)容。

借助這些信息,F(xiàn)acebook便可了解假新聞的分享特征,并使用該公司的機(jī)器學(xué)習(xí)算法根除毒瘤?!敖Y(jié)果表明,尋找假新聞并不像判斷人們最喜歡哪些內(nèi)容那么困難?!崩绽ふf。

坎德拉的團(tuán)隊(duì)之前開發(fā)的系統(tǒng)加快了Facebook推出這些審核產(chǎn)品的速度。這些產(chǎn)品的具體表現(xiàn)仍然有待觀察??驳吕硎?,現(xiàn)在就通過數(shù)據(jù)展示該公司利用算法減少了多少假新聞,還為時(shí)過早。

但無論這些新的措施是否奏效,這些困惑本身還是引發(fā)了一個(gè)問題:這種用算法解決問題的模式——在機(jī)器學(xué)習(xí)時(shí)代得以進(jìn)一步加強(qiáng)——是否會(huì)不可避免地帶來有害的結(jié)果。很顯然,有人認(rèn)為這已經(jīng)在2016年發(fā)生了。

坎德拉否認(rèn)這種觀點(diǎn)。“我認(rèn)為我們把世界變得更加美好?!笨驳吕€主動(dòng)講了個(gè)故事。就在他接受采訪的那天,坎德拉給他在Facebook上的一個(gè)聯(lián)系人打了個(gè)電話——那人是他朋友的父親,他們之前只見過一面。

他看到那人發(fā)了許多支持特朗普的內(nèi)容,并對這些內(nèi)容感到困惑。隨后,坎德拉意識(shí)到,他的工作是根據(jù)數(shù)據(jù)制定決策,而他卻忽視了重要信息。所以,他給那人發(fā)了信息,希望跟他聊聊。那位聯(lián)系人同意了,于是,他撥通了電話。

“這并沒有改變我身處的現(xiàn)實(shí),但卻讓我以截然不同的方式來看待事情?!笨驳吕f,“在沒有Facebook的世界里,我永遠(yuǎn)不會(huì)有這樣的聯(lián)系人?!?/p>

換句話說,盡管人工智能成為Facebook的關(guān)鍵元素,甚至事關(guān)這個(gè)平臺(tái)的存亡,但它卻并非唯一答案?!艾F(xiàn)在的挑戰(zhàn)在于,人工智能仍處于初級階段。”坎德拉說,“我們才剛剛起步。”(編譯/長歌)

繼續(xù)閱讀與本文標(biāo)簽相同的文章

分享至:

你可能感興趣 換一換

分享到微信朋友圈 ×
打開微信,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。