人工智能正改變谷歌搜索,下一個(gè)目標(biāo)則是整個(gè)互聯(lián)網(wǎng)
近日,46歲的負(fù)責(zé)谷歌搜索業(yè)務(wù)的元老Amit Singhal宣布退休。很快,谷歌透露,Singhal卸任的巨大空缺將由一個(gè)叫John Giannandrea的人來(lái)填補(bǔ)。在某種層面上講,這只是兩個(gè)人各自開(kāi)啟新的生活。但你也可以將兩人的職位更替看做是對(duì)谷歌內(nèi)部——甚至是整個(gè)科技界運(yùn)轉(zhuǎn)方式之重大轉(zhuǎn)變的一個(gè)絕妙隱喻。

要知道,Giannandrea正是谷歌人工智能的掌舵人。他的業(yè)務(wù)范圍包括深層神經(jīng)網(wǎng)絡(luò)和模擬人腦神經(jīng)結(jié)構(gòu)的軟硬件網(wǎng)絡(luò)。通過(guò)分析大規(guī)模的數(shù)據(jù),這些神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)各種有用的任務(wù),如照片識(shí)別、智能手機(jī)語(yǔ)音命令識(shí)別,以及正在發(fā)生的——網(wǎng)絡(luò)搜索查詢(xún)響應(yīng)(Internet search queries)。有時(shí)候,它們學(xué)習(xí)任務(wù)的能力甚至超越了人類(lèi)——這些神經(jīng)網(wǎng)絡(luò)能做的更好、更快,并且能夠完成更大規(guī)模的任務(wù)。
這個(gè)叫做深度學(xué)習(xí)的方法正迅速改造互聯(lián)網(wǎng)一系列最熱門(mén)的應(yīng)用:從Facebook,到Twitter,再到Skype。過(guò)去幾年中,它也重新定義了谷歌搜索——整個(gè)公司最賺錢(qián)的業(yè)務(wù)。正如彭博社(Bloomberg)最近的報(bào)道,谷歌從2015年初開(kāi)始在其搜索業(yè)務(wù)中部署一個(gè)叫做RankBrain的深度學(xué)習(xí)系統(tǒng)。到了十月,RankBrian已經(jīng)在谷歌搜索引擎每秒處理的數(shù)百萬(wàn)個(gè)查詢(xún)?nèi)蝿?wù)中的「非常大的一部分」中發(fā)揮了作用。
據(jù)彭博社報(bào)道,正是Singhal本人批準(zhǔn)了RankBrain的應(yīng)用。此前,他或許已經(jīng)帶領(lǐng)團(tuán)隊(duì)進(jìn)行過(guò)對(duì)其他更簡(jiǎn)單的機(jī)器學(xué)習(xí)的探索。但是,據(jù)稱(chēng)Singhal曾一度堅(jiān)決反對(duì)在谷歌搜索中應(yīng)用機(jī)器學(xué)習(xí)——過(guò)去,谷歌主要依賴(lài)于人工算法,它們嚴(yán)格遵循人類(lèi)所定制的一系列規(guī)則。一些前谷歌員工描述了對(duì)機(jī)器學(xué)習(xí)的擔(dān)憂(yōu):人類(lèi)更難理解神經(jīng)網(wǎng)絡(luò)(相較于人工算法)的工作方式,也就更難對(duì)其進(jìn)行優(yōu)化。
這些擔(dān)憂(yōu)仍然威脅著機(jī)器學(xué)習(xí)領(lǐng)域。事實(shí)上,即便專(zhuān)家們并不能完全理解神經(jīng)網(wǎng)絡(luò)的工作原理,但它們實(shí)實(shí)在在的在起著作用:如果你向一個(gè)神經(jīng)網(wǎng)絡(luò)輸入足夠多的鴨嘴獸圖片,它便能學(xué)著鑒別鴨嘴獸;如果你輸入足夠多的惡意代碼,它便能識(shí)別電腦病毒;如果你輸入的是大量的自然語(yǔ)言——人們?cè)谒阉饕嬷锌赡茌斎氲脑~或短語(yǔ),它便能學(xué)著理解這些搜索命令并給出結(jié)果。在一些例子中,神經(jīng)網(wǎng)絡(luò)比工程師們寫(xiě)的算法更好地執(zhí)行了搜索任務(wù)。人工智能是谷歌搜索的未來(lái)——如果是谷歌搜索的未來(lái),也即是互聯(lián)網(wǎng)更多領(lǐng)域的未來(lái)。
堅(jiān)守規(guī)則
去年秋天,我與一位不愿透露姓名的前谷歌員工(他未被授權(quán)公開(kāi)談?wù)摴镜膬?nèi)部事務(wù))討論了神經(jīng)網(wǎng)絡(luò)在谷歌搜索引擎中的作用。他說(shuō)道,谷歌的廣告團(tuán)隊(duì)曾一度利用神經(jīng)網(wǎng)絡(luò)來(lái)協(xié)助定位廣告,但「有機(jī)搜索(organic search)」團(tuán)隊(duì)對(duì)這一技術(shù)并無(wú)好感。的確,這些年來(lái)關(guān)于這一爭(zhēng)議的討論仍不時(shí)涌現(xiàn)在Quora(一個(gè)廣受歡迎的問(wèn)答網(wǎng)站)上。
《高效的工程師》(The Effective Engineer)一書(shū)的作者,曾就職于谷歌搜索團(tuán)隊(duì)的Edmond Lau 在Quora上寫(xiě)道:Singhal對(duì)機(jī)器學(xué)習(xí)抱著哲學(xué)上的偏見(jiàn)。他這樣描述機(jī)器學(xué)習(xí)帶來(lái)的困擾:「給定一個(gè)查詢(xún)請(qǐng)求,人們很難解釋?zhuān)瑸槭裁茨硞€(gè)特定的搜索結(jié)果排名高于另一個(gè)?!沽硗?,他還補(bǔ)充道:「很難直接調(diào)整基于機(jī)器學(xué)習(xí)的系統(tǒng)來(lái)提高某一訊息的重要性?!挂恍┢渌肮雀鑶T工對(duì)這一描述表示贊同。
是的,谷歌的搜索引擎曾由能夠自動(dòng)響應(yīng)搜索查詢(xún)的算法所驅(qū)動(dòng),但這些算法相當(dāng)于一系列明確的規(guī)則。谷歌的工程師們能夠輕易地改變和優(yōu)化這些規(guī)則——而且,與神經(jīng)網(wǎng)絡(luò)不同,這些算法不會(huì)自我學(xué)習(xí)。正如Lau寫(xiě)道:「基于規(guī)則的評(píng)價(jià)標(biāo)準(zhǔn)雖有其繁冗之處,卻讓工程師們能夠針對(duì)特殊情況對(duì)權(quán)重直接進(jìn)行調(diào)整?!?/p>
但現(xiàn)在,谷歌已經(jīng)將深度學(xué)習(xí)整合到其搜索引擎中。隨著人工智能的負(fù)責(zé)人接管搜索業(yè)務(wù),谷歌似乎已經(jīng)堅(jiān)定了這一趨勢(shì)。
失控
誠(chéng)然,應(yīng)用神經(jīng)網(wǎng)絡(luò)意味著一定程度上的失控?!傅膊⒉皇峭耆珶o(wú)法掌控,」深度學(xué)習(xí)創(chuàng)業(yè)公司Skymind的創(chuàng)始人說(shuō)道。其實(shí)神經(jīng)網(wǎng)絡(luò)不過(guò)是數(shù)學(xué)——線(xiàn)性代數(shù),工程師們毫無(wú)疑問(wèn)能夠追蹤這個(gè)多層結(jié)構(gòu)中數(shù)據(jù)的變化。問(wèn)題是,人類(lèi)很難理解神經(jīng)網(wǎng)絡(luò)為什么以某種特定的方式將一張照片、一段語(yǔ)音或自然語(yǔ)言進(jìn)行歸類(lèi)。
「人們能夠理解深度學(xué)習(xí)背后的線(xiàn)性代數(shù),但是這個(gè)模型并非人類(lèi)可理解,而是機(jī)器可理解的」,Nicholson說(shuō)道,「它們可以給出非常精確的結(jié)果,但我們常常不能從人類(lèi)的角度去解釋這些結(jié)果背后的道理?!?/p>
也就是說(shuō),為了優(yōu)化這些神經(jīng)網(wǎng)絡(luò),人類(lèi)只能依靠直覺(jué)、試驗(yàn)和犯錯(cuò)來(lái)調(diào)整其數(shù)學(xué)模型——而且你必須不斷地加進(jìn)新的數(shù)據(jù)進(jìn)行訓(xùn)練,也就意味著更多地試驗(yàn)和犯錯(cuò)。這在理論上可行,但是錯(cuò)綜復(fù)雜。隨著谷歌搜索向人工智能模型邁進(jìn),誰(shuí)也說(shuō)不清這一舉動(dòng)怎樣讓其搜索結(jié)果避免不公平投訴,或者,面對(duì)投訴時(shí)調(diào)整其搜索結(jié)果的能力又會(huì)受到怎樣的影響。
這些考慮并非杞人憂(yōu)天。最近,谷歌正面臨一項(xiàng)歐洲的反壟斷調(diào)查,涉及到谷歌是否不正當(dāng)?shù)貙?duì)其競(jìng)爭(zhēng)對(duì)手的頁(yè)面進(jìn)行降級(jí)。如果真的完全讓人類(lèi)所無(wú)法理解的機(jī)器做決定,到時(shí)候又該怎么辦呢? 人類(lèi)依然會(huì)指導(dǎo)機(jī)器,但是不再像以前那樣了。
無(wú)論如何,谷歌搜索已經(jīng)迎來(lái)深度學(xué)習(xí)時(shí)代。而且近幾年中,谷歌也許已經(jīng)應(yīng)用過(guò)其他的機(jī)器學(xué)習(xí)形式。雖然這些技術(shù)讓人類(lèi)在某種程度上失去掌控權(quán),但谷歌相信這利大于弊。
深度學(xué)習(xí)
可以肯定的是,深度學(xué)習(xí)仍只是谷歌搜索系統(tǒng)的一部分。據(jù)彭博社報(bào)道,谷歌每天收到的搜索請(qǐng)求大約有15%是其未曾見(jiàn)過(guò)的,而RankBrain正是用于處理這一部分請(qǐng)求的。它主要的功能就是分析搜索請(qǐng)求中不熟悉的字詞和短語(yǔ),并且給出與其意義相似的詞句。因此,在處理陌生搜索請(qǐng)求方面,RankBrain遠(yuǎn)勝過(guò)傳統(tǒng)的基于給定規(guī)則的系統(tǒng)。
全部評(píng)論