您好,歡迎訪問捷聯(lián)科技官方網(wǎng)站!
總部熱線:0769-33810128 XAI登錄
谷歌眼中的搜索未來
發(fā)布于:2010/7/10 9:33:24   點(diǎn)擊率:3476

谷歌這些年的一系列舉動(dòng),從Android到Chrome,從語音搜索到谷歌TV,都是其對(duì)未來搜索認(rèn)識(shí)的投影。

許多人曾經(jīng)懷疑,搜索技術(shù)還能走多遠(yuǎn),甚至前幾年,還有人說,搜索能夠做的90%的事情都已經(jīng)做完了。但谷歌里的極客們認(rèn)為,這種觀點(diǎn)是固守杜威分類時(shí)代傳統(tǒng)思維的短視和淺薄之見。谷歌的極客們有資格不屑于這種觀點(diǎn),因?yàn)樗麄冏盍私馑阉鞯目茖W(xué)?!八阉魇且粋€(gè)可以不斷發(fā)展幾百年的科學(xué)”,谷歌副總裁瑪麗薩·梅耶爾曾說。谷歌也不止一次對(duì)外宣稱,搜索的最終目標(biāo)是理解人的“意思”,即人工智能。如同谷歌創(chuàng)始人謝爾蓋·布林曾經(jīng)提到過的“搜索直接連接大腦”的概念。

搜索的科學(xué)

布林關(guān)于“搜索直接連接大腦”的概念如果換成不那么“理工男”的浪漫一點(diǎn)的說法,就是人類的知識(shí)最終會(huì)由激情來分類:信息流的任何一個(gè)結(jié)點(diǎn)、神經(jīng)元活動(dòng)中的任何一波電子火花都能成為一個(gè)知識(shí)分類的標(biāo)簽,《新數(shù)字秩序的革命》一書的作者戴維·溫伯格就持此觀點(diǎn)。

這并非幻想,而的確是科學(xué),至少谷歌信仰這種科學(xué),而且已經(jīng)有了發(fā)展這一科學(xué)的方法論和路線圖。谷歌的首席研究員阿密特·辛格是谷歌中少數(shù)幾個(gè)有資格談?wù)摴雀璺椒ㄕ摵吐肪€圖的人,他在2001年重寫了谷歌搜索引擎的算法。他是把這套方法論變得更系統(tǒng)、可執(zhí)行的一位提煉者,同時(shí)他也在制定和推動(dòng)谷歌搜索路線圖前進(jìn)的每一步。 簡(jiǎn)單講,阿密特講述的搜索科學(xué)的方法論就是,算法和工具的雙螺旋循環(huán)。 首先是工具,阿密特認(rèn)為,人類智能的發(fā)展是一個(gè)不斷發(fā)明和改進(jìn)工具的過程,“針對(duì)每一種工作都有其工具,我們將愈發(fā)精雕細(xì)琢?!卑⒚芴亍ば粮駥?duì)記者說。他說的并不是模糊的宏大趨勢(shì),這恰恰就是搜索科學(xué)的基礎(chǔ)?!爸钡斤@微鏡和望遠(yuǎn)鏡被發(fā)明出來,長(zhǎng)期在黑暗中探索的生物學(xué)和物理學(xué)才有了實(shí)質(zhì)性的突破。所以,搜索的真正偉大的階段其實(shí)并沒有到來。”瑪麗薩·梅耶爾用生物學(xué)和物理學(xué)在15、16世紀(jì)的例子來形容今天的搜索科學(xué)。谷歌在不斷為云端和各種接地設(shè)備提供新產(chǎn)品,因?yàn)楣雀枵J(rèn)為這些應(yīng)用工具就是搜索科學(xué)的顯微鏡和望遠(yuǎn)鏡,能照亮搜索通向大腦和世界的未來之路,源源不斷搜集數(shù)據(jù)。

秘密配方

算法的改進(jìn)所依賴的正是這些數(shù)據(jù)。算法一直是谷歌的“神秘配方”,實(shí)際上,谷歌的搜索引擎在2001年后進(jìn)行了多次重大改造,其中就包括阿密特·辛格2001年的算法重寫。谷歌機(jī)器人做的工作首先是對(duì)數(shù)據(jù)進(jìn)行抽取、分類和結(jié)構(gòu)化(通過文字進(jìn)行組織,就像書本的目錄),難點(diǎn)在于排序,這像是讓一個(gè)機(jī)器人表演同時(shí)拋起200個(gè)瓶子的高難度雜技。機(jī)器人程序的編寫者更像一位藝術(shù)家,他要讓機(jī)器人理解數(shù)據(jù)的上下文,“所有搜索引擎都會(huì)引入上下文,但沒有一個(gè)像谷歌引入得那樣多、應(yīng)用那樣自如。PageRank(網(wǎng)頁級(jí)別)本身也是一個(gè)信號(hào),同時(shí)也是頁面的一個(gè)屬性(指其相對(duì)于其他網(wǎng)頁的重要性),該屬性可以幫助確定其與查詢內(nèi)容的相關(guān)性”,《連線》雜志在今年2月的文章中介紹。 標(biāo)題通常被予以特別關(guān)注,錨文本可以通俗理解為超鏈接,對(duì)于用戶可能沒有看到,但對(duì)于谷歌機(jī)器人,它是非常重要的指標(biāo)。隨著網(wǎng)頁功能日益復(fù)雜化、智能化,機(jī)器人對(duì)網(wǎng)頁數(shù)據(jù)的抽取和結(jié)構(gòu)化也日益復(fù)雜。新鮮度(對(duì)于一些查詢,新近的頁面比較早的頁面更有價(jià)值)和地理位置(谷歌知道搜索者的大致地理坐標(biāo),會(huì)將本地信息排在前面)成為越來越重要的信號(hào)。“谷歌目前使用200多種信號(hào)來幫助確定搜索結(jié)果的排序。”《連線》雜志說。同時(shí),阿密特·辛格還指出,用戶在搜索過程中產(chǎn)生的數(shù)據(jù)被證明同樣很有價(jià)值,這些數(shù)據(jù)包括他們點(diǎn)擊哪些結(jié)果、不滿意時(shí)對(duì)關(guān)鍵詞的更改、查詢關(guān)鍵詞與所處地理位置的關(guān)系等??傊?,機(jī)器人可以從200多個(gè)維度來理解用戶的搜索意圖,可能是用戶所處的情景模式,旅游或是購物;也可能是用戶希望要的媒體形式——文字、圖片、聲音或者動(dòng)態(tài)的實(shí)時(shí)資訊;也可能是用戶所屬的國(guó)家、地理位置或者使用的語言;還有用戶的社交圈(需要登錄谷歌個(gè)人賬戶)——機(jī)器人能夠理解用戶敲入關(guān)鍵詞背后的復(fù)雜意圖,提供個(gè)性化搜索。

重要的進(jìn)展

據(jù)說今年谷歌對(duì)搜索引擎的改進(jìn)多達(dá)500項(xiàng),這些改進(jìn)被阿密特·辛格形容為給高度3萬英尺、速度每小時(shí)1000英里的飛機(jī)改進(jìn)引擎。每年,我們能從兩個(gè)會(huì)議上看到谷歌“亞歷山大圖書館”浩大工程的進(jìn)展,一個(gè)是谷歌的I/O大會(huì),針對(duì)外部的開發(fā)者群體;另一個(gè)是“搜索的科學(xué)”大會(huì),可以窺見谷歌搜索引擎的進(jìn)展。2010年在東京舉辦的谷歌“搜索的科學(xué)”大會(huì)上,谷歌展示了它的重要進(jìn)展。

“搜索的科學(xué)”大會(huì)的一個(gè)亮點(diǎn)是Chrome to Phone.Chrome to Phone就好像Chrome OS在手機(jī)上的一個(gè)切入點(diǎn),它可以同步桌面互聯(lián)網(wǎng)上的視頻、地圖等信息,比如用戶在家的電腦上未看完的世界杯比賽視頻或者約會(huì)位置的地圖信息需要攜帶出門,完全可以通過同步到Chrome to Phone,在Android手機(jī)上實(shí)現(xiàn)。第二個(gè)亮點(diǎn)是谷歌TV.它是一個(gè)電視的操作系統(tǒng),內(nèi)嵌在機(jī)頂盒、藍(lán)光播放機(jī)等器材之內(nèi),用戶只需單一平臺(tái),在能看電視、影碟之余,更可以搜索比如在YouTube,CNN新聞等成千上萬網(wǎng)上頻道的節(jié)目;甚至通過無線網(wǎng)絡(luò)用Android手機(jī)操作,或用語音搜尋;更支持邊看電視邊上網(wǎng)找資料的畫中畫功能。谷歌公司透露谷歌TV將于明年初正式面世。

為什么谷歌會(huì)做如此多看似與搜索不相關(guān)的應(yīng)用?其實(shí),這些應(yīng)用就是搜索的未來。阿密特·辛格認(rèn)為搜索引擎最終會(huì)成為用戶的個(gè)人助理,無論用戶是誰、身在何時(shí)、何地,都能提供他們最需要的信息。辛格對(duì)搜索引擎抱有的幾大夢(mèng)想正在一一實(shí)現(xiàn):比如超越文本的搜索(用聲音、圖像和視頻來搜索);超越語言的搜索(搜索時(shí)自動(dòng)翻譯,并結(jié)合所屬語種的語境上下文);搜索社交網(wǎng)絡(luò)里的信息(用戶的朋友對(duì)某一問題的看法);搜索這一秒鐘的世界(實(shí)時(shí)搜索);搜索離用戶最近的信息(比如最近的便利店、加油站等位置信息)。

谷歌最終夢(mèng)想是不需要搜索的搜索,也就是連接人類的大腦和世界的機(jī)器。

本文轉(zhuǎn)載于:http://news.iresearch.cn/0200/20100709/119018.shtml

技術(shù)支持-張先生
點(diǎn)擊這里給我發(fā)消息
營(yíng)銷推廣-郭先生
點(diǎn)擊這里給我發(fā)消息
客服投訴-郭先生
點(diǎn)擊這里給我發(fā)消息