2009互聯(lián)網(wǎng)大會會于11月2日至3日在北京召開,騰訊科技作為官方指定戰(zhàn)略合作門戶網(wǎng)站、官方指定*合作新聞中心進(jìn)行全方位的視頻、圖文采訪與直播。特設(shè)立4個現(xiàn)場專訪間,力邀業(yè)界專家與企業(yè)代表剖析產(chǎn)業(yè)現(xiàn)狀,暢談產(chǎn)業(yè)前景,并就金融危機(jī)一年來的發(fā)展進(jìn)行深度解讀。
以下是中搜總裁陳沛演講實(shí)錄:
陳沛:各位領(lǐng)導(dǎo)、各位來賓,大家下午好!很高興能夠在一年一度的*互聯(lián)網(wǎng)大會上和大家分享對互聯(lián)網(wǎng)的看法,另外搜索引擎相當(dāng)長的時間應(yīng)該說是互聯(lián)網(wǎng)的熱點(diǎn)。今天我的主題是關(guān)于第三代搜索引擎的。有很多人說中搜為什么最近不說很多話了?今天我也想跟大家匯報(bào)一下中搜在搜索方面的探索。
2003年的時候,我提出了第三代搜索的思想,當(dāng)時我們雖然全力以赴在做第二代搜索,我們當(dāng)時認(rèn)為最早的搜索引擎是雅虎,上面有很多分類把網(wǎng)站和類別進(jìn)行劃分,現(xiàn)在我們談到搜索會想起Google,在輸入框里面打進(jìn)一個關(guān)鍵詞。
未來是什么樣?中搜一直在嘗試新一代的搜索,最近網(wǎng)上有很多關(guān)于第三代搜索的討論,因?yàn)楹芏喙径荚趪L試一些搜索進(jìn)行,雖然關(guān)于第三代搜索大家沒有什么結(jié)論,但是很多人都引用了前兩代的結(jié)果,以雅虎目錄為代表導(dǎo)航的搜索和以Google為代表的關(guān)鍵詞收入。
搜索一定會發(fā)生某種變革,一個是持續(xù)增長的互聯(lián)網(wǎng)數(shù)據(jù)。5年前的今天互聯(lián)網(wǎng)數(shù)據(jù)大大增長,每天以幾何數(shù)據(jù)增長。我們單純用技術(shù)的方式找到*的結(jié)果變得越來越困難,現(xiàn)在的搜索引擎主要是基于一些算法,在700萬個結(jié)果中迅速做一個排序,讓我們有機(jī)會在前幾頁中看到你需要的東西。如果互聯(lián)網(wǎng)的內(nèi)容越來越多,我們?nèi)绾翁釤捛皟身?,會變得越來越困難。
第二,用戶實(shí)際上也在進(jìn)化,5年前我們在互聯(lián)網(wǎng)上搜索幾百條信息,大家就很滿意了,但是現(xiàn)在每一結(jié)果甚至有上百萬,但是很遺憾人的搜索能力有限,只能看前幾頁。用戶的能力不斷地細(xì)分,搜索的本質(zhì)是用最短的時間得到自己想要的東西,而不一定是越多越好,搜索本身就是這樣的。根據(jù)這兩點(diǎn),搜索一定會發(fā)生某種變革。
其實(shí)我們最近也能看到關(guān)于第二代搜索引擎的代表,他們也在嘗試做搜索的變革。*個是Google,Google正在做整合搜索,他們使很多的垂直搜索整合在一個界面中。百度最近在推“框計(jì)算”,當(dāng)然我們不是說所有的搜索都在一個框里面,但是“框計(jì)算”允許第三方的搜索引擎成為它的結(jié)果的一部分。某種程度上,這個和中搜的想法一致,中搜做了兩件事,一個是開放,一個是聚合。
我們認(rèn)為第三代搜索的本質(zhì)一個是多方支持的融合,不僅僅是搜索引擎公司,因?yàn)樗阉饕婀菊莆盏哪芰κ怯邢薜?。我們更多的是大?shù)量處理能力。但是很多專業(yè)領(lǐng)域我們不具備這種知識。某種意義上我們希望搜索質(zhì)量更高,可能需要更多、更專業(yè)的知識,這種搜索的結(jié)果需要有更專業(yè)的方式做,需要有一種合作的方式融合一種新的知識,當(dāng)然它會變得更加專業(yè)化,包括領(lǐng)域化和更加個性化,這是我們認(rèn)為新搜索可能體現(xiàn)的一些本質(zhì)。
這里有一個關(guān)于張靚穎的頁面,左上角是她的簡介,來自于維基百科。其中有一個關(guān)于張靚穎的個人的新聞和張靚穎在新浪寫的圖片、博客和音樂,所有和她有關(guān)的東西完全被聚合在這一個頁面上,這些內(nèi)容每天自動更新。它看起來是一個門戶,但是本質(zhì)上是一個互聯(lián)網(wǎng),另外是一個被人加工的用新的方式呈現(xiàn)出來的。
拼裝一個頁面,不需要學(xué)習(xí)什么知識,它可以按照自己的理解把互聯(lián)網(wǎng)的數(shù)據(jù)重新整合和展示,這也是我們認(rèn)為的新一代搜索的新的條件,因?yàn)榇蟛糠譀]有能力利用計(jì)算機(jī)的技術(shù)再架構(gòu)這些數(shù)據(jù),他們希望用簡單的方式再去構(gòu)造自己的知識。
所以我們認(rèn)為基于開放的平臺,應(yīng)該使普通用戶參與這些內(nèi)容成為一個可能。所以中搜這幾年主要做的是開放的平臺。當(dāng)然所有的內(nèi)容都必須由一個用戶加工整理,它的覆蓋面也會非常有限。
這里是一個貴州茅臺的主頁,和貴州茅臺有關(guān)的股票信息、行業(yè)信息包括它的論壇都在一個頁面上。當(dāng)然這個東西做好的話,它也有快速復(fù)制的能力,所有的股票都會被復(fù)制出來,所以在財(cái)經(jīng)的搜索里面,你可以看到針對所有個股的更完整、更及時的頁面,當(dāng)然它可能會成為新的搜索潛力。
當(dāng)然搜索引擎的質(zhì)量標(biāo)準(zhǔn)也不一樣了,在新的搜索上,我們會提出更新的指標(biāo)要求,比如說內(nèi)容依然要全面,只是有更好的展示方式,它可能要更加準(zhǔn)確,比如說我們要查自己的名字,我們會發(fā)現(xiàn)整個搜索引擎會給你一堆與關(guān)鍵詞相匹配的內(nèi)容,但是不是你想找的人。
現(xiàn)在第二代的搜索引擎某種意義上只是關(guān)鍵詞搜索的匹配,離我們真正要找的內(nèi)容有距離,對人顯而易見的事,對機(jī)器來說是很困難的。所以我們看到很多不是我們需要的內(nèi)容。如果有人的知識參與,這個結(jié)果可能會變得更加準(zhǔn)確。
現(xiàn)在的搜索引擎只是一個關(guān)鍵詞的匹配,它并不是一個智慧的關(guān)聯(lián),對未來說我們有更高的要求,我們希望描述的內(nèi)容就是我們想要的內(nèi)容,而不僅僅是關(guān)鍵詞的匹配。因?yàn)槭且粋€門戶的展示方式,可以有一個好的方式,可以有一個美觀的展示方式。所以這里面可能有新的標(biāo)準(zhǔn)。
這是《五星大飯店》是海巖的著作,所有的內(nèi)容重新加工整理,依然覆蓋互聯(lián)網(wǎng)的各種內(nèi)容,它的內(nèi)容被加工和組織,以一種嶄新的方式嶄新出來,我想可能更多人愿意閱讀這樣的頁面。
開放的本質(zhì)實(shí)際上就是專業(yè)技術(shù)的融合,這也是第三代搜索引擎的本質(zhì),也是中搜這幾年做的主要的工作。大家可以看到,在底層有各種各樣的數(shù)據(jù)庫,再往上是數(shù)據(jù)流,再往上是搜索的引擎,包括搜索的引擎,內(nèi)容研發(fā)的引擎,包括web服務(wù)的引擎,當(dāng)然這些東西對于大部分人來說可能都是陌生的、困難的。
中搜第三代開放的搜索引擎,在于這個平臺上可以簡單地與合作伙伴構(gòu)造新的垂直搜索,比如我們和方正合作做圖書的垂直搜索,還有番薯網(wǎng)是我們和方正合作的一個產(chǎn)品。它就是中搜的第三代搜索結(jié)合了方正對數(shù)字圖書的理解,構(gòu)建出的一個新的搜索和服務(wù)。
當(dāng)然我們還可以和賽迪合作,也可以和專業(yè)領(lǐng)域擅長并且有愿望的人合作一個新的垂直搜索,這些垂直搜索共同構(gòu)造了新的搜索,他們可以向現(xiàn)代的互聯(lián)網(wǎng)提供某種專業(yè)的內(nèi)容。現(xiàn)在的搜索引擎某種意義上可能是整個搜索引擎發(fā)展的必由之路。開放成為一個大的趨勢。
第三方搜索本質(zhì)的含義是什么?我現(xiàn)在搜索的一部分的結(jié)果可能不如別人做得更好,或者是別人的搜索可能成為我搜索的一部分,某種基礎(chǔ)上也是對專業(yè)知識的一種認(rèn)同。這是我介紹的關(guān)于第三代搜索引擎整體的思想,它體現(xiàn)了所謂的“開放”的思想。另外為了開放,必須有非常好的個性化的平臺,可以非常簡單地和不同的合作伙伴構(gòu)造不同的垂直搜索,這是最近這年中搜做的主要的工作。
對于大部分的合作伙伴來說,底下那些復(fù)雜的,我們不太了解的和陌生的技術(shù)都不見了,只剩下一個開放的平臺。按照自己的意愿構(gòu)造自己的服務(wù)和搜索。
這是我們跟方正合作的番薯網(wǎng),這是從番薯網(wǎng)里面看到的各個頁面,都是中搜底層的技術(shù)構(gòu)造的,無論從內(nèi)容和形式來說都完全是一個垂直的領(lǐng)域。這是女性的頻道。這是關(guān)于一個作家的所有的內(nèi)容。
當(dāng)然也可以是與出版社相關(guān)的內(nèi)容。這里面我們很難區(qū)分它是一個圖書的應(yīng)用還是搜索引擎,因?yàn)檫@里面很多的內(nèi)容來自于互聯(lián)網(wǎng),當(dāng)它應(yīng)該出現(xiàn)的時候就自動出現(xiàn)了,所以我們并不贊成再一個輸入框里面實(shí)時獲取一個信息的全部,我甚至說過比較極端的話,未來若干年人的所有信息都再一個輸入框里面獲得,那是人類的悲哀,因?yàn)樗阉鲬?yīng)該和所有的應(yīng)用結(jié)合在一起。有時候你很難區(qū)分電子商務(wù)和搜索引擎,他們無處不在。