在Web1.0時(shí)代,以谷歌和百度等為代表的搜索引擎對(duì)互聯(lián)網(wǎng)的發(fā)展起到了巨大的推動(dòng)作用,現(xiàn)在仍然如此。但互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、傳感網(wǎng)等技術(shù)迅猛發(fā)展使得傳統(tǒng)搜索引擎的搜索空間由單一的互聯(lián)在網(wǎng)發(fā)展到泛在的網(wǎng)絡(luò)空間。
極度擴(kuò)展的搜索空間,不斷發(fā)展的Web2.0和Web3.0的應(yīng)用模式,以及大數(shù)據(jù)價(jià)值挖掘等需求讓傳統(tǒng)的搜索引擎面臨巨大挑戰(zhàn)。由于網(wǎng)絡(luò)搜索空間的擴(kuò)展,傳統(tǒng)面向互聯(lián)網(wǎng)的以關(guān)鍵字為目標(biāo)的搜索引擎不能滿足對(duì)泛在網(wǎng)絡(luò)空間中人、物和信息的搜索需求。在這種背景下,能滿足用戶真實(shí)意圖、提供有價(jià)值的智能解決方案的大搜索技術(shù)應(yīng)運(yùn)而生。
在已經(jīng)到來(lái)的包括互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、傳感網(wǎng)和移動(dòng)互聯(lián)網(wǎng)在內(nèi)的泛在網(wǎng)絡(luò)空間中,物與物、物與人、人與人、信息與信息、信息與人、信息與物體之間在任何時(shí)候、任何地點(diǎn)的有效連接,是通過(guò)海量傳感器、智能處理設(shè)備等終端來(lái)實(shí)現(xiàn)的。
大搜索支持面向泛在網(wǎng)絡(luò)空間中信息、物體和人等對(duì)象的查詢,并給出智慧的解答。與傳統(tǒng)的搜索引擎相比,大搜索具有以下5個(gè)特點(diǎn)。1)泛網(wǎng)獲。菏侵父鶕(jù)給定的目標(biāo)和任務(wù),面向泛在網(wǎng)絡(luò)空間獲取的人、物和信息數(shù)據(jù)及其隨時(shí)空變化的屬性。這些數(shù)據(jù)廣泛涉及網(wǎng)絡(luò)空間的各類應(yīng)用,并具有多種模態(tài)形式,是大搜索的數(shù)據(jù)基礎(chǔ)。2)意圖感知:是指結(jié)合用戶請(qǐng)求的上下文、時(shí)空特性、場(chǎng)景感知、情感手勢(shì)等因素,支持在語(yǔ)義級(jí)別上對(duì)用戶搜索意圖進(jìn)行理解,并以統(tǒng)一模型的方式進(jìn)行表示,從而明確大搜索的目標(biāo)和任務(wù)。3)知識(shí)綜合:是指基于泛網(wǎng)獲取到的數(shù)據(jù)集合,通過(guò)統(tǒng)一的知識(shí)與關(guān)系表示模型,在此基礎(chǔ)上通過(guò)融合、關(guān)聯(lián)、統(tǒng)計(jì)、推理、乃至眾包等技術(shù)進(jìn)行知識(shí)和智慧的發(fā)掘和發(fā)現(xiàn),是大搜索的核心。4)智慧解答:是指基于對(duì)用戶意圖的準(zhǔn)確理解,以及發(fā)掘出的網(wǎng)絡(luò)知識(shí),以在線響應(yīng)的方式給出一組有序的問(wèn)題智慧解答,并將之以合適的方式提交給用戶,是大搜索的目標(biāo)。5)安全可信:是指大搜索從用戶意圖理解、數(shù)據(jù)獲取、知識(shí)綜合到返回智慧解答結(jié)果,整個(gè)生命周期過(guò)程是可信的、安全的、支持隱私保護(hù)和有害信息過(guò)濾的,這是大搜索的基本保障。
大搜索的主要應(yīng)用領(lǐng)域?qū)ㄖ悄芙煌、社交網(wǎng)絡(luò)、醫(yī)學(xué)健康、音視頻監(jiān)控、物聯(lián)網(wǎng)搜索和移動(dòng)互聯(lián)網(wǎng)等領(lǐng)域,正將社會(huì)資源、信息資源、物理資源進(jìn)行深度整合,朝著為社會(huì)提供普惠智能服務(wù)的方向發(fā)展。
據(jù)評(píng)估,僅谷歌搜索對(duì)美國(guó)經(jīng)濟(jì)的影響每年就高達(dá)1190億美元。2014年中國(guó)搜索引擎市場(chǎng)規(guī)模達(dá)到587億元,2017年市場(chǎng)規(guī)模將達(dá)到1160億元?梢灶A(yù)測(cè),未來(lái)整合各種數(shù)據(jù)的大搜索將對(duì)全球經(jīng)濟(jì)產(chǎn)生直接深遠(yuǎn)的影響。
另外,大搜索技術(shù)能滿足國(guó)家安全需求。誰(shuí)掌握了搜索引擎,誰(shuí)就掌握了信息網(wǎng)絡(luò)空間的入口,掌握了為人們提供信息甚至答案的權(quán)利,因而由此產(chǎn)生的政治、經(jīng)濟(jì)和社會(huì)驅(qū)動(dòng)力日益受到各國(guó)重視。在新的時(shí)代,誰(shuí)抓住了搜索引擎,誰(shuí)就抓住了話語(yǔ)權(quán),抓住了互聯(lián)網(wǎng)上信息傳遞的主動(dòng)權(quán),抓住了保護(hù)國(guó)家信息主權(quán)的利器。
在國(guó)際范圍內(nèi),大搜索技術(shù)目前處于起步階段,大多數(shù)歐美發(fā)達(dá)國(guó)家仍在探索大搜索的理論、方法和技術(shù),沒(méi)有建立統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范。這意味著目前我國(guó)和歐美發(fā)達(dá)國(guó)家在大搜索上幾乎處于一致水平,至少我國(guó)與歐美國(guó)家在技術(shù)上不存在數(shù)量級(jí)差異。我國(guó)已經(jīng)失去了掌握互聯(lián)網(wǎng)搜索引擎核心關(guān)鍵技術(shù)的契機(jī),應(yīng)當(dāng)把握切入大搜索的機(jī)遇,努力與發(fā)達(dá)國(guó)家展開(kāi)技術(shù)競(jìng)爭(zhēng),搶占大搜索引擎這一產(chǎn)業(yè)制高點(diǎn),爭(zhēng)取在下一輪的信息革命中占據(jù)先機(jī)。(作者是中國(guó)工程院院士、前北京郵電大學(xué)校長(zhǎng))
(責(zé)任編輯:年。