一直以來,我很少去網(wǎng)上搜什么東西,因為我至今還有這樣的觀點:我是做內(nèi)容產(chǎn)品的,我一直堅持自己的原創(chuàng)給搜索引擎供貨的定位。如果我都去搜,還不如網(wǎng)友自己去搜,我們這些人就等于廢了,我再去搜什么,不但我對不起網(wǎng)友,害的搜索引擎也對不起網(wǎng)友。
可是從去年8月3日,我不得不上網(wǎng)搜我自己8月2號傳火炬的照片(現(xiàn)場不讓帶照相機),突然發(fā)現(xiàn),我在谷歌和百度網(wǎng)搜索出的數(shù)字結(jié)果不同,有時同一詞竟然差了3倍!這是怎么回事?我該相信誰?直到這個月我才有空想起來我還是沒弄懂這個問題,加上搜索結(jié)果重復(fù)太多,造成了數(shù)據(jù)垃圾,這些問題是由于什么引起的?能不能解決呢?于是這幾天我就做起搜索試驗來。
上周2、3、4、5,我找了13個詞作為搜索樣詞,連搜四天,發(fā)現(xiàn)結(jié)果并不一樣(見文章結(jié)尾),而且這些結(jié)果都沒有零頭。這些結(jié)果不但在變化,而且排序也在變化,中、英文兩個搜網(wǎng),還有明顯差異……于是,我撥通了谷歌和百度公關(guān)主管的電話,并請他們替我找了各自網(wǎng)站的技術(shù)大拿,他們對我的問題回答如下:
谷歌公司
問:為什么同一詞你們網(wǎng)站搜出來的結(jié)果比其他網(wǎng)站多?是不是說明你們的結(jié)果沒有合并同類項的功能?
答:搜出來的數(shù)量多少,一定會誤導網(wǎng)友,但是我們追求是答案的多樣性。
問:為什么你們和其他搜索網(wǎng)站都是一樣,結(jié)果不顯示千位以下的零頭?
答:因為千位以下的結(jié)果沒有意義,除非結(jié)果本身就低于千個,當然這樣的結(jié)果會給出零頭。
問:為什么同一單詞如Core I7用英文搜出的結(jié)果比用中文“酷!倍嗪芏?是不是說明你們的中文搜索不行?
答:搜索英文我們是全球網(wǎng)站上搜,當然多,我們中文搜出結(jié)果也會越來越多。
問:為什么搜同一詞,結(jié)果總是在變?而且排序也在變?
答:因為搜出結(jié)果的計算公式,是考慮了上百、甚至上千條變量在進入公式實時計算,至于排序是根據(jù)加入了實時點擊率等變量,得出排序不同。
問:那也就是說,如果一個不活躍的詞就會一直不變,例如IBM這個詞,我堅持了4天,基本兩個網(wǎng)站沒變,都在1.74—1.71億之間?
答:是的
百度公司
問:我在你們公司的網(wǎng)站上和谷歌網(wǎng)站搜出同一詞的結(jié)果總是少的多,甚至是差幾十倍,拿“快女”來說,6月3日周三,谷歌是1.07億,百度則是177萬,為什么?是不是你們將同類項合并了呢?
答:是的,我們將相似的結(jié)果合并掉,我們認為,如果能給出一個結(jié)果,對網(wǎng)友來說是最好的結(jié)果。
問:為什么搜出結(jié)果都不顯示千位以下的零頭?
答:千位以下的零頭,沒有什么意義
問:為什么英文同一單詞比谷歌少?
答:我已答過,我們已將相似結(jié)果合并。
問:為什么搜出結(jié)果每時每刻總在變化,而且排序也不斷變化?
答:除了是實時計算變量在變之外,我們每天還有換庫時間,在換庫時間點上顯示出來的結(jié)果也會不同。
結(jié)論
既然各搜索網(wǎng)站對搜索目標的算法、分詞、合并、商業(yè)模型等等都不一樣,各有所長,是不是會導致到目前為止,搜索引擎?zhèn)性化的發(fā)展,還會各有各的生存空間。
文章已經(jīng)結(jié)束了,寫文章的開頭是因為查我的火炬照片開始,我的事情還是要用我自己來結(jié)尾。我還是不明白,為什么在搜我自己名字的時候,百度竟比谷歌競?cè)欢嗔?倍!既然百度是合并同類項,為什么還會有這么多,難道是百度對我有優(yōu)惠?謝謝百度!谷歌是全球的頁面同時搜索,為什么還會比百度合并同類項后少?我也挺尊敬谷歌的啊。
搜索我真的不知道該相信誰!
摘自:http://www.fsasp.cn/news.asp?id=772
(本站大部分文章來自網(wǎng)絡(luò)收集和整理,如有侵權(quán)請聯(lián)系我們,24小時內(nèi)處理.)
|