谷歌新聞收錄新算法?
據(jù)國(guó)外媒體報(bào)道,谷歌去年提交的一項(xiàng)新聞排序系統(tǒng)專(zhuān)利申請(qǐng)泄露了谷歌在新聞排序上的一些算法規(guī)則。
這項(xiàng)專(zhuān)利提交的時(shí)間為2012年2月,批準(zhǔn)時(shí)間為去年12月,名稱(chēng)叫“提高新聞文章排序的系統(tǒng)和方法”。
哥倫比亞大學(xué)新聞學(xué)院的教授SreeSreenivasan稱(chēng),技術(shù)世界有很多不透明的地方。此項(xiàng)專(zhuān)利申請(qǐng)可以讓人了解像Google這樣的公司是如何選擇在線(xiàn)內(nèi)容并對(duì)其排名的。他指出,Google用來(lái)判斷新聞來(lái)源質(zhì)量的某些指標(biāo),跟編輯用來(lái)確定某出版物是否值得信任是一樣的。
根據(jù)此項(xiàng)專(zhuān)利資料,谷歌在對(duì)“GoogleNews”頁(yè)面上所展示新聞進(jìn)行排序時(shí)使用了十多種獨(dú)立算法規(guī)則。
以下是部分算法規(guī)則
1、用原創(chuàng)文章數(shù)或原創(chuàng)句子數(shù)來(lái)衡量新聞來(lái)源的質(zhì)量;
2、用“故事規(guī)模得分”確定某組織一周、一個(gè)月或更長(zhǎng)時(shí)間撰寫(xiě)的原創(chuàng)文章的重要性。比方說(shuō),如果D是關(guān)于哥倫比亞航天飛機(jī)失事的文章,而相關(guān)主題的其他不同文章還有500篇,那么這個(gè)故事的規(guī)模就是500;
3、突發(fā)新聞得分的計(jì)算是通過(guò)衡量新聞來(lái)源發(fā)布重大事件的速度來(lái)確定的;
4、而新聞機(jī)構(gòu)(尤其是未受廣泛引用的那些)制作高品質(zhì)、原創(chuàng)內(nèi)容的能力,則可以通過(guò)故事提及人物的數(shù)量等來(lái)衡量;
這些算法具體包括:在一定時(shí)間內(nèi)一家新聞機(jī)構(gòu)創(chuàng)作的文章數(shù)量,新聞文章篇幅,新聞的報(bào)道的影響力,突發(fā)性新聞報(bào)道數(shù)量,新聞?wù)宫F(xiàn)形式,作者觀點(diǎn),轉(zhuǎn)發(fā)發(fā)行量、以及與新聞運(yùn)營(yíng)員工規(guī)模、新聞員工規(guī)模、新聞來(lái)源的報(bào)導(dǎo)寬度、來(lái)自國(guó)外的流量,以及寫(xiě)作方式等。
當(dāng)使用者輸入搜索字符時(shí),谷歌會(huì)分析具有該關(guān)鍵字的新聞列表,確定每個(gè)鏈接的新聞來(lái)源,然后基于新聞來(lái)源品質(zhì)的各種指標(biāo)進(jìn)行排序。
不過(guò)根據(jù)專(zhuān)利信息,谷歌通過(guò)搜索引擎監(jiān)測(cè)發(fā)現(xiàn),知名新聞網(wǎng)站(如CNN)所提供的新聞普遍比較受讀者歡迎,而其它不知名網(wǎng)站(如TownNews)報(bào)道,用戶(hù)可能不去看。
自去年谷歌提出新聞排序新算法規(guī)則后,就引來(lái)了媒體公司的一片爭(zhēng)論。許多媒體公司抱怨谷歌很容易操作新聞排序。谷歌的這種行為會(huì)直接影響到了讀者所看到的新聞內(nèi)容。
來(lái)源:搜狐IT
原創(chuàng)文章,作者:王琪,如若轉(zhuǎn)載,請(qǐng)注明出處:http://qyysmy.cn/blog/archives/4846