自2002年推出以來,Google News已成為Web上最大的新聞內(nèi)容聚合器。在去年9月《大西洋月刊》的一篇文章中,Google News的主管曾說該網(wǎng)站收集的新聞來源超過5萬個,每周的獨立訪客超過10億。該網(wǎng)站完全由計算機生成,每天都會收集和展示從全球數(shù)千個新聞來源的頭條新聞。
Google甚少透露相關的算法和規(guī)則,只是說為了保證顯示的內(nèi)容質(zhì)量會定期調(diào)整新聞排名。據(jù)信,Google自2003年以來已經(jīng)三次調(diào)整了排名算法。
Computerworld 在美國專利辦公室網(wǎng)站查詢時碰巧發(fā)現(xiàn)了Google去年的一項專利申請—《改進新聞文章排名的算法與系統(tǒng)》,專利申請?zhí)枮?0120158711。通過對申請文檔的分析,從中可以了解到Google對新聞故事排名的一些指標。這些指標決定了哪些新聞可以被放在Google News的顯著位置。
專利申請中運用了超過12項指標來對其他網(wǎng)站的新聞文章進行排名。包括新聞網(wǎng)站定期產(chǎn)生的新聞數(shù)量、新聞來源的平均長度、新聞來源新聞報道的重要性、突發(fā)新聞得分、使用模式、輿論意見、流通量。