国外

忘记PageRank,至少如果你是一个希望在谷歌新闻中做得好的新闻发布者谷歌的新闻服务不依赖于“普通”谷歌使用的相同算法,其中PageRank是其中的一部分

相反,谷歌新闻进入它自己独特的排名信号,包括用户点击,特定主题的出版物的估计权限,新鲜度,地理位置等等

在此,我与谷歌的商业产品经理Josh Cohen进行了广泛的访谈的第三部分新闻,了解Google新闻如何排名内容另外请务必阅读前两部分内容:您还可以找到我感兴趣的相关概述文章:搜索引擎,聚合器和博客如何使用新闻内容Google新闻如何运作

一些新闻出版商提出的一项投诉,可能是8月份要求政府调查的意大利报纸最引人注目的,是谷歌没有提供关于谷歌新闻如何工作的透明度,科恩不同意,说有很多:“我们推出了[谷歌新闻]博客,并提供了大量的信息它为多个受众提供服务,但如果它专门针对发布者,那么很多一篇帖子是关于谷歌新闻的神话曝光科恩补充说,“神话”帖子本身是从常见问题中发展出来的Google通过Google新闻论坛为发布商提供答案Google也为发布商提供了一个帮助区域

与谷歌网络搜索相比,谷歌新闻中的排名似乎是个谜

正如我对科恩所说,如果有人问我为什么不这样做在谷歌网络搜索中对一个术语排名,我(或任何知识渊博的搜索引擎优化)可以确定是否存在一些明显的内容或链接缺陷,阻止问题或潜在的域名谷歌的网络搜索排名系统还没有获得太大的权威但为什么一个故事在谷歌新闻中排名不好,无论是回应关键字搜索还是可浏览的头条新闻

似乎没什么可以诊断或解释谷歌新闻可以感觉像一个黑盒子科恩回应更具体:在与出版商的很多讨论中,我们确实谈论排名方面,群集过程和我们正在尝试做的事情那里有故事排名,我们在给定的类别中显示当天的顶级商店什么是特定故事中的总体编辑兴趣

每个人头版都有什么

这将推动结果编辑们集体感受到的是当天的头条新闻

故事和故事集群通过“故事”排名,科恩不是在谈论出版物中的个别故事以及它们如何针对特定搜索进行排名相反,他的意思是“故事集群”,这是一组完整的个别文章特定新闻事件的特定角度例如,考虑一下我昨天晚上发现的故事集群,当我点击谷歌新闻的娱乐区域时:在顶部,有一堆关于亚当兰伯特的故事和他最近的表现美国音乐奖跳到第三组,这也与奖项有关 - 但这一次关注的是Jennifer Lopez和她的立足点故障就在第四组之下,关于一些实际的奖项被发布给Google新闻算法决定如何形成这些类型的集群以及首先列出哪些集群除此之外,在每个集群中都是实际的单个故事例如,让我们放大J ennifer Lopez集群:第一个箭头突出了这个集群中的主要故事是如何来自福克斯新闻,其次是娱乐周刊的故事,然后是纽约每日新闻Beyond的故事,共有649篇文章都被认为与这个故事有关群集 - 并点击最后一个箭头指向的链接会为您列出它们算法决定了当您浏览Google新闻时出现的位置,并且当您输入搜索词时它也会启动例如:这些是我回来的结果在Google新闻上搜索“医疗改革”您可以看到各种故事集群,包括当前有关如何帮助或伤害人们的报道总而言之,Google新闻试图通过查看各个故事的特征来确定重要的故事集群

各种出版物上的董事会当这些出版物开始出现新故事时,这反过来会影响新故事集群的创建,这些故事集群在Google新闻中占据重要位置 排名因素:新鲜度,本地相关性和其他信号那么是什么原因导致单个文章成为特定故事集群中的主要项目

涉及各种因素,科恩说:源排名涉及很多东西是否有原创内容

及时覆盖最近的发展

手头群集的相关性在某些情况下,是否存在本地相关性

来自本地内容的内容是否包含本地内容

例如,科恩进一步解释,就南加州的野火情况而言,像洛杉矶时报这样的消息来源可能会受到青睐,因为他们是当地的新闻

对于其他地方发生的故事,这些故事的当地其他出版物可能会得到提升科恩还解释了更多关于最新内容与原始内容排名之间的平衡:假设您发布了一些内容然后其他人来源但没有添加真正的新信息如果他们追随您,您不希望惩罚原始来源首次出版声誉:Think NewsRank,Not PageRank Cohen还表示,个人文章在故事集群中的排名如何进一步受到其出版资源在Google新闻中的声誉的影响:有特定来源的排名,相当于特定的PageRank网站我们查看不同的第三方指标在给定类别中原始内容的发布量是多少

如果你看看彭博社和路透社,他们可能会有数百篇商业原创文章

这是该类别资源质量的一个很好的指标

与体育相比,没有那么多的原创内容[因此他们可能没有那么多排名体育故事的权威]这个源值是否有名称

有没有NewsRank

不,科恩说,但他强调价值与PageRank完全不同(PageRank本身只是谷歌用于排名网络搜索结果的众多信号之一):我们没有这个名称但它与PageRank不同这不是我们使用的术语来源有自己的排名不同于网络搜索,特别是因为新闻文章的短暂性质我们使用许多不同的信号来计算源版权和版本的部分来澄清最后一个更进一步,谷歌新闻有不同国家的各种“版本”,如谷歌新闻英国与谷歌新闻美国每个版本都有自己特定的信号混合,用于排名新闻内容这就是为什么英国版的谷歌新闻将不同于美国版本此外,Google新闻版中的每个部分(例如娱乐与体育)也使用自己独特的排名信号混合测量点击量Google News中的另一个信号King mix是用户从他们看到的结果中点击的结果说Cohen:您了解谁是用户可信赖的来源如果您去Google新闻的特定群集,您会发现第一个故事获得的点击次数超过了第二个故事等等如果你看一下用户的行为并没有达到预期的效果,那就会给你提供大量的信息

例如,科恩解释说,华尔街日报和搜索引擎土地都有关于谷歌业务收益的故事谷歌新闻的一部分华尔街日报可能会吸引更多的点击作为商业读者更值得信赖或更具吸引力的来源但是关于一些新的谷歌产品的故事,两个出版物都报道了科幻/技术部分的内容

“我将去搜索引擎土地,”科恩说,不是监控点击非常容易发生垃圾邮件,哪些出版物可能只是点击自己进入最高排名

“这不仅仅是点击行为,”科恩强调说,关于故事如何排名点击只是众多信号中的一个仍然,他承认垃圾邮件确实发生了,但没有你看到的商业网络结果那么多:你看到更多的垃圾邮件事物的商业方面并不是所有高于垃圾邮件的新闻出版商都是我们所知道的,奇怪的出版物订阅内容和点击次数也会对仅限订阅的内容产生影响人们不太可能选择这种材料,当它在谷歌新闻中被标记时,导致可见性降低正如科恩在我对他的采访中所述的那样:如果你有订阅内容,用户对它的回应实际上会告诉算法这不是一个相关的结果,我没有点击这个 通过使其免费或实质上说它已付费但谷歌将其视为免费[由于首次点击免费],对他们来说有一个显着的优势,因为他们的所有内容都被编入索引,我认为在一天结束时可能有帮助结果人们更有可能链接到它以及它可能带来的所有不同方式换句话说,由于谷歌新闻阅读器他们基本上绕过了基于订阅的内容,因此算法正在尝试,谷歌新闻中显示的不是最终结果反映用户想要的内容文本内容计数,工具实际故事,其中的书面文字如何通过所有关于源权限和测量点击的讨论,页面本身的重要性是什么

是的,Cohen说:你的URL,标题和正文是你可以看到的三个组成部分

如果你的任何一个都很弱,它会对其他类别产生额外的影响但是你从过程中删除的组件越多,它就会越多

单一的那个更重要的FYI,我的报纸和SEO帖子的快速提示有一些关于这个主题的建议算法决定,不编辑科恩也强调系统没有人类编辑排名出版物或故事相反,这留给排名算法,一个自动制作故事选择和排名以响应关键字搜索的系统:这不是一个编辑过程我们没有任何人坐下来说这是一个很好的来源,这是一个不好的来源有许多不同的信号