Google使用BERT将故事与事实检查进行匹配

Google对自动完成,新闻,事实检查,知识面板,重大新闻检测等进行了许多更改。

Google 宣布并总结了该公司在过去一年中对Google搜索所做的许多更改和更新。本公告涵盖通过BERT和语言处理对Google搜索,Google新闻,自动完成,事实检查的更改。

Google的总体目标是提供不仅尽可能相关,而且尽可能可靠的搜索结果。在某些情况下,例如在YMYL中,即您的金钱和生命部门,可靠性对于Google来说是更高的关注点,尤其是在即将举行的美国总统大选和大流行期间人们最关注健康的情况下。

有什么变化?Google研究员兼Google搜索副总裁Pandu Nayak表示,今天的公告更多是关于Google多年来所做的持续更改,而不是新产品或功能的发布。以下是公司在过去一年中强调的最新调整和变更:

  • 围绕选举自动完成的政策更改,特别是保守一些,在这一领域显示的是少而多。
  • 在全面报道的新闻报道中使用Google BERT,以更好地将事实检查与报道相匹配。
  • 事实检查标签在2020年显示超过40亿次。
  • Google与Wikipedia紧密合作,以检测和消除Google可能在知识面板中使用的故意破坏行为。
  • Google现在能够在几分钟内检测到突发新闻查询,而40分钟以上。

BERT和全面覆盖。 Google现在正在利用其语言AI模型之一BERT来更好地了解Google News完整报道范围内的报道在网络事实方面是否可靠。因此,从某种意义上说,谷歌可以看到文章和事实检查数据库之间的联系,以更好地将事实检查与故事进行匹配。从某种意义上说,有助于了解事实检查是否与故事的主要主题有关。

我们还刚刚使用BERT语言理解模型启动了更新,以改善新闻报道与可用事实检查之间的匹配。这些系统可以更好地了解事实检查声明是否与故事的中心主题相关,并且可以在《全报道》中更加突出地显示这些事实检查-一种新闻功能,提供了有关如何从各种来源报道故事的完整图片。只需轻按一下,“全覆盖”就可以让您查看来自不同来源的热门新闻,视频,本地新闻报道,常见问题解答,社交评论以及随着时间流逝而发生的故事的时间表。’

谷歌表示,现在可以在新闻发布后的几分钟内检测到新闻搜索查询。过去,Google可能需要40分钟以上的时间。过去,此类突发新闻查询有时会显示不准确的信息。因此,现在Google可以更快地检测突发新闻查询,从而提高了杠杆作用,希望尽早显示针对哪些查询的网站类型-在这种情况下,可以在EAT上找到更具权威性的结果。

您应该期望Google提供有关突发新闻主题的更准确和可靠的信息。

自动完成政策更改。Google信任与安全高级总监David Graff表示,在选举期间,尤其是在其他一些方面,谷歌将采取更为保守的态度,将自动完成的建议显示出来。Google宁愿显示不正确的建议,也不愿显示自动完成的建议。因此,围绕选举和其他一些领域,Google可能会提出的建议要少得多。

谷歌“扩大了与选举有关的自动填充政策,我们将删除可能被解释为对任何候选人或政党有要求的预测。我们还将删除可能被解释为参与选举的预测,例如有关投票方法,要求或投票地点状态的声明,或选举过程的完整性或合法性(例如选举的安全性) 。

事实核对标签显示40亿次。谷歌表示,到2020年为止,事实检查标签在搜索中的显示次数超过40亿次。谷歌表示,这已经超过了谷歌在整个2019年显示事实检查标签的次数。过去几年,谷歌已经在新闻,搜索,图像和其他领域扩展了事实检查标签。

知识图和维基百科。Google一直在与Wikipedia一起投入大量资金,以检测和减少Wikipedia中的故意破坏行为。由于Google经常从Wikipedia的知识面板和精选摘要中获取Wikipedia的信息,因此Google有动力确保这些Wikipedia条目可靠且准确。谷歌说,大多数问题在几分钟之内就可以在Wikipedia中得到纠正。

为补充Wikipedia的系统,我们添加了附加的保护和检测系统,以防止可能不正确的信息出现在知识面板中。在极少数情况下,维基百科上的蓄意破坏实例可能会漏掉。维基百科的编辑内容中只有一小部分是潜在的破坏行为,并且我们已经改进了系统,现在可以检测到其中99%的情况。如果确实出现这些问题,我们将制定政策使我们能够迅速采取行动以解决这些问题。为了进一步支持Wikipedia社区,我们去年创建了WikiLoop程序,其中包含多个专注于内容质量的编辑器工具。其中包括WikiLoop DoubleCheck(WikiLoop DoubleCheck),这是Wikipedia编辑者和用户可用来跟踪页面更改并标记潜在问题的众多工具之一。

我们通过自己的检测系统提供数据,搜索质量评级者和准则。Google解释说,其“ 搜索质量评估者指南”中列出了许多基准和标准。Google清楚地在其中记录了搜索结果的目标,哪些类型的查询需要更高级别的权威和可靠的来源,而哪些则不需要。实际上,Pandu解释说Google训练其查询分类器以了解查询是否属于YMYL类别。因此,当出现新问题时,Google的系统已准备就绪,可以处理他说的那些查询。

了解什么是可靠的,尤其是在卫生和选举领域。Google必须直接定义其搜索质量评估者指南的可靠性和高质量。Google使用质量评估者指南中的反馈,并将其反馈到机器学习模型中,以将反馈发送给工程师,以改善整体搜索。同样,Google不会直接在搜索中使用这些评估者,并且这些评估不会直接影响单个查询或网站的搜索排名。

Google在全球拥有超过10,000个评估者,每个州都设有一个评估者,以便获得所有搜索者的代表性视图。这些评估者根据这些质量评估者指南对搜索结果进行评估。评估人员会进行并排实验,Google进行了超过60,000项并排实验和近40万次搜索质量测试,在过去四年中超过了100万,即每天约有1,000项测试。

Google不断调整Google搜索以提高搜索质量,相关性,可靠性和准确性。这意味着您需要不断改进您的网站,以确保您拥有最高质量,更相关,更可靠和准确的内容和用户体验。

Google搜索今天并没有什么特别的变化,但请长期考虑这些变化,并不断改进您的网站。