Bing 的全页团队游乐场
本系列的第 5 篇文章采访了 Full Page 团队负责人 Nathan Chalmers,他证实Full Page 算法确实管理着最终出现在 BING SERP 上的内容。
SERP并不是按照纯粹的达尔文主义原则运作的
但查尔默斯仍然认为,我关于搜索结果中的达尔文主义概念是一种非常好的思考方式。更好的是,他告诉我 Bing 有一个算法叫做……达尔文?
正如您所料,整个页面算法是基于意图的。它对结果进行加权并确保最能满足意图的丰富元素表现良好。
例如,对于碧昂丝来说,展示视频和新闻很重要,因为这是用户想要的。在这种情况下,10 个蓝色链接并不重要。
这是主页/全页算法对显示内容的决定有很大影响的一个例子。
插图:Véronique Barnard
人类告诉机器他认为哪些因素
或者 Nathan 所说的特征 ?)很重要,并制定规则来确定什么被视为成功或失败。
- 然后,机器会接收大量人类针对一系列不同的搜索查询所标记的好结果和坏结果的例子。
- 然后,机器会找到不同的特征权重,无论请求是什么(即使是机器从未见过的新查询),这些权重在任何情况下都能提供高质量的结果。
Frédéric Dubut 建议解决这个问题的一个好方法是将 加拿大电报数据 算法视为一个简单的测量模型……它衡量成功和失败,并进行相应的调整。
但我们必须认识到,人类发挥着核心作用。机器没有自由的权力:算法是由人类建立的,人类通过示例提供好与坏的定义。
创建和维护平台的人类也定义哪些功能重要……哪些不重要。
机器学习只是平衡所有特征以最好地满足人类的判断。
机器学习周期
这是一个持续的过程。 Bing 不断向算法提供反馈,以便算法能够改进。
经过上述定义的第 3 步后,人类评判员对结果进行评估和标记。
这些数据被算法团队用来调整特征和规则,然后将标记 员工培训计划的重要性 后的数据反馈到机器中。
负反馈被机器用来进行调整和改进。积极的反馈有助于巩固已经获得的知识。
所以这对我们所有人来说似乎都是一次学习经历。
Bing 的人工评判指南
重要的是,人类裁判的反馈是有结构的,而不仅仅基于人类的直觉,因为如果仅仅基于直觉,不同裁判的反馈就会有所不同,这会使机器的反馈感到困惑或矛盾。
该结构采用一组指南的形式(相当于Google 的质量评估指南),以确 巴西商业名录 保一致性并最大限度地提高给予机器的反馈的客观性。
人类对结果的评估会不断反馈到 Bing 的算法中(见上文),从而使机器能够适应和改进特征权重,并希望随着时间的推移改善其结果。