首頁 » 信息检索排名与机器学习排名

信息检索排名与机器学习排名

过去,搜索结果是根据搜索者在搜索框中输入的搜索词进行排名的,该排名基于自然搜索结果,而自然搜索结果又基于信息检索得分(寻找这些词与它们在网络资源中的使用之间的相关性)和基于权威性衡量标准(如PageRank)的重要性得分。但谷歌可能已经开始使用机器学习模型来评估内容。

多位搜索工程师报告称,搜索引擎现在可能使用机器学习模型对网页进行排名。目前尚不完全确定机器学习如何使用,但有关于如何使用它对搜索结果进行排名的描述。

2020年12月初授予的一项专利值得仔细研究

该专利的发明者一直致力于 Sibyl (Tushar Chandra) 的实现。强烈建议观看以下有关该项目的视频:

推荐引擎可以有不同的 whatsapp 筛查 排名级别,一些基于信息检索,一些基于机器学习。

这两种结果输出有什么区别呢?

信息检索阶段根据各种信号从语料库中选择文档(视频、广告、音乐、文本文档等),而机器学习系统则评估信息检索系统的输出。

例如,当搜索者输入“cat”之类的查询时,上下文信息检索系统可以从所有可用内容中选择一组包含单词“cat”的候选内容。

然后可以根据机器学习模型对这些

内容候选进行排名,该模型经 莫斯科和该地区的居民对购买 过训练可以根据各种特征预测搜索者点击广告的可能性,例如: B.:

  • 用户类型
  • 用户的位置
  • 进行搜索查询的时间
  • ETC。

该专利解释了其中的区别:

信息检索工具具有计算效率,但只能粗略估计哪些项目最适合推荐给用户。

机器学习模型可以产生更准 加拿大數據 确的建议,但通常比信息检索工具的计算强度更高。

由于信息检索工具的准确性较低,它可以使用机器学习模型排除某些原本排名靠前的候选人。

根据谷歌专利,规则是从机器学习模型接收的,其中每个机器学习规则包括输出、特征以及机器学习模型针对一个或多个特征和输出预测的输出概率。

查看该专利发明人的 LinkedIn 个人资料,似乎这种机器学习方法很可能用于优化 YouTube 上的视频。专利中的例子重点关注视频。

每个规则可以存在一个基于标记名与机器的索引条目,并且可以包含基于规则的特征、规则的输出和规则的输出概率的一个或多个标记。

可以接收搜索请求并识名与机器别与搜索请求匹配的令牌子集。

基于 token 的索引可以用来获

得基于 token 子集的多个输出概率。

可以根据名与机器输出概率的多样性选择一个输出并将其提供给用户。

可以对输出结果的子集进行排序。

例如,可以按名与机器概率对一百个视频(结果)进行排序,向用户显示从概率最高到概率最低的前二十个视频。

本文所述的系统和技术可以基于机器学习系统名与机器创建的模型的规则和结果来创建或修改一个或多个索引。

所生成或修改的索引可用于根据搜索技术提供结果。

从下面的详细描述、附图和权利要求中可以看到所述方法的进一步特征、优点和实施例。

该专利可以在以下网址找到:

可搜索索引

返回頂端