热门

<p>本周早些时候,有关谷歌RankBrain的消息爆发,这是一个机器学习系统,与其他算法因素一起,有助于确定特定查询集的最佳结果</p><p>具体来说,RankBrain似乎与查询处理和细化有关,使用模式识别可以采用复杂和/或模糊的搜索查询并将它们与特定主题相关联这使得Google可以向用户提供更好的搜索结果,特别是在搜索引擎以前从未见过的数亿次搜索查询的情况下不要掉以轻心,Google表示RankBrain是算法考虑的数百个排名信号中最重要的信号之一RankBrain是进入算法的“数百个”信号之一,用于确定Google上出现的结果搜索页面以及它们在哪里排名,Corrado说在已经部署的几个月里,RankBrain已成为第三重要的gnal对搜索查询的结果做出了贡献,他说(注意:RankBrain更像是一个“查询处理器”而不是真正的“排名因子”</p><p>目前还不清楚RankBrain究竟是如何作为排名信号的,因为这些通常与以某种方式提供的内容)这并不是近期内存搜索的唯一重大变化,但是在过去的几年里,Google对搜索的工作方式做了很多重大改动,从算法更新到搜索结果页面布局Google已经发展壮大变成了一个与前企鹅和前熊猫不同的动物这些变化并没有停留在搜索上,要么公司已经改变了它的结构如何使用新的和单独的“Alphabet”保护伞,谷歌不再是一个有机体甚至主要的一个甚至从谷歌到SEO和网站管理员的沟通已经基本上走了渡渡路的方式马特卡茨不再是“谷歌的转变”,可靠的信息变得难以获得如此多的变化在如此短的时间内似乎谷歌正在推进然而,RankBrain与之前的变化大不相同RankBrain是一项努力优化谷歌基于知识图的实体搜索的查询结果虽然实体搜索不是新的,但增加了一个完整的推出机器学习算法这些结果只有三个月左右那么什么是实体搜索</p><p>这与RankBrain有什么关系</p><p>谷歌在哪里</p><p>为了理解背景,我们需要回顾几年蜂鸟算法的推出是彻底的改变谷歌处理有机查询的整个方式的彻底检查一夜之间,搜索来自寻找“字符串”(即字母串)在搜索查询中)寻找“事物”(即实体)蜂鸟来自哪里</p><p>新的Hummingbird算法诞生于谷歌将语义搜索融入其搜索引擎的努力</p><p>这应该是谷歌不仅涉及机器学习,而且涉及自然语言(或NLP)的理解和处理不再需要那些讨厌的关键词 - Google只会理解您在搜索框中输入内容的含义语义搜索旨在通过了解搜索者的意图以及在可搜索数据空间中出现的术语的上下文含义来提高搜索准确性,无论是在Web上还是在封闭系统中,生成更相关的结果语义搜索系统考虑各种点,包括搜索的上下文,位置,意图,单词的变化,同义词,广义和专业查询,概念匹配和自然语言查询,以提供相关的搜索结果主要的网络搜索引擎,如谷歌和Bing融合了语义搜索的一些元素然而,我们已经两年了,而且还有任何人使用谷歌知道语义搜索的梦想还没有实现谷歌没有达到任何标准,但谷歌远远没有完全定义</p><p>例如,它确实使用数据库来定义和关联实体但是,语义引擎会理解上下文如何影响单词,然后能够评估和解释意义谷歌没有这种理解事实上,根据一些人的说法,谷歌只是导航搜索 - 导航搜索不被定义为语义本质上所以当谷歌能够理解已知的实体和关系通过数据定义,距离和机器学习,它还不能理解自然(人类)语言 当Google的存储库中的这些关系弱相关或不存在时,它也无法轻易解释属性关联</p><p>此澄清通常是额外用户输入的结果当然,如果有足够多的人搜索,Google可以随着时间的推移学习许多这些定义和关系一组术语这是机器学习(RankBrain)的混合而不是用户优化查询集,机器根据用户的感知意图做出最佳猜测但是,即使使用RankBrain,Google也无法将含义解释为一个人的意志,这就是语义定义的自然语言部分所以根据定义,谷歌不是一个语义搜索引擎那么它是什么</p><p>如前所述,Google现在非常善于显示特定数据需要天气预报吗</p><p>交通状况</p><p>餐厅评论</p><p> Google可以提供此信息,而无需您访问网站,直接显示在搜索结果页面的顶部此类展示位置通常基于知识图表,这是Google从“字符串”转移到“事物”的结果“从”字符串“到”事物“的转变对于基于数据的搜索来说非常好,特别是当它将这些数据放在知识图中时这些数据位通常可以回答谁,什么,何处,何时,为什么以及谷歌自定义的“微时刻”谷歌的问题如何为用户提供他们可能在他们想要的时候甚至不知道他们想要的信息然而,这种对实体的推动并非没有缺点而谷歌已经出类拔萃在表面上直截了当,基于数据的信息,它还没有做的就是为复杂的查询集返回高度相关的答案在这里,我使用“复杂查询”来简单地引用查询t不容易映射到实体,一段已知数据和/或数据属性 - 从而使Google难以“理解”这样的查询因此,当您搜索一组复杂的术语时,有一个好处你只获得一些相关的结果,而不一定是高度相关的结果</p><p>结果更像是厨房的可能性,而不是一套直接的答案,但为什么呢</p><p>想要查看复杂的查询吗</p><p>像往常一样在Google中输入搜索现在检查结果如果您使用了一组不常见或不相关的术语,您会看到Google为未知或未映射的项目抛出结果的厨房水槽为什么会这样</p><p>谷歌正在搜索Google已知的项目并使用机器学习(RankBrain)来创建/理解/推断关系,当它们不容易派生时基本上,当实体或关系未知时,Google无法很好地推断出背景或意义 - 所以它猜测即使实体已知,当相关性尚未知晓时,无法确定搜索到的项目之间的相关性会降低记住Google在搜索时未显示的字词吗</p><p>它的工作方式就是这样,我们只是不再看到那些被删除的搜索条件了但是不要相信我的话如果你再次输入你的查询我们可以看到这个 - 但是当你输入时,请查看下拉列表框,看看会显示哪些结果这一次,而不是您最初搜索的查询,选择一个与您的意图最相似的下拉字词请注意,当您使用Google的字词时,结果会更加准确</p><p>为什么</p><p>如果不知道单词是如何定义的,Google就无法理解语言,如果没有足够的人告诉它(或者之前不知道)属性是相关的,它就无法理解这种关系</p><p>这些是实体在搜索中以简化的方式工作的方式</p><p> ,什么是实体</p><p>一般来说,名词 - 或人物/地点/想法/事物 - 就是我们所谓的实体实体已为谷歌所知,它们的含义在Google引用的数据库中定义</p><p>据我们所知,Google已经非常出色地告诉您所有关于天气,电影,餐厅和昨晚游戏的得分恰好是什么它可以给你定义和相关术语,甚至像数字百科全书那样很好地根据实体理解拉回数据点有谎言谷歌回归良好的摩擦是众所周知的,已知,已映射或推断的关系 但是,如果项目不易映射或项目未相互映射,则Google难以理解查询如前所述,Google基本上猜测了您的意思Google现在希望将页面上显示的字词转换为实体意味着什么,有相关的属性它是人类大脑自然而然地做到的,但对于计算机来说,它被称为人工智能这是一项具有挑战性的任务,但工作已经开始谷歌“正在建立一个巨大的,内部理解实体是什么世界各地的实体以及你应该对这些实体了解的信息库,“[谷歌软件工程师阿米特]辛哈尔说</p><p>举个例子,”冰茶“,”柠檬“和”玻璃“都是实体(东西) ),这些实体有一个已知的关系这意味着,当你搜索这些项目 - [冰茶,柠檬,玻璃] - 谷歌可以轻松撤回许多高度相关的结果谷歌“知道”什么你想要的用户意图非常明确谷歌可以做的事情是,实体冰茶实际上是一种被称为冰茶的东西它可以说玻璃确实是玻璃然而,在最后一个例子中,它不知道如何处理与冰茶,糖和玻璃有关的改性剂由于此查询可以参考冰茶中的糖或(在Google的“头脑中”)实验室中使用的糖溶液,它会为您提供冰的结果茶它然后给你的结果是没有冰茶,但确实有溶解糖然后,你有两个项目的一些结果,但它们与制作冰茶没有明显的关系我们看到的是最有可能的页面RankBrain尝试破译意图的结果它试图确定关系,但必须返回可能结果的厨房水槽,因为它不能确定您的意图所以我们现在拥有的是一组Google必须根据已知的“事物评估”的查询字词“(实体)然后,关系在这些事物之间根据已知的关系进行分析,此时它希望清楚地理解你的意图当它对这个意图的理解不足时,它可以利用RankBrain列出你的查询的可能结果集简单地说当他们无法将意图与结果相匹配时,他们会使用一台机器来帮助改进查询的概率那么谷歌将走向何方</p><p>虽然谷歌一直在试验RankBrain,但他们已经失去了市场份额 - 不是很多,但他们的美国数据仍在下降事实上,自Hummingbird推出以来,谷歌已经失去了大约3%的份额,所以看来这些结果没有收到更相关或改进(在某些情况下,你可以说它们更糟)谷歌可能不得不决定它是一个答案引擎还是一个搜索引擎,或者它可能将它们分开并同时做两个都无法生成一个语义引擎,谷歌基于事实构建一个RankBrain现在已被添加以帮助改进搜索结果,因为实体搜索不仅需要理解搜索中的名词意味着什么,还需要它们如何相关随着时间的推移,RankBrain将变得更好它将学习新的实体和可能它们之间的关系它将呈现比今天更好的结果然而,它们正在与称为用户共享的滴答时钟运行只有时间会告诉,但是时间是有限的意见表达本文中的sed是客座作者的内容,