【锐公司】知识图谱:从搜索引擎到智慧引擎

标签:Google锐公司知识图谱未来的搜索智慧引擎

访客:38200  发表于:2013-09-26 11:11:42

【锐公司】知识图谱:从搜索引擎到智慧引擎

如果你有名字记忆强迫症,Google Play Movie & TV 新增加的功能应该是个好消息:在观看电影或电视时,用户选择暂停时可以点击需要了解的演员面部,屏幕右方就会显示演员的相关信息,比如年龄、身高和其他影视作品等。目前,Movie & TV 也支持音乐的识别。

事实上,Google是将其知识图谱(Knowledge Graph)集成到该应用中。不过,这个功能目前只适用于美国地区,支持的电影也只有几百部,且只有系统是Android 4.0及以上的平板电脑的用户才能享用。

2012年5月,Google在美国推出了知识图谱。有评论称,这可能是Google搜索上线以来最大的一次改革。这也是全球搜索业老大对搜索未来的探索和实践。事实上,Google公司对搜索业务的调整速度远远超过往年。谷歌联合创始人、首席执行官拉里·佩奇(Larry Page)已经把搜索部门更名为“知识”。

阿米特·辛格哈尔(Amit Singhal),Google科学家兼高级副总裁、负责Google搜索的开发工作,他这样告诉我们,“Google希望未来的搜索引擎不仅能够理解你的问题,提供相关信息,而且能够为您提供现实世界中的知识解答——将来的某天甚至能够达到智慧搜索引擎的程度”。

他进一步说,“搜索还远达不到我们期待的发展水平。现有的搜索技术无法处理 ‘带有防虫喷雾的蚊帐是不是比不带防虫喷雾的蚊帐更有效?’这样的问题。如果从未有人问过一模一样的问题,那么就得不到理想的答案。因为这类问题的回答不仅仅要求编写这些信息——而且需要现实世界的‘实体’知识,以及它们的相互关联性。这就是我们目前正在尝试的方向,将搜索引擎变成一个知识引擎——未来的某一天实现智慧引擎”。

《星际旅行》里的电脑是Google做搜索的终极目标。它懂语音并且很健谈,你可以与它交谈,它应该了解你,也可以与你交谈,它可以给你答案而不是参考答案,它甚至可以预测你的需求。辛格哈尔说,“它是最完美的搜索引擎”。

要达到这个梦想,就意味着Google的搜索系统“需要超越网页上的文字,真正地了解人们的搜索意图,地点和事物——以及它们之间的相互联系。”换句话说,Google的知识图谱和语音搜索将是未来搜索的基石。

辛格哈尔介绍,这是一项具有挑战性的工作,而且这项工作早已启动了。Google知识图谱的信息搜集工作始于2010年收购 Metaweb。

Metaweb 专注于将不同文字表述与同一个实体连接起来,并探索这些实体的属性(例如明星的年龄)以及彼此之间的联系,最终提供一种新的搜索形式。虽然不能完全替代关键词搜索,但 Metaweb的索引、搜索方法在处理诸如“身高小于 160cm 的女星”之类的搜索时更高效。

Metaweb的主要信息来源是Freebase。但Google知识图谱的信息来源要宽广得多,不仅包括Freebase、维基百科、CIA World Factbook等公共资源,也从其它网页搜集整理了大量信息。Google官方提供的数据是目前已经搜集35亿条信息(facts)。

Google知识图谱刚发布的时候,只是在美国地区。现在,Google将把知识图谱推向每一个英语国家。

事实上,知识图谱的搜索形式并非Google首创。2009年启动的Wolfram Alpha 计划就已经开始提供更精确的信息。其与苹果公司合作并为Siri提供搜索支持,使得Wolfram Alpha这款智能搜索引擎名声大振。

Google要真正开发出《星际旅行》里那样的电脑,可能还需要很长时间,但是它已经在向这个目标一步步靠近。对于现在的很多搜索,你会发现Google给你提供的直接回答越来越多。

在“知识图谱”领域,另一IT巨头微软也一直在探索,他们将其称之为Entity Graph。微软全球资深副总裁沈向洋博士认为,搜索的终极其实是“人类智慧的结晶”。Entity Graph不是单纯的信息罗列,而是呈现事物的本质与事物间的关系。

“这是构筑下一代搜索至关重要的第一步。搜索将步入网络集智,对世界的理解也会更像人类。”这是Google知识图谱发布博文中的一句话。作为全球搜索市场占有率超过87%的业界老大,Google知识图谱的发布意味着提供更直接的信息已经是未来搜索发展的方向。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");