知识随搜索流动

标签:知识搜索

访客:31537  发表于:2015-12-28 10:01:06

【导读】知识可以流动得更优雅,连接人与知识只是第一步,知乎与搜狗还需要让人类帮助机器更懂人类。

知识随搜索流动

为什么知乎的搜索功能如此之烂?8月,有人在知乎上如此提问。“刚刚看过的东西搜索竟然都搜不出来。技术和运作方面都有什么原因呢?”这一看似踢馆的问题引来了100多个回答。
“目前,整体衡量搜索服务的效果好坏,或者说相对客观的比较任意两个搜索服务,搜索行业中有很多种量化衡量搜索结果的办法,其中使用最广泛的两种是DCG 评测和SBS 感知评测。”知乎负责搜索工作的工程师张前川承认,“烂不烂这个问题的结论是——真是很烂。”
知乎搜索之所以如此之烂,原因在于自然语言处理(NLP)类问题、排序算法类问题、性能和稳定性问题等。而由于知乎内容天然具有人的属性,其搜索还有包括个性化和社会化等要求,因此,知乎并不甘心接入 SITE(通用引擎的站内搜索)。
那么到底什么样的搜索引擎才是高度个性化社会化知识内容所需要的助力呢?悬念揭晓已是两个月之后。当然,假如不是历时两个月,这一前奏似乎可以被猜想为自黑式公关,因为进入11月,这篇“老帖”与其他几个问题一起,引来了大大小小的知乎大咖,搜狗CEO王小川、知乎创始人兼CEO周源纷纷现身。然后,某个事件发生了。

为什么是搜狗?

2015年11月,搜狗搜索、知乎对外公布了合作方案——“优质内容X智慧搜索”。这两家公司此次共开启了两个层面的深入合作。搜狗全面接入知乎内容数据,搜索用户可在搜索结果中直接获取知乎2000万专业问答信息,同时上线搜狗知乎搜索垂直频道,该频道的功能是聚合知乎优质内容;知乎启用搜狗为其定制的搜索技术解决方案,升级知乎搜索的底层引擎,改善PC及无线端的搜索功能和服务。
此次合作并非一时兴起,王小川不仅是活跃在知乎上的“大V”,周源也“客串”过这位大V客服的角色。“搜索体验不好是我们非常关注的事情。” 周源透露,“王小川邀请我参加会的时候向我吐槽。”
“我一直想,这个内容是否有机会通过搜狗和搜狗搜索带来互补,让他们知道独有的价值。”王小川坦言。
两家公司都有对于搜索相关内容的海量需求。搜狗副总裁茹立云说:“搜狗搜索近5亿的用户每天产生海量需求,作为独家将2000万知乎专业问答信息接入的搜索引擎,能够为用户提供真正有价值的搜索结果。”。
目前,知乎全站已累计产生约700万个问题及近2300万个回答,内容遍布在10万多个话题领域。“如何有效激活知乎平台上沉淀下来的知识,解决站内搜索难点,并且让优质内容和生产者走得更远,是知乎一直努力的方向。”知乎CTO李申申表示。
这一次,搜狗搜索独家接入知乎的全量数据,来自知乎平台的问题与答案、话题以及用户三个层面的内容,都会实时推送到搜狗搜索的结果中。此外,搜狗搜索凭借对知乎数据的积累与挖掘,对用户的查询需求理解以及与结果的匹配计算等搜索技术实力,对知乎海量专业知识进行了优化排序,确保被多数用户认可的最优内容能排在搜索结果前列,缩短了搜狗搜索用户繁冗筛选的过程,提升搜索效率,提供更便捷有效且差异化的搜索体验。
知乎频道是继微信内容频道上线后,搜狗推出的第二个垂直内容搜索频道,实时聚合知乎平台最新鲜最有热度的内容,包含知乎热门话题、搜索热词、知名专栏等版块在内的知乎优质内容,会以“不搜即得”的一站式便捷方式,呈现给搜狗搜索上对知乎有兴趣的用户。
所谓智慧搜索,茹立云认为,基本上需要四个方面的需求。第一是在系统架构层面,搜索引擎积极响应用户的海量请求;第二是全网数据积累与挖掘;第三,是用户使用搜狗的时候,并不知道互联网上有什么内容,因此,如何了解用户背后的信息,分析用户需求也是一件需要积累的事情;第四即是结果匹配,已经经历了从最早的基础算法到现在进行深度学习的过程。

知乎搜索之后

合作主要是基于产品层面的互补,除此之外,知乎和搜狗两家公司还有更多合作的可能。
“知乎是分享内容的体系。”王小川认为,“知乎本身是有社群,我们(搜狗)代表了一种很广泛的,想获取知识的需求,这是最基础的对接。
利用之前的技术积累,搜狗为知乎定制了一套专属的搜索引擎。“我们内部组建了专门的项目团队,会把之前搜狗所拥有的成熟的技术用到知乎的解决方案里面去。”茹立云透露,“另外,基于知乎社区设计所独有的技术特性,和它们所对应的技术优化,两个团队最终磨合在一起,差不多用了短短3周时间就把知乎搜索作为一个升级方案上线了。”
大数据挖掘、机器学习排序等搜狗几项技术的使用在提高知乎搜索体验上见效相对较快。不过知乎毕竟有着典型的社区特性,搜狗还需要将深度挖掘问答质量、用户回答质量、与用户间的社交关系等特性有机融合到知乎的搜索结果中。“我们后续会根据用户使用知乎搜索的行为,再去做自学习,让知乎的搜索越来越好,做个性化的搜索。”茹立云说。
“这次改进上线以后我们做了评测,几乎搜索DCG评测从之前的0.39也提高到了0.64。”李申申透露,此次搜索改进主要在三个方面进步明显。“自然语言处理能力比之前有了大的提升;第二,我们有更优化的排序算法;第三,我们引入了更强劲的机器学习模块,让知乎搜索拥有了自学习的能力。”
未来双方的合作还会往以下两个领域走向纵深。目前的知乎主要聚焦于问答,通过这一方式将人与信息组织起来在互联网上生产并传播内容,促进相关内容的创造、沉淀与流动。将来,在知乎上,知识和经验的流动还有望发展出更多的形式。“我们交互给用户的是问答,但其实知识是可以立体、动态结构化的,我希望在这里面有更多的合作和参与。”王小川认为,知乎作为知识的创造与沉淀平台,与搜狗的核心价值——知识的输入与知识的搜索有着天然的匹配。
输入法是搜狗“三级火箭”之一,输入行为与知乎的内容也是天然匹配的,当知乎从文字走向更多的输入方式去生产内容,输入法本身也将更智慧更懂得用户的需求。“它能够辅助用户做更多的思考,我们的输入法后台做一些对接,让用户在输入上能够给你提供更多的服务,输入也更加的准确,这是知乎到搜索更大的用户完整体验。”王小川说。
在知乎上,主要基于问答形式的知识与经验的流动与人高度相关。这也对搜索引擎提出了更多要求。
搜狗的解决方案是,一方面,基于搜索的技术与知乎等平台产生更多的合作(知乎是搜狗战略投资的第一家公司),把信息更多结构化,信息编辑更碎。从搜索到输入法,本来是对用户获取信息,这类合作能促进用户输入信息能力的提升。“搜索里面如果遇到不会的内容,我们还是更好地跟搜索做连接,甚至连接这种答案甚至联系更多人,促进他们参与问题的回答。”王小川说,“我们有机会能够让问题找到相关的人。”
输入法也会成为辅助思考的工具。“当你在挑字的时候,以前这种填空题,它能够更懂你,像选择题,按照搜索的语言重新组织一些问题帮你提问,这样的话,在信息源头上,也能够跟知乎共通起来,”王小川认为,“搜狗本身一方面连接差异化的内容,尤其是社交网络,一方面是在源头上更加懂业务,帮助用户表达、思考帮助他们发问。” 
-----------------------------
本文系经理+原创,作者: 何菲,转载请注明出处和作者名

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");