【锐公司】后Siri时代:探秘“语义”

标签:锐公司Siri语音搜索智能360语义搜索

访客:38329  发表于:2013-09-26 11:03:52

【锐公司】后Siri时代:探秘“语义”

智能360的产品刚推出时,大家都习惯称之为,“中文Siri”。

智能360创始人、CEO何永介绍,2011年4月份开始这个创业项目,当时做的是语音360一款通话录音软件,后来不断功能丰富,增加了语音助手这个模块。

何永前后创过几次业,分别是在大学、读研期间,但都失败了。创业智能360之前,他曾在国内知名的IT公司工作过。人工智能一直是他很感兴趣的领域之一,只是一直找不到好的切入点,直到Siri的出现,何永有了感觉。

在业界,语音搜索早先的模式是用户可以通过打电话的方式查一些专项的资讯,比如天气预报或者打12315。苹果Siri的出现,让业界意识到语音助手代表的是人工智能方向,其最核心的技术是自然语言理解和语义解析。从某种程度上说,Siri 也是一个搜索引擎,它提供的并不是大量的网站链接,而是问题的答案。

被点醒的何永等人,立即调整产品开发方向。团队早期的产品“语音360”,包括语音备忘、通话录音、语音助手(比如增语音拨号、发短信)等功能模块。2012年1月,语音助手模块被拿出来专门开发,命名为智能360,并于当月中旬上线,成为国内第一款真正意义上的中文语音助手。

2012年春节过后,在没有花费一分钱的推广费用的前提下,这个由几个“80后”年轻人利用业余时间制作的“中文版Siri”语音助手,受到用户追捧。最多的一天新增用户26000人。短短3个月时间,智能360获得150万用户。当时,创业团队刚刚拿到天使投资,尚未注册公司。

2012年2月底,何永和伙伴们联合创立的上海聚熵信息技术有限公司(简称“聚熵”)正式成立,目标是专注于移动互联网移动语音智能交互平台的研发和运营。

语音助手类产品最核心的技术门槛在于自然语言理解、语义解析。智能360联合创始人李传丰介绍,语义解析这块功能是由智能360团队自主研发的,这是国内第一款中文语义解析引擎。他还告诉记者,他们正准备在保持原有的合作下,把语义解析这块放开,并命名为“语义云”。

从2012年5月份开始,智能360团队着手做中文语义云。李传丰透露,团队正是在开发语音360的过程中,发现阻碍语音智能交互发展的最大瓶颈是“语义”。

他坦言,做语义云技术平台“挺难的”。“给自己用、给别人用、给大家一起用,技术平台的不同定位,开发的思路完全不同。”也正是从中文语义云开始,李传丰认为,智能360与Siri的发展思路“越来越不一样”。

如何“不一样”?李传丰进一步解释,从苹果现有动作来看,其真正的意图是“将Siri打造成为iOS中的一个独立的微系统,并建立完善的生态系统,以最终占领语音人工智能市场”;而聚熵是创业公司,结合自身实际情况,“我们选择对用户常用的一些实用性功能做深做精,同时兼顾娱乐性,大量长尾性功能则借助于语义云平台接入第三方内容来满足用户需求”。换句话说,一个是秉承苹果一贯的思路,Siri将是一个封闭的微系统;一个是创业公司迅速壮大的捷径,自己搭台别人唱戏。

“整合各类垂直内容的提供商”,这是团队对“智能360”这种语音助手类产品的平台性定位。李传丰介绍,智能360的搜索引擎调用云云搜索,优惠券和丁丁合作,机票用去哪儿网等,而且这些内容提供商都不是唯一的。

李传丰介绍,智能360中文语义云的1.0版本将在一两个月内上线。现已经邀请200多个开发者进行内测。李传丰称之为“雏形打造出来了,就好像毛坯房,还需要调整、精装修”。

某种程度上,微信的火爆成为智能360中文语义云可以借力的“大势”。微信开发者为何会有意使用中文语义云的平台?李传丰认为,现在越来越多的开发者在为自己的微信平台打造客服机器人,一些移动应用开发者也在考虑为自己的产品添加人机交互功能服务,所以会对智能360中文语义云的技术存在一定的需求,如李传丰所言这是“国内第一款中文语义解析引擎”。

李传丰还认为,语义解析这个功能存在一定的技术壁垒。智能360团队的部分成员在这个领域已有5、6年的技术积累,即便是大公司想模仿,至少也得花个半年时间。依他看来,智能360在中文语义解析上可以说是抢到了先机。

而在英语系语义网的建立上,Google目前来看比Siri更有技术优势。

美国知名科技博客Business Insider,将Google的语音搜索形容成“Siri杀手”。纽约时报有博客称,Google已经积累了数十亿不同发音的数据,这些数据积累通过Google其他的产品完成,比如2007年推出的Google-411、Google Local Voice Search等等。而苹果之前不曾投入相关产品的开发,Siri发布的早期缺乏相关的语音数据库。

2012年10月Google搜索的iOS应用更新发布。尽管使用过程没有什么新鲜感,也就是按下语音按钮,问个问题,然后应用会提供答案,但是Google的这个语音搜索可以将搜索结果直接导向Google的知识图谱,呈现的信息会比Siri更翔实。

在中国,继讯飞、搜狗、百度都开发了语音助手产品之后,腾讯近期在语音智能交互上的战略豁然清晰起来。“做平台、生态系统,各垂直领域语音助手交给开发者去做。”李传丰一直观察微信,今年春节前后微信发布新版本,对于新版本开放文本消息接口、语音接口,李传丰解读为“微信杀入语音助手领域”的“信号”。

在他看来,微信棋局高明,做平台、生态系统,各垂直领域语音助手交给开发者去做。“现有的各大语音助手大多已开发微信版本,也迫切希望与微信合作,增加用户量,双方互利共赢,共同培育市场。”李传丰透露,搜狗语音助手已抢先拿到语音接口,并推出微信版搜狗语音助手。

李传丰还透露,现阶段微信的语音识别技术由科大讯飞提供;而语义解析技术,他认为可由语义云提供服务。“借由讯飞语音云以及聚熵语义云可以武装众多微信公众账号,微信平台上几个月内即可诞生成千上万个的垂直领域语音助手,实现智能交互,对话即服务。”在他看来,微信借助平台优势成为总的语音入口,即另一种形态的通用语音助手,挟数亿用户立于不败之地。

李传丰也预计,由于语音技术以及语义解析技术的重要性,微信最终可能会选择自己把持。“语音助手代表搜索引擎变革的一种方向,因而百度在移动端最大的竞争对手可能不是360而是微信。”李传丰以为,微信若走这步棋,只需要一年的时间即可基本实现,“一年后,百度语音助手用户能达到5000万已属不易,而微信则是一个用户过5亿的语音助手入口,高下立判”。


评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");