【锐公司】按图索骥:虚实新世界

标签:锐公司移动搜索图片搜索盘古搜索

访客:29107  发表于:2013-09-26 11:08:27

【锐公司】按图索骥:虚实新世界

出门远足,来到一个陌生的国度,看到一个路牌不知道什么意思。你会怎么办?拿出手机一拍,搜索会告诉你这个地名它有怎样的历史,有哪些跟这个地名相关的新闻,在这条路上都曾经发生过什么故事。

走在街头,看到对面过来的美眉脚上的鞋子很好看,拍下来,搜索一下,看看这双鞋到底在哪儿有卖,都是什么价格??

在盘古搜索CEO王红宇看来,这些都是让她“着迷”的搜索正在实现的事情。“我们设想一下未来,未来大家的生活一定非常easy。”说到借助手机等移动端,搜索可以做的事时,王红宇有些难以掩饰的兴奋。而移动搜索正是创业两年多的盘古搜索希冀有所作为的领域。

“我们为什么专注在移动搜索领域?其实也是看到这个领域有很多的空白点。我们一直在探索,在移动互联网领域,围绕手机这样的载体,能够挖掘出怎样更新鲜的、更方便用户的功能点去支撑我们的服务。”作为盘古搜索CEO,王红宇经常会用这样的方式提醒产品开发团队,“用户拿到手机,他第一时间为什么要用你的搜索?他用你的搜索干什么?他想得到什么?用手机搜的肯定跟在桌面搜的不一样,使用的情景不同了。”

搜狗搜索CEO王小川提出要做“探索引擎”,以摆脱上一代搜索引擎“搜索框+关键词”的传统模式,中国搜索业界大佬百度的李彦宏也发内部邮件称要推进移动搜索业务,而这一点也被新进的有力竞争者盘古搜索看重。

即拍即搜,只是开始

2012年10月安卓全球开发者大会上,王红宇现场演示了“盘古搜索大众版手机客户端”图书频道的即拍即搜功能。点击相机icon-选择“拍摄封面”-拍照、保存,即可搜索相应图书内容,同时这个功能还能结合“商家比价”、“追书”、“在线阅读”等功能,使封面搜书、比价、阅读一气呵成。

事实上,“即拍即搜”是盘古搜索的产品开发团队为手机这样的移动设备量身定做的搜索功能。“正因为在手机上有拍照这样的功能,所以它(“即拍即搜”)才能实现,使用起来才会显得方便,才会有很好的用户体验。“王红宇说。

在她看来,移动搜索与传统搜索的重要区别是,从文字输入变为文字、图像、声音、体感、位置的综合输入,输出结果因为移动设备的特征而变得更自然、智能和互动。王红宇认为,要做好移动搜索,就必须重点开发基于最新的图像音频识别的用户输入技术,基于用户数据挖掘的推荐技术,基于云服务的多终端同步技术。

目前,语音交互技术已经开始成熟,智能手机上提供的语音交互的应用已经很丰富,语音搜索、语音输入法、语音导航软件、语音社交软件等大量应用已经越来越多。过去几年,谷歌已经在为移动设备和网页端的网页搜索添加新的自然语言搜索技术。视觉搜索将是移动搜索的另一个爆发点。

“大千世界的很多东西都是用图像方式印在我们脑海里,当我们还是小孩子的时候,最直接的感受外界的方式就是图像。那么,怎样通过我们所感知的图像经由搜索技术很简单地找到我们需要的信息,这其实是一个很重要且市场很大的需求。”王红宇说。

她认为,无线网络、移动终端的迅速发展,以视觉搜索为核心的产品正在将虚拟世界的网络信息融入现实世界,逐步还原人们自然的生活状态,同时获取更加丰富的网络信息。

什么是“视觉搜索”?基于图片、影像识别技术,将前端可视内容识别为可供检索的元素与后台数据库相匹配,从而为用户呈现出与之相关的搜索结果。在盘古搜索近期举办的移动搜索发展趋势研讨会上,有专家表示,视觉搜索技术的关键在于前端的图像分析技术,以及后台数据库的垂直信息内容是否充足并具备自我成长的能力。

在产品化方面,视觉搜索技术可以有很多种延展,比如以图搜图、人脸识别、图书搜索、宠物狗搜索、文字识别等功能。盘古搜索推出的“即拍即搜”功能,就是“视觉搜索”产品化呈现的方式之一。

如何在很短的时间内,搭建一个有关图书的图片信息大数据库?这对盘古搜索这样的创业公司来说,无疑是个挑战。是与既有的图书电子商务平台合作,盘古搜索搭建一个接口平台,整合图书电商既有的资源,还是另辟蹊径?

目前用户可以搜索到来自当当、京东、亚马逊等平台的图书资源。“我们其实有很多的想法,现在在逐步推进。”王红宇透露,盘古搜索正在开发一款“用户产生信息”(UGC)工具,这款工具主要是针对像小书店、有藏书的个人或者公司等,他们不像当当、京东等有精力有能力去建专门的图书电商网站,但是他们手中又有相当大的藏书资源。

王红宇介绍,借助盘古搜索的这款UGC工具,普通用户可以很方便地用手机拍照,将自家藏书的图片信息上传到网上,盘古搜索的后台会做进一步设计,比如用户是想交换书籍,还是想二手卖出,或者是想借书,根据用户不同的需求再深入开发产品。“这样我们可能会把甚至储藏了十几年、二十几年的书都搬到互联网上去,这其实是挺有意思的一件事情。”“激活藏书”的新思路,对盘古搜索“即拍即搜”这款功能性产品来说,不仅解决了图片搜索“量的问题”,还可能跟当当、京东等图书电商平台擅长的“新书”资源优势形成差异化。

“即拍即搜”在图书搜索上的应用,还只是盘古搜索的一次试水。“我们只是刚刚开始,图像识别可延伸的领域很多,技术的挑战点也很多。”王红宇说,文章开头的设想在不久的将来都会变为现实。

更深一步,从算法到数据挖掘

人类既然可以有通过声音驱动设备的Siri、Google Now、百度语音助手,又怎会忽略另一个人类与外部环境的核心交互能力——视觉呢?这是很多搜索业界人士都在思考的问题。

从全球范围看,在视觉搜索技术的探索方面,走在前面的当属Google和百度。Google在2009年分别推出网页版Google相似图片搜索和Google Goggles,后者是一款安卓版APP,可以拍照并搜索相似照片。2010年,Google特意收购英国视觉搜索公司Plink,以加强Goggles。“Google这套东西除了相似图片搜索技术应用于其购物搜索外,其他的并未带来商业价值。直到Google Glass的出现才让其积累多年的视觉搜索技术有了爆发的空间。”搜索业界人士、爱科技网创始人罗超认为。百度在视觉搜索上的发力也不算晚。2010年推出百度识图搜索(shitu.baidu.com),开始涉水视觉搜索。不过当时因为使用场景有限,这款产品并未被大众熟知,更多是满足了一种新鲜感。

即便如此,百度仍然投入了大量资源来研究视觉搜索。两年前李彦宏就宣称互联网“读图时代”到来,在2010年的KDD(知识发现世界年会)上,他提出的待解9大技术问题中,“基于内容的的视觉搜索”排在第三位。在2012年底的百度年会上,李彦宏将“全网人脸搜索”作为年会的压轴之作,这是一款通过用户上传照片,就能在互联网上找到相似照片的产品。图像识别技术应用于全网搜索后,以图搜图的准确率一下子从20%提升到80%。

有观点认为,在移动互联网上,视觉搜索的空间甚至比语音搜索还要大。盘古搜索CTO陈利人就是这种观点的支持者。他认为,相较于语言,视觉搜索的随意性对消费者来说意味着满足感。“比如说你拍了一瓶红酒的包装,就能知道其产地、年份等信息。视觉搜索应用到二维码标签、增强现实等多种技术。随着技术的不断成熟,它将重塑消费者的搜索体验和购买方式,并由此带来商业模式的转变,具有非常广阔的发展空间。”

此外,视觉搜索可以避开语音搜索很多本能的局限。比如语音的识别率赶不上图片识别,对使用者的说话语气、语速、口音等要求颇高,最大的问题是使用场景的局限性,比如跟手机说话会干扰周围的人,容易会被周围的环境干扰。视觉搜索天然地可以规避上述问题。

2011年王红宇提出有关搜索的愿景“不搜即索”,即“让用户在输入最少或无需输入的情况下获取到最想要的信息”。如果将“不搜即索”的理念外化为技术方向或者产品方向,盘古搜索2011年推出的“即说即搜”功能,以及去年推出的“即拍即搜”功能都是该理念的落地。而下一步,盘古搜索或许会在传感器和数据挖掘基础上的“需求发现”(基于一些算法去研究用户潜在的需求进而为用户推荐其所需要的信息)领域有所作为。

王红宇和盘古搜索的技术研发团队已经留意到,在今年的巴塞罗那手机展上,有很多终端厂商推出很多新应用,都是基于一些感应设备的。“就是为了让它(感应设备)自动产生一些大数据。这块也是下一步大家都会去抓住的技术点。”王红宇认为,搜索能力最终体现为大数据的处理能力,数据分析和挖掘能力。

最近几年,王红宇每年都要去一趟硅谷。去年的硅谷之行,她感受到一个非常明显的信号,在硅谷对于“搜索”技术的研究,“已经从基本的算法向数据挖掘等更深入的方向转变”。

在硅谷已经有一些技术公司在做这样的事情,即基于一些算法去研究用户潜在的需求。“比如用户搜索看电影,基于TA搜索电影的相关信息,我能判断出TA的兴趣爱好是什么,然后我会结合TA的兴趣爱好推荐相关的音乐给TA。尤其是跟手机相结合后,在TA心情郁闷的时候,告诉TA听某段音乐会舒缓情绪。这些其实都是数据挖掘,也就是大数据处理的一些结果。”王红宇举例。

她认为,移动终端相较于传统PC,在移动化、便捷化、个性化方面呈现出越来越多的优势,云计算技术、LBS技术、搜索引擎技术以及与之相关的语音识别、图像识别等便捷输入技术将不断升级、融合,在移动终端设备中组合出更多随身化、自然化、互动化的搜索产品。


评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");