GBDC2016|IBM分析开发总经理吉燕勇:认知计算-通往智慧之路

标签:大数据IBM云计算智慧城市

访客:13025  发表于:2016-01-20 12:29:14

2016120日,2016全球大数据峰会GBDC2016在京举行。本次大会由全球大数据联盟(GBDC)、全球移动游戏联盟(GMGC)、世界O2O组织(WOO)、光合资本主办,中国互联网协会(ISCO2O工作组、中国汽车流通协会(CADA)支持。IBM中国开发中心IBM分析开发总经理吉燕勇做了主题为《认知计算-通往智慧之路的演讲。以下是他的演讲全文:

GBDC2016|IBM分析开发总经理吉燕勇:认知计算-通往智慧之路

吉燕勇:各位领导之各位专家、各位朋友,大家上午好。我来自于IBM,说IBM我们业务分:硬件、软件和咨询。大家可能还不知道,这个月我们刚刚宣布了战略转型,未来只有:认知计算和云平台。我们觉得这个时代到了认知时代,认知时代是什么时代?编程时代,大家都比较熟悉,就是你需要一个软件,需要一个程序,通过程序来控制,来循环,这中间实现都需要编程。认知时代怎么来的?其实不是突然来的,这也是经过几十年的探索,可以说从50年的图灵测试,56年的人工智能诞生,到65年多象技术出现。

随着互联网出现,计算能力的提高,包括说信息的数字化,包括分析能力的提高的话,认知计算在90年代以后加速发展。我们2011IBM发明出沃森计算机,这是一个认知技术。IBM参加一个美国电视节目,跟人来竞赛,是一个电视抢答节目。答对了加分,答错了减分。最终沃森获胜。它面临三个:第一,计算机能理解人类语言。第二,计算机能够基础学习和推理找到正确答案。第三,在抢答必须在比较快的时间跟人抢答。这里涉及到什么技术呢?从分析过程讲的话,第一步,因为是人类语言,问题也是比较丰富的,所以需要对问题、主题进行分解。第二,分解问题以后,需要通过知识库我们要找到假设,最后通过数据库打分,然后形成一个答案图来,就是有一个信任度。这是在沃森里设计到这样一个分析过程,里面设计到技术的话是自然语言处理,怎么能够理解人的语言?第二,怎么创建知识库进行信息检索。第三,怎么能够创建证据库对假设打分。最终,可以合并说假设这个题,然后生成答案,形成信任度。在这个深度问答里,IBM通过这样一个展示,能够展现出,其实目前在认知计机里比较有比较大的突破。

认知计算和大数据有什么关系呢?第一,它解决自然语言和人交互。这个可能不像传统之间,传统更多是通过计算机交互,它把很多东西通过数据方式交互,这是通过语言交互。第二,既然是语言的话很多是含糊的,有歧义的,怎么解释出语言出来。然后,这个答案可能不是百分之百的,可能找到的答案是20%,如果是20%的话要不要抢答,如果是90%的话是不是抢答?最后,它处理很多数据,解决问题可能没有明确出来,所以这里我们把认知技术跟传统的数据分析简单做一下区别来看。

IBM通过沃森突破以后,之后把数据放在云平台,能够非常快调用一个认知出来。这个月我们刚刚成立了一个新的部门,希望通过认知计算加速物联网里的发展。通过例子我想讲IBM怎么构建这么一个认知计算出来?我们拿IBM沃森在医疗行业里怎么帮助人看病?这里涉及几大技术:第一,怎么快速获取这个知识。很多海量数据,包括公有数据,私有数据,怎么把数据获得到,放到一起。第二,怎么学习。这个学习包括怎么解读知识,第二个,怎么把知识之间,包括信息之间建立比较有效的连接。包括说怎么通过算法怎么进行学习。还有通过专家训练越来越成熟。第三,怎么通过这样个证据的方式来打分来训练。最终来说,结果出来以后,如何展示,让人们理解这个事出来,并且能给人类带来一个突破性的感知和认知出来。洛伊这四块是我们在这里的一个核心体系。

我们看第一块,其实我们在沃森的资料库里已经做了1T的数据。这个1T数据使有讲究的,包括四千万文档,有一亿条的数据。这些数据有外部的数据,比如化学数据库—比如一些基因,一些库的东西,比如说教科书文献,都是你比较容易从外面找到一些数据放进去。第二,更重要的其实是怎么能够把这些试管实验的专利放进去,怎么能把一些活体实验放进去,怎么把临床实验数据,包括实验室系统都放进去,形成一个专家系统出来。这是在后面涉及到知识产权怎么解决和处理的问题,因为所有的东西都是有产权的。这样的话就有比较好的资料,就可以作为第二步了。第二步自学习其实很多层面,我们说学习的话,其实首先看它是跟搜索引擎不一样的。在知识库里需要解读很多的信息,比如“安定”这样的东西输进去,它要对整个安定化学图标,它的一些分子式,包括药品的ID,这些所有的都是安定。第二,它里面认为是一个本体论的观点,就是所有事情之间都是有关联的,所有都是之间都是有联系的。拿阿司匹林这个药品来看的话,它有症状,是一些关联性,它有副作用,也有关联性,它有药品种类关联性,有疗效关联性。所以说它在里面建立非常庞大的关联关系出来。第三,它其实要进行学习,进行推理,它怎么做呢?比如说定一个逻辑,比如说某种药能产生副作用这个逻辑。药就是一个实体,产生,然后有副作用。但是把这个算法定义好之后,它可以在所有的新药和旧药里来产生关系出来。像安定会消沉,阿司匹林有胃肠疼痛,它通过这样的算法,对所有的语料库进行学习,然后把这个关系找出来。这是第一个,怎么通过算法做学习出来。

第二个,像许多成长出来的,他给人看病的时候需要专家教它。专家看的时候,确实有这个副作用,但是他不是一对一的。有可能安定有四个副作用,阿司匹林也有其他的副作用。所以在专家培训和干预它进一步加,在这个系统就会进一步增强出来,在后面就变化这样一个图出来。所以通过算法它可以自学习和跟专家学习。学习完之后,怎么说在哪个问题上通过证据库打分。比如一个问题说,什么样的基因容易产生结肠癌?这个问题对它来讲的话它需要搜索所有的资料库,找到所有可能的假设出来。第二,它有很多实体关系,有很多算法,有很多推理系统,所以它需要在证据库里提取证据,找到这些东西跟结肠癌是不是有关系出来。但是这种结果,可能证据数量比较多,这种结果可能证据数量比较少,这个接近度比较多,所以这样的答案都有一个打分出来,这个答案是90%的可能性,这个是10%的可能性,找一堆答案出来,让专家,让医生来选择为什么进行这样的打分出来,所以它对人是补充,而不是竞争。所以IBM希望通过这样的认知系统对人类进行补充,对很多海量数据,人类无法建模,无法靠人工建模,无法靠人工找问题的时候,它的问题出来之后你可以进一步看为什么有这样的答案出来。最终,它要进行展示。结果出来怎么展示,把疾病和基因绑在一起,把两个不同的实体之间进行连接出来。如果这个东西对你比较惊讶或者比较意外的结果的话,你可以进一步往下走,它为什么这样走,你可以跟它交互,然后进一步让它学习和成长起来。通过这个例子,通过在医疗卫生里怎么能够通过建立资料库,获取海量数据,包括有些专利数据的话,构建一个资料库出来。第二,怎么通过自学习,能够让它解读知识,把实体之间的关系找到,通过算法推理学习。

IBM认知计算目前处于比较前沿研究,很多东西在中国不见得都能用,但是从这个月开始我们中国的第一的系统科研落地,是免费的,大家可以尝试。这个系统就是说你有任何数据,你弄进去就可以了,它能够解读数据。第二,在自然环境能理解业务出来。无论你需要的考试成绩,或者人事部的数据,销售数据,它能自己理解,然后它能帮你做预测,然后帮你展现,你如果有问题的话,能跟它交互。

跟大家看几个界面,这是数据探索,你数据进去之后出现的各种情况。这是它的预测分析,这是它的交互式包括。并且IBM在若干年里有一个非常大变化,之前IBM的产品比较深,比较难用,在2013年我们开始投资,把所有界面变得比较酷,比较有意思,这样感觉用起来比较方便,这些产品是用很多设计形式展现。这个战争是免费的,可以免费注册任何数据可以导进去,可以感受一下认知计算。

通过今天的演讲,跟大家分享一下我们IBM目前应该说宣布到这样一个系统出来,以后重点是关注认知计算,认知商业,目前在这块里面进展非常大,在商业里面无论通过医疗卫生,通过金融,通过IOT,非常多的商业突破,包括说在中国的话,从这个月开始已经把系统免费到中国,大家可以尝试。谢谢大家。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");