高级分析驱动新一代智能化供应链管理

标签:供应链智能化高级分析

访客:25080  发表于:2014-05-07 10:04:25

高级分析驱动新一代智能化供应链管理

                    屠冉冉, 上海通用汽车公司质量部的质量分析工程师

各位来宾大家好!今天很高兴可以代表通用公司作为SAS的用户和大家分享一下,文本分析在汽车行业领域中的一个应用。用一句话来说就是说我们使用了一种先进的IT技术,帮助我们解决了一个困扰我们很久的业务问题,叫做信息孤岛。说起信息孤岛不得不感慨,中国文字千变万化,大家在日常生活中会用很多不同的表达方式来说明一个意思,比如说我不同意你,我可以说我和你的意见不一样,也可以说我保留各自的意见,可以说我只是在一定的程度支持你或者说同意你。在我们的质量问题解决过程中,我们也遇到了同样的问题,就是说我们常常会发现,一个问题的失效表象不同的工程师会用不同的语言来描述,这样就给我们公司的关于过去质量问题知识的积累和经验,带来了很大的挑战。SGM在过去的十年解决了四万条质量问题,这四万条质量问题只是作为记录保存下来,而没有沉淀为知识,正是因为我们没有一个可行的文本分类,那么SAS ECC的软件帮助我们解决了这个问题,接下来我们将会围绕SAS ECC软件如何帮助我们解决信息孤岛问题来展开。

在正式的演讲之前我介绍一下我们公司,我们成立于1996年,员工一万多名,最新的凯迪拉克厂正在建设之中,我们截止到去年年底我们已经销售了130万辆汽车,覆盖了三大品牌也连续7年被评为最受尊重的企业。回到刚才我们所说的,我们面临的一个业务困难,就是信息孤岛。质量问题解决业务,其实是我们质量部门一个核心的业务,就像刚才所说的四万个我们在过去10年间解决了四万多条质量问题,这四万多条质量问题,是分散到了不同的10个团队,其中包括了质量评审团队,包括了一些新项目启动和售后团队,那么这些每一个团队都有它各自的缺陷代码的表示方式和它们各自的文字描述,这给我们知识的沟通和运用带来了很大的困难,这可以理解为一个信息孤岛问题。

举个例子来说,就像我们遇到了一个问题叫做门窗机升降困难,那么针对售后团队来说呢,他们会用N2144这样来描述这个问题,而PDI(Pre Delivery Inspection)会使用比较专业的,功能异常这样的专业术语描述这个问题,比较资深的工程师解决这个问题的时候,他也需要花一定的时间寻找历史上是否出现过同样的问题,或者说别的团队是否也正在解决这个问题。当然了如果说SGM可以解决这个困难,信息孤岛的困难带给我们的商业价值是比较振奋人心的。其中我认为最重要的价值就是我们过去业务积累的经验和业务问题解决的知识,能够沉淀下来,帮助指导我们现有的业务,提高我们现有的工程师的一个工作水平,并且指导我们现有工程师一个问题的解决。其实不知道在座的各位大家是否看过侦探小说,我们工程师解决质量问题,其实就像侦探小说里的侦探,它自己首先拥有很丰富的知识,各方面的知识,包括了医学、解剖学,推理学,然后运用这些知识来发现蛛丝马迹,来寻找嫌疑犯。我们工程师解决质量问题的过程,就像侦探小说里的侦探查找嫌疑犯的过程。

我记得福尔摩斯曾经说过一句话,就是事情的发展总是往复的,旧时代的齿轮在前进,同一根轮轴一定会转过来,过去发生的事情将来一定还会发生。那么我认为这一句话代表的哲理其实在当今的大数据时代的运用,也是非常有道理的。过去知识经验的积累,对我们未来去发现问题的根本原因具有很重要的指导意义。这是我们为什么做这件事情,针对这个困难我们提出的方案有两步,第一步就是建立一个符合业务的分类体系,像我们有杂乱文件我们想分类,首先我们要确定有几个盒子,每一个盒子的纬度是什么,这个就是我们的分类体系。第二部分当然就是把这堆杂乱的文件分到恰当的盒子里,在这个过程中我们考虑过三种方案,第一种就是统一刚才我说的各个业务块的一个缺陷模式的代码。但是各个模块的缺陷模式的代码是各个业务块经过十年来经验业务积累形成的,那么我们要推翻这一个理论是非常困难的,第二种方法就是应用专家来人为地进行分类和驱动。大家也知道现在大数据时代的发展,数据的增量是非常惊人的,所以说我们采用了第三种方案,就是应用IT工具来帮助我们实现这样的功能。回到刚才说的第一步,第一步就是我们要建立两个纬度的分类体系,我们建立的是一个叫失效表象和失效原因的分类体系,从右边的各个节点我们可以看出,这两大分类体系只是一个宏观上的体系,我们接下来归根据这两大分类体系定义出各个节点,我们分类的节点达到了一万多条。第二步就是将这四万多条的历史记录分配到这一万多个节点中,我们所用的就是SAS的ECC的软件,这个软件可以帮助我们正确分类的一个重要的依据,就是我们所建立的规则,而这个规则的建立是基于我们多年业务经验积累形成的切词表,将我们人类进行分类的数据机集作为初始的进行优化和叠加,直到产生最终的算法。今天还再不断的更新这样的算法,这是我们应用SAS的ECC软件结合业务所分类的分类规则,可以看出来在失效表象这一层,我们一共进行了五千多条的分类规则,而在失效根本原因这一点,我们编写了2.1387万条分类规则,保证了我们将繁杂的质量问题分到了正确的分类中的一个最重要保障。分类规则耗时5个月进行编制,前期的研发时间很长,但是到了后期我们只需要用一小部分的维修费,用更新的费用来更新新的词语和分类。

这显示的是我们运用SAS分类的结果和人工分类的一个匹配的精准度,我们可以看出来我们的准确率已经达到了95%以上,那么截止到今天我们还是在不断的维护这样子的分类规则和分类语句,那么我相信这个准确率比这个还得高。基于上述的理论,我们构建了一个系统叫做PSA问题解决系统,这是其中的一个问题输入的界面。工程师只需要把自己的文字输入到这个文字框里,按照推荐的按钮我们将会把它自动的分类分到正确的类别中去,工程师可以根据这一条子类查找出历史上曾经解决过跟这条类别相关的一个历史问题。基于刚才我们所说的两个失效分类,一个是失效表象,一个是失效原因,我们同样建立起了一个类似于这样子的分类引擎,这个分类引擎能够帮助我们工程师自动的诊断问题,我们可以看到历史上有1286条关于异响的,我们可以找到有哪一些情况,有底盘的异响,有发动机的异响,我们可以继续做,有83条助力泵造成的,传承轴承造成的异响。这个搜索引擎可以帮助我们从问题的表象调整问题的原因,可以从问题的原因查找历史的表象。基于我们刚才说的文本分析的一个应用,我们在未来会启动建立一个客户支撑的质量体系,因为我们大家知道现在客户的投诉不仅仅是通过索赔数据的报告,更多的是在呼叫中心,以及社交媒体投诉网站上进行表达客户对产品的意见。而社交媒体和用户网站上,往往很多是文本数据,我们这个文本分析的方法已经做了准备,能够帮助我们更好的分析这些社交媒体上的文本数据。这只是我们的第一步,那么我们的第二步其实就是大数据发展的一个趋势,是将文本数据和结构化的数据统筹起来,共同来帮助业务进行提升。我们第二步也是运用社交媒体的数据和我们自身业务所进展的KPI,结构化的数据统筹起来,来帮助我们完成质量问题的预警,质量问题的市场评估等等,它会有非常巨大的前景。

我结束今天的分享之前,我就今天的内容做一个小结,那么今天主要想和大家分享的就是有三部分,第一部分就是我们企业面临的一个巨大的业务挑战,就是信息孤岛,信息孤岛由于语言的千变万化和各个不同的缺陷代码所造成的,针对信息孤岛问题我们提出了两个解决方案,第一个方案建立合理的分类类别,第二个就是运用规则让机器自动完成分类。在以后我们会把我们这样的文本分类形式和分类的结果,运用在更加广阔的社交媒体的大数据领域。谢谢大家,今天这就是以上我所要分享的内容。

问:刚才看你的界面是有一个工程师可以输入的界面,那如果说是用户来投诉一些问题的话,它并不是以这种文本的形式,而是打电话过来,那么是不是这边需要有专门的客服人员接待,按照一定的规范来做。

屠冉冉:客户语言多样性,其实你说的这个问题就是我们日常所说的呼叫中心,会把客户的投诉记录下来,但是客户的语言很乱,这个就是我工程师在这个项目中很特殊的一点,就是我们构建了一个叫失效表象的问题分类,这个失效表象就是针对客户对问题抱怨,这个工程师可能会说摇窗机的功能异常,但是客户不会说,说我的窗户打不开,我的窗户下降不了。那么我们会针对客户这个表象建立一个这样的文本分类数,工程师会根据问题描述查询根本原因,长期措施和短期措施,这一个案子有两部分,一部分是客户的投诉,一部分是工程师的解决方案。把客户的投诉和工程师的解决方案放在一个问题上来进行分析,这样就解决了客户的问题。

问:你说的客户和工程师之间还有一套客户认证系统,是不是需要维护一套客服人员的专业团队。

屠冉冉:不需要把客户投诉记录下来就可以了,可能会用一些引导的词比较规范的语句记录,会记录客户的投诉是多少号发生的,问题是什么,客户使用的车辆的技能是什么,这是比较结构化的一个客户投诉的记录。但是实际上没有对客户的投诉进行进一步的处理,只是把他们记录下来了。

问:还是有工程师来进行这种原始的工作。

屠冉冉:对,现在我们用机器代替这个。

问:很重要的就是规则的建立,你建立这个规则用了一个什么样的一个团队,因为我觉得这个车里可能也是分不同的专业,他们在一起的吗,还是说怎么一个工作方式。

屠冉冉:规则的建立其实两个团队,一个是业务团队,一个是信息团队,业务团队主要是针对,就是说不同功能块,比如说我们会分SMT,就是说底盘、车身、电子,这些功能块的专家来汇聚起来,IT层面我们是怎么对客户的这个投诉进行分词,切词算法,把业务想要的分类总结出来,利用IT的技术来达到这种分类的效果。

问:这些规则运行的准确性是怎么评价的呢?

屠冉冉:抽取一部分的数据,机器跑,然后和人工比对,这样评估有效性。

问:我想问一下,你构建这个团队,在你开始筹建开始整个运营团队,就是说我要做这个事情了,IT和技术结合的这个事情,我花多少钱呢,多少时间呢,能不能有一个大体的估算谢谢。

屠冉冉:成本的问题不在这里透露,但是关于人的话首先是我们团队一共有10个人,加供应商还有一些业务,每一个业务会出2个工程师,工程师可能会一天进行这种访谈式,当时我们说了编规则我们耗时5个月,这个项目做下来我们用了大概一年的时间,现在还正在不断的完善和优化中,所以说接下来还是一直在会对这个项目有投入的。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");