关注微信公众号:一个数据人的自留地

作者介绍

经海路@薄荷点点

京东物流数据PM一枚。

专注“BI+”,带你发现数据产品的更多可能性。

谈到BI系统,大家第一印象多半是数据指标看板、可视化、大屏。今天我们暂时抛开可视化、数据指标等等元素,谈一谈在一个BI看板或者BI报表系统中引入数据决策的模块(功能)。


设想一下,你的业务用户,经常拉着你,不再是要求看这个指标,或者新增某个趋势图,而是希望和你讨论业务数据背后的原因,他们试图与你讨论通过数据自动化的分层、计算、处理等方式,得到一些更加聚合的“内容”,这些“内容”可能不是数据本身,有可能是定性的,有些甚至看起来是无法通过数据直接就能获得的。


当你遇到这些情况的时候,可能你的BI需要引入数据决策模块了。


有人会问,现在业务系统本身就要会做很多决策支持,数据BI系统来做决策支持,有什么区别和优势吗?


我给大家举个例子:


通过监控业务流的时间周期进行告警,主要是对于那些应发生而未发生的业务操作/状态进行告警,一般是监控延迟。比如,制造生产流程,物料是否按时到达某个指定环节了,物流流程,包裹是否按时到达某个中转点了,打车流程,司机是否按时到达乘客上车点。


一般来说,业务系统传统的做法是这样:先定义好每个流程节点应该完成的最晚时间,达到这个最晚时间了,动作还未发生/状态还未改变就告警。


事实上,业务流程上约定的最晚时间,会考虑很多的因素,一般是部门之间、上下游之间妥协的结果。业务流程也会尽量去动态制定最晚时间,比如会综合考虑上一个操作已完成的时刻、考虑人员班次轮换等。


我们使用数据来做的话,可以更加适应实际情况,可以利用数据反馈出来的规律,将现有流程与同期或者同水平条件(相同业务环境)下完成时间点水平进行比较,确定基准时间(注意数据找的就不是最晚时间了),如果没到达这个时间点就进行报警。


这里我描述得比较简单,基准时间需要根据不同现实环境与历史水平之间的关系来得到,这可以通过数据分析、数据挖掘的方法来做。


现实情况之所以特别依靠人脑的决策,就是因为影响现实世界的因素有很多,因素越多,靠越刚性的办法去解决就越做不好。而数据去驱动决策、去辅助决策支持的好处是:利用数据挖掘发现各个因素之间的关系,可以考虑更多影响因素,可以通过数据去覆盖更广泛的情况。


我自己目前遇到以下3种数据决策的场景情况比较多:


  • 风险告警

谈到风险,大家可能觉得金融场景用的多,但事实上,风险告警可以说是最接近数据的一种应用,只要有数据都可以用到这个场景。风险告警在BI上的典型例子就是指标波动告警。


当数据指标出现波动的时候,根据波动幅度大小,会有不同的通知方案,小波动,可能发个邮件通知到收件人,比较大幅度的波动,需要短信,更严重的需要短信+电话呼出。这种场景可以通过是规则来实现,产品经理定义好波动的幅度和对应的通知策略,系统计算波动指标,到达对应阈值范围,触发通知指令。


  • 问题诊断

某些数据指标出现了波动,那么是什么原因造成的波动呢;订单生产的速度变慢了,是哪个环节造成的呢。这些都属于问题诊断。问题诊断是风险告警的下一步,需要先对整个流程上各个环节进行数据监控,能够发现异常(数据波动),问题诊断是回答:造成现状异常的环节在哪里发生,或者原因是什么。类似与数据分析里面的归因分析。


传统的做法,是将专家经验转化为一个个有层级的条件,通过查看数据符合哪些条件分支,最终来定位到异常环节或者原因,类比的话很像决策树的处理方法。


如果使用数据的方法,可以考虑将专家经验转化为知识图谱(注意这里就不是再使用策略了),知识图谱可以扩展专家经验,能够挖掘事物之间的联系并且可以进行推理,对于一些新出现的问题,在扩展性和覆盖面上会比专家经验要高。


举个例子:

数据库运维,如果使用专家经验策略的话,一般是根据固定的排错路径,依次查看CPU、内存、IO等各项指标,先看这里有没有问题,没有问题再看下一处。


如果使用知识图谱,则可以同时去计算多个排查路径中涉及到的指标,对排查路径进行优化和推荐,对于一些复杂的问题(有多项指标出问题了)或者新的问题,会得到一些专家也未必能够第一时间想到的排查路径,适应新会比较好。(但是知识图谱也是在专家经验基础上进行沉淀、转化的,知识图谱的质量决定了数据决策应用的效果,其核心在于对于所属领域内实体关系的理解)


  • 决策建议

很多人都知道数据驱动决策,最直观的就是决策建议了。不过我们会发现能够对业务有效的建议十分少见的。这是因为业务的复杂性和数据的可得性决定的。但是我们也有应对办法——对于已经超出现有能力的情况,还是由业务专家和数据专家们去解决,系统只做系统能做到的事。


情况一:业务框架稳定,解决问题的策略已经十分成熟。

常见的场景:电子商务品类运营,对于各类反应商品销售、点击的情况,指标体系十分成熟,对于各类指标反应的情况,也有成熟的运营策略。这样的情况就十分适合进行系统化,通过数据+策略联动,实现决策建议。


情况二:业务框架稳定,有一定解决方法,但是出现的问题和解决方法不稳定、难以定性。


常见的场景:自动化生产车间在制造过程中的生产资源投入,比如机器人工作站的开启与关闭,这种情况下,虽然业务流程很明确,解决方法也有(缺少资源就增加资源),但是对问题的判断比较模糊(何时、何地、何种程度),对于出现问题之后的解决办法难以定性,比如增加资源,增加多少合适呢?


如果需要解决的业务场景能做到目标明确,就可以使用一些特定领域的建模方法(比如运筹优化),直接将问题转化为算法问题。


但是大部分情况下,都难以做到目标明确(无法收敛为一个目标函数),这是因为业务目标通常不是单一的。比如自动化车间生产过程中的资源调度问题,背后是效率和成本的平衡,这时候我们考虑用业务专家经验转化为策略,将场景拆分,对可以采取数据策略的办法进行决策建议的优先处理,我们很难计算出定量的决策建议,就先给定性的方向,建议用户应该增加资源了(暂时不建议具体数量)。这种情况下,决策建议的好坏,在于业务专家对数据及其背后代表的流程内核的深刻理解。


做好数据决策很难,篇幅有限,本文先抛砖引玉,未来有机会还希望能和读者们进一步探讨。毕竟,我们都知道,数据的价值最终还是在于业务。

点赞(966) 打赏

评论列表 共有 0 条评论

暂无评论
立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部