如何挖掘数据价值,让它变成真金白银?

CIOAge
五名来自2016年由CIO.com网站和德雷塞尔大学(Drexel U)联合举办的“数据分析50强”活动中的获奖者们分享了他们的项目的细节,经验教训及建议。

[[192167]]

五名来自2016年由CIO.com网站和德雷塞尔大学(Drexel U)联合举办的“数据分析50强”活动中的获奖者们分享了他们的项目的细节,经验教训及建议。

数据与分析重塑企业组织业务流程,使得内部与外部的数据的查询被打通,能更好地用于了解客户并提高生产效率。

来自研究公司IDC的五年预测:全球大数据与商业分析的收入将从2015年近1220亿美元增长到2019年的1870亿美元。

IDC分析师Dan Vesset 在年初发布“IDC全球半年度大数据和消费分析指南”中表示:“能够利用新一代商业分析解决方案的企业或组织可以用数字转型杠杆来适应颠覆性变化,并在市场中创造竞争优势”。这些企业或组织不仅仅是将现有的流程自动化,而是将数据视为有价值的资产,聚焦在使用的方法上来提取和发现有价值的信息。

此外,由Forrester委托毕马威全球数据分析团队的研究项目中发现:50%的企业用数据及数据分析工具来分析已有的客户,同时48%的企业利用其来寻找新客户,47%的企业利用其来开发新产品及开展新服务。

然而,现实很骨感。Forrester的研究同时发现,许多企业或组织正在努力调整企业文化,以适应将数据及分析发挥核心作用。但是,很多企业高管却不相信数据与分析所能产生的洞察能力。

与此同时,其他企业或组织顺应发展而利用数据与数据分析,并使用新的工具来更好的了解客户,开发了大量新产品及优化了业务流程。

为了表彰这些企业或组织,CIO.com网站和德雷塞尔大学LeBow商学院最近宣布了第一个“数据分析50强”奖项。获奖者来自广泛的行业,从制药、医疗到体育、媒体。

接下来的内容中,五位获奖者们介绍了他们的项目是如何提供可量化的结果,以及给那些正在筹建数据分析团队的IT领导者们提供建议。

费城儿童医院:监测和预防静脉血栓栓塞症

费城儿童医院(CHOP)一直致力于使用数据及前沿的分析方法来提高其护理质量和患者病况判断结果。为此,他们提出一项从医生报表中收集到的非结构化数据,通过使用文本分析工具获取洞察,旨在改善静脉血栓栓塞症(VTE)检测的举措。

CHOP高级分析总监John Martinr说:“从2008年开始,我们实际上一直在执行一个路线图和战略。”“开始的时候什么也没有,伴随着‘精密医学和分析的长期愿景,让我们建立一个基于用例的数据仓库’呼声,就这样起步了,我们必须建立起来。”

静脉血栓栓塞症(VTE)是一种包括在深静脉中形成血栓的病症,其能破坏并扩散到肺部(肺栓塞)。

根据美国公共健康与社会福利部的数据,美国每年约有35万到60万VTE新病例;复发性病例约为100万。近三分之二的VTE患者已经在治疗或新近入院,其中每年约有30万人死亡。

处于危险中的儿童

Martin指出,中枢性血液感染是医院接收的VTE患者中第二大常见原因,目前是全国预防的重点。Martin还说,与儿童VTE相关的总体死亡率约估为2.2%。此外,医院诊断患有获得性VTE的儿童患者平均住院时间比其他儿童长8.1天,并且需要花费25000美元以上的治疗费用。

尽管VTE危险,预防措施包括早期发现,可以大大降低病情的发生率。医生的诊断记录中可以找到这种预防类所需的大量数据。目前用于识别VTE案例的机制取决于手工的临床表和出院后的复查。Martin说,这两个过程都是耗时且容易出错的,而且不容易及时发现。

更快的过程

为了加快这一过程,CHOP决定为医生创建决策支持工具。医院将自然语言处理(NLP)应用于放射科医生的报告中,创建一个全自动化解决方案,可以批量快速地分析医师们的复杂的诊断记录数据,跟踪医院接收的VTE患者并提高判别的准确率。

每天临床文件的电子健康记录(EHR)备份到报告数据库,然后转移到CHOP数据仓库。

备份完成后,从放射学报告中删除识别信息,并通过安全云服务将报告传输到NLP引擎。 NLP引擎处理XML文档生成结果,其中包括文本记录数据的语义转换成离散数据,以及应用由CHOP为VTE创建的分类模型。然后,文档将传输到数据仓库,并还原患者身份。将数据转换为Hadoop结构化数据,其中规则引擎将VTE标签分配给每项研究。

“技术只做一件事”Martin说。“它只能自动化和简化人类可以做的事情,但可能不是那么快或精确。它只是一个工具。我们能够使用该工具,技术使得以前没有自动化的过程自动化,同时提高其准确性。然后,我们可以把宝贵的人力时间集中在做正确的事情上面。“

回报

Martin说,CHOP的VTE分析工作已经获得了回报。NLP工具识别VTE患者具有高度敏感性和特异性,并发现了被CHOP现有VTE筛查过程误判的VTE患者。

据Martin说,NLP引擎现在是CHOP的VTE预防改进工作的重要组成部分,他的团队正在探索其他方法来使用NLP应用程序,并希望其他医疗机构也可以使用。

英特尔:掌握供应链分析

将英特尔芯片和其他产品推向市场是一件非常复杂的事情。该公司的供应链是一个资本密集的全球网络,需要许多专业材料和复杂的制造工艺,交货期时间长,产品生命周期短。英特尔供应链战略分析总监Mani Janakiram说,半导体巨头在业务流程中已经开始了应用先进的供应链分析策略,并节省了数百万开支。

Janakiram说:“作为领先的半导体生产公司,英特尔是一家资本密集型和高固定资产的公司,我们的资本支出每年达到约100亿美元。”“我们工厂使用的每个设备的成本可能在3000万美元到1亿美元之间。而一个新的半导体工厂的成本可能高达40亿美元。”

Janakiram补充说,开发和掌握分析技术用于预测,规划和整合跨功能供应链指标,使公司能够通过合理购买设备,降低库存水平和识别系统范围可能的优化的机会来节省数百万美元。

财务上涨

高级数据分析工具还能帮助英特尔通过提高客户满意度、敏捷性和缩短产品上市时间,从而获得数百万美元(甚至数十亿美元)的收入,Janakiram说。

在许多情况下,在英特尔开始生产产品之前,资本规划和业务承包需要两年多时间。Janakiram说,甚至在这些产品敲定之前,交货生产时间也是要几个月,尽管客户希望在几天之内就可以调整订单。

数据驱动

英特尔是一家数据驱动决策的公司,数据分析师在其所做的一切中发挥作用,Janakiram说。当它意识到其供应链指标与APICS供应链管理委员会的供应链运营参考(SCOR)模型不完全一致时,Janakiram及其团队转向采用先进的分析方法和模型来解决问题。他们跟踪、对标和改进了关键的“一级”指标,指导核心业务高效运营,并提供对未来业务线的分析洞察。

Janakiram说:“我们培养了高技能的数据科学家,兼具业务和分析技能。”“我们的数据科学家在运筹学、计算机科学、数学、统计学、数据挖掘、金融和商业等方面具备专业知识,他们利用商业和技术分析结合来识别、解决和校准关键指标。

他补充说,“通过这些努力,分析团队展示了如何通过高效的数据模型来帮助我们的供应链做出更好、更有效的决策,使英特尔具有竞争优势。”

“我们定期评估和应用诸如:大数据,认知计算,文本挖掘,基于代理建模和仿真等技术。”“我们还与著名大学合作,将先进的分析技术应用于我们的指标,以及其他补充的供应链需求中,包括先进的生产计划、供应链规则、库存策略、采购和仿真建模。”

Janakiram说,说服英特尔的领导团队执行这个项目是必要的,不是很难,但并不总是这样的。

“有时候这不是一件容易的事情”他说。“在某些情况下,解决方案是新的或不断改进的,我们必须明确它对企业意味着什么,必须显示其未来的价值。我们做一个概念证明,通过这个过程来获得管理层的认可。”

他说这个时机是很重要的,因为它有助于让终端用户克服变化的阻力。与利益相关者和管理人员,关键决策者和用户可以参与到这个过程中。

Janakiram提供了给在筹建分析项目的高管的三条建议:

  1. 吸引合适人才。
  2. 问正确的问题。需要了解用户的痛点和优先级以此了解问题。
  3. 不要被分析系统的优雅所诱惑。相反,专注于如何通过正确的分析和应用程序来改善客户和利益相关者的用户体验。

做功课

Janakiram和他的团队从该项目中学到的,首先是“做自己的功课”,以便你能够理解这个问题,第二是学习别人怎么做。

“看看类似的,志同道合的公司或团体”他说,然后问:“他们有什么是我们必须学习的,可以快速跟踪?”

此外,确保你可以零碎地构建自己的系统,并获得信誉,Janakiram补充说:“你需要持续投入才有盛宴。”

新墨西哥劳工部:预测欺诈付款

新墨西哥劳工部(DWS)多年来一直在为改善欺诈的失业保险(UI)支付而努力。不是一个人,全国各地的政府机构都面临着同样的问题。2014年,在美国出现40多亿美元的误付款。DWS已经应用预测分析和行为分析技术来遏制这个问题。

DWS副部长Joy Forehand表示,2014年美国UI项目中每八个发布中就有近一美元是不合格的。虽然盗用身份和类似的犯罪已经抓住,上了头条新闻,但实际上占总费用的不到5%。为了解决其他95%不当付款,DWS设定了一些目标:提高程序的完整性,减少超额支付而不伤害合格的申请人,并在不扩大收款队伍的情况下增加收集工作。

内阁秘书Celina Bussey说:“我们需要真正了解我们不当付款的现实情况。”她补充说,从表面上看,绝大多数都存在不当付款的问题,该部门已经采取措施打击欺诈犯罪行为。

与德勤咨询公司合作,DWS发现不当付款通常是申请者做了以下一项或多项事情的结果:没有寻找新工作,没有正确申报收入,以及没有真实说明离职原因。

利用已有数据,该机构启动了一个名为“不当付款预防倡议”(IPPI)的项目。与德勤合作,DWS根据以往多付款模式开发了一种预测模型。它能识别出多付款的高风险个人。然后使用行为科学和“推送”技术来防止不当付款,提醒申请者遵守规则。

弹出提醒

该部门使用消息发送,包括认证框和弹窗,提醒申请者在三个关键时刻审查其信息的准确性和完整性:提交预审申请、报告工作和收入、并制定新的就业计划。

Bussey说:“首要的是我们需要一种创新的方法来防止不当付款的发生。”“申请人必须每周提交所需资料,以获得失业救济金。我们能够确定资料信息不准确从而识别风险较高的是谁。预测算法开发出来,利用历史超额付款情况训练调整优化,以规避高付款风险的情况。作为一个团队,我们知道如果我们个人改变行为并提供准确的信息数据,就可能阻止不正当的付款。”

此外,Bussey补充说:“我们不仅需要了解分析,而且还要了解客户动机。”根据这些数据,转向“行为科学”来鼓励申请人做出正确的决定,她说。“我们选择性测试了三种推送技术:认证框,增强型屏幕和弹出消息。”

为了确保预测分析和行为科学的有效结合,Bussey说,国家设立了一项随机试验,用来测试消息布局、措辞等。

成功推出

IPPI项目于2015年5月顺利启动,而Bussey表示,40%看到提醒后的申请人不太可能提出不当的申请。在相同人员配置情况下,这个工具帮助国家调查人员发现超过28%的不当支付。他们还发现超过8周的不当支付。机构官员表示,预计该做法可以将欺诈费用减少35%,为新墨西哥每年节省190万美元。

“我们可以为其他企业或组织,尤其是政府机构提供最好的建议,不要因为预测分析和行为科学的概念而感到不知所措”Bussey说,“虽然它们会挑战你来重新思考许多内部流程、应用程序和当前的思维方式,但这样的项目的潜在好处是值得努力。”

费城76人队:未取胜而赢得球迷

在2015-2016年的NBA赛季,费城76人队遭遇了NBA历史上最糟糕的季后赛,一个10-72的纪录。该专营权也创下了职业运动28场比赛最长的连败纪录。所有这一切都是发生在另外两个非常糟糕的赛季之后。

尽管球队挣扎,球迷一直保持忠诚。76人队在2014-2015和2015-2016赛季的NBA季票销售排名中排名第五,目前NBA新季票销售排名第二。

但该组织担心已经花了三年等待“明年”的季票从而开始失去耐心。而按体育行业标准,76人队的服务和保留人员相对小型,只有六名客户经理负责8000多名季票。在续订期间,六个人的团队花了四个多星期的时间通过自己的账户,并单独联系他们所有的粉丝。为了使流程更加有效,该组织组建了分析团队,寻找一种使用数据的方法来帮助客户经理优化时间效率,从而最大限度地提高续订率。

填补这些座位

该团队总监Braden Moore说:“季票是我们组织的命脉。”“我们希望全部41场比赛,每个座位都被持有热情的季票。更重要的是确保座位能够满足将要到来的季赛。”

首先,曾在美联储负责定量风险管理工作的Moore,与分析团队收集了所有人口特征和心理学信息,在Acxiom系统、CRM接触点、电子邮件营销行为等中可以获取到职位、地址、购买行为和出勤历史记录数据。然后他们通过机器学习(包括逻辑回归,支持向量机,随机森林和决策树)处理数据,并开发了一个双向模型,其中包含以下内容:

1.逻辑回归预测每个潜在更新的可能性。这用于设定基准预测并确定整体优先级。

2.决策树获取消费者行为突破点的洞察。这被用来以可理解地方式向帐户主管汇报。它还确定了最成功的干预类型和杠杆行为。

“费城76人队的服务和团队是业务中最好的,他们在NBA的客户服务中排名第二,而且在这个赛季,帮助球队达到目标的信息差距一直是我坚信的最大资源”Moore说,“我绝对想建立一个有效且有见解的模型。”

“我们不一定要有任何针对该模型的指标或KPI细节”他补充说。相反,我们有组织收入和保留目标。该组织的核心价值之一是“合作双赢”,因此,它不是关于这个分析项目的成功,它是一个有机整体。

在领导团队的全力支持下,该项目根据客户账户的价值和使用,为每个客户经理制定了个性化的攻略。Moore说,这样,销售人员能够更好地理解保留过程的复杂性,他们的客户价值和更新的机会,以便他们能够更好地集中精力。

Moore表示,这种变化立即提高了初始销售的速度和影响力。在第一周,账户更新、座位更新,总收入提高了3%到4%。服务和团队超过了NBA的预测值8%,当前的更新率是所有非季后赛球队中第二名(在下一个非季后赛球队的前19个百分点)。

Moore说:“大家对结果感到兴奋,正如与任何新的流程一样,花了一点时间来解释为什么新的流程是重要的。”“表面上看,系数和回归统计数据似乎并没有帮助季票员更有效地服务,而是花时间来解释信息,允许团队在繁忙季节利用模型里的关键点添加更多策略来安排时间。”

不要放弃

Moore给在筹划分析项目的高管的建议很简单(适用于球场上的76人队):不要因失败而气馁。

“继续尝试”他说。“并不是每个项目都会有一个确定性的鲁棒性模型,但你会从每次迭代中学到一些东西。”

“花时间做功课”Moore补充道。“我偶然发现了许多新的方法或算法,在随后的项目中使用,持续研究和学习。该领域是不断发展,所以我们作为专业人士也一样不断进步。”

北脸:各季客户

加利福尼亚州的服装公司北脸已经建立了一个高知名度的全球品牌,业务产品主要是寒冷的冬季大衣,滑雪夹克和温暖的羊毛衫。这有个缺点:客户每年主要购买一次,春天或夏天买的不多。

此外,虽然客户忠诚,但其客户不一定每年都要回来购买新产品。

“没有回头客,不是因为不满意,而是因为品牌的产品质量过高。”北脸消费者生命周期部高级经理Ian Dewar说。“除了第一次主要购买之外,与客户的持续接触并不强。”

专注于活动

公司意识到要重复业务,就需要超越冬季夹克和羊毛衫市场。要做到这一点,它必须知道客户喜欢的活动和他们使用的其他品牌的产品。

而传统细分则侧重于寻找人们购买最多的产品然后推荐该产品,北脸需要找到客户使用最多的产品类别,而不仅仅是那些他们购买最多的产品。

Dewar说:“我们在2013年开始研究大数据,并推出了一个试点项目作为创新实验。”“我们取得了很好的成绩,于是在2014年推出了第二阶段试点。这两套成果促成了我们将前沿数据分析纳入2016年计划的建议基础。

两次试验都专注于使用交易数据,社交数据和消费行为数据来预测未来的购买行为。Dewar说:“我们与Tibco和SAS合作,将该学习训练纳入我们目前的计划。

从那里起,该公司就有一家咨询公司,汇集了北脸的数据采集团队,以确定公司从其分析计划中获取洞察的机会。

测试和学习

Dewar说:“我们在电子商务、直接面向消费者零售、品牌营销、来源、采购和产品开发方面确定了超过25个的特别机会。“对于2016年,我们建立了想要测试并纳入我们计划的六个关键用例的简短列表。当我们从每个用例中测试和学习时,我们知道我们会有更多的回报。”

在这种情况下,该公司专注于通过忠诚度计划增强终端客户参与度,希望能够将其转化为更高参与度的客户,随着时间推移,在所有零售渠道中能提高销售额。

其忠诚度项目“VIPeak奖励计划”允许会员为消费的每一美元通过参与当地活动 如耐力挑战,山地田径训练,滑雪和单板滑雪比赛甚至运动员的讲座赚取可赎回的“PeakPoints”。数据来源于销售、网络搜索、注册信息、赛事、调查等,使用Tibco的Spotfire和SAS及IBM分析工具等进行分析。该公司通过研究数据来了解客户最感兴趣的体育类型。

丰富的数据

使用过去交易数据的标准RFM模型(recency, frequency and monetary)来分析确定最具潜力的客户,同时,预测分析则考虑到公司销售质量,持久性的户外产品的模型。

“有很多数据可利用”Dewar说。“我们最初以为会花费大量的时间来寻找更多的数据源,即著名的大数据问题,但是我们对已有的交易和行为数据感到惊喜。在我们追求更多的外部数据或扩展到大范围的客户探索计划之前,我们的一个重要课题是最大限度地利用我们已经拥有的数据,并以客户为中心。

Dewar说,北脸的努力换回了跨品类销售额的大幅增长,同一客户会多次购买。 “VIPeak奖励计划”使公司能够建立客户的全方位画像,同时加强客户与品牌互动,增加网络购物次数。

“通过研判客户最有可能购买的主要产品类别,北脸已经能够提高每年的采购率和VIPeak客户的年度购买次数”Dewar说。“此外,高价值忠诚会员学习的经验适用于非会员,用以描绘整个终端消费者群体的前景。”

当被问及给在筹划分析项目的高管建议时,Dewar提供了北脸项目成功的三个关键点:

  1. 在执行项目之前,获得主管和跨职能部门的支持。
  2. 先使用自己的数据,最大限度地利用现有客户数据从而获得更多可能。
  3. 确保数据分析项目与总体业务目标具有相同的KPI绩效,因此,能够跨部门庆祝成功,以及从完整的测试集和训练集中快速获得关键成果。
责任编辑:吴金泽 来源: 36大数据
相关推荐

2017-07-28 10:45:39

数据中心停机

2012-01-12 09:17:59

云计算

2017-03-22 17:57:48

互联网

2009-07-16 18:52:35

刀片服务器数据惠普

2013-07-03 16:30:14

2013-04-03 10:58:15

宽带移动宽带宽带网络

2017-01-19 18:06:51

大数据

2015-12-15 17:36:00

dynatrace

2021-12-22 17:37:55

数据库数据数据中心

2021-05-17 10:20:12

物联网价值企业

2013-05-21 09:47:55

2016-12-16 13:24:24

数据商业价值

2014-05-06 23:37:13

百度大数据引擎

2016-12-29 19:48:01

数据分析大数据Hadoop

2021-04-11 18:09:57

机器学习业务价值人工智能

2015-09-25 13:47:07

物联网商业价值

2023-04-24 21:17:54

大数据数据挖掘

2015-01-13 16:26:05

大数据Informatica

2013-10-21 10:54:05

微软大数据SQL Server

2013-04-15 09:14:50

网络·安全技术周刊

51CTO技术栈公众号