立博手机版

【数据分析】三个数据分析成功案例

来源:大发 | 时间:2019-01-07 人气:1110
  •   【数据分析】三个数据分析成功案例很少有行业能比能源行业产生更多的数据了。但多年来,石油巨头壳牌甚至不知道其在世界各地的各种设施中的零件都位于哪里;它不知道什么时候需要再进货;直到部件开始出现故障,它才知道什么时候出现了维护问题。由于机器停机每天给公司造成了数百万美元的损失,于是壳牌决定收集数据以避免这些问题。

      壳牌卓越数据科学中心的总经理Daniel Jeavons表示,壳牌基于多家供应商的软件建立了一个分析平台,运行预测模型,以预测3000多种不同的石油钻井机的部件何时会出现故障。

      其中一个名为Databricks的工具通过Apache Spark来捕获流数据。壳牌使用这个工具来更好地计划什么时候购买机器部件,保存多长时间,以及在哪里存放库存物品。

      该工具托管在微软Azure的云中,帮助壳牌将库存分析从超过48小时减少到不到45分钟,每年减少数百万美元的库存转移和重新分配成本。

      经验总结:避免机器故障需要很多工具。Jeavons表示,壳牌的平台包括了来自Databricks、Alteryx、C3、SAP和其他供应商的软件,所有的这些软件共同帮助了他的数据科学家来产生商业见解。最终,首席信息官必须正确评估这些工具,并在进行大额购买之前了解哪些才是有效的。

      数据是航空报告公司( ARC )的生命线,该公司每年结算航空公司之间价值超过880亿美元的机票交易,包括德尔塔航空公司、美国航空公司、英国航空公司、阿拉斯加航空公司以及Expedia等旅行社。航空公司付费获取ARC在这些交易中收集的数据,以了解更多的关于旅行者的目的地、旅行时间以及在此过程中每年为超过22亿次航班支付的费用的信息。

      ARC捕获数据,将其输入分析引擎,对其进行细化,并为其客户构建定制的报告。ARC 的CIO Dickie Oliver表示,该公司正从Teradata的数据仓库迁移到Snowflake的云软件中,这将帮助ARC更快地将数据产品推向市场,并提供更大的可伸缩性和性能,这得益于其在AWS上的业务。Oliver表示,Snowflake是为了将计算资源与数据存储分开而设计的,它使ARC能够为客户快速构建新的定制报告。Oliver补充说,多亏了这个项目,ARC将能够为考虑新数据形式的客户量身定制新的产品。

      经验总结:迁移到一个新的数据平台通常是令人畏惧的,不仅仅是因为技术的转变;变更管理是其中真正的麻烦所在。Oliver说,让人们“从一开始就专注于改变,并让他们经历改变过程是这个过程中最具挑战性的部分”,他补充说,他正全力培训员工,包括让他们通过认证,并引进顾问,如让Slalom来帮助我们进行变更管理。

      TD银行的数据分析团队花了几年时间来更新数据基础设施,以满足当前和未来的需求,并创建了一个企业Hadoop数据湖。

      TD银行企业信息高级副总裁Joe DosSantos表示,我们使用了基于Cloudera的数据湖用来培养对客户的洞察力,包括从跟踪员工的流失率,到为客户提供合适的产品。

      TD 银行的一个核心关注点包括让业务分析师能够从数据湖中提取数据,可用且可操作的能力,而无需数据科学家来亲自操控。 DosSantos表示:“我们正在让人们广泛使用这些数据集。”他补充道,TD Bank还尝试使用其分析平台来检测欺诈和其他渎职行为。

      经验总结:过去几年来,TD Bank一直在重新构想其企业数据平台,筛选数十年来的客户交易和其他数据。TD银行没有过度依赖Hadoop,而是使用了Talend的软件来提取、转换原始数据并将其加载到可用于可操作商业智能的信息中。

      DosSantos解释道:“Hadoop对于理解如何从A点到B点获取数据方面并不是很好。而Talend有一个元数据管理器和一个中央存储库来跟踪数据湖中的数据移动和转换。”

相关立博手机版信息

    无相关信息
Baidu