|新一代信息技术 信息基础设施建设 互联网+ 大数据 人工智能 高端信息技术核心产业
|高端制造 航空航天 轨道交通装备 海洋工程装备 新材料
|生物产业 生物医药 生物农业 生物能源
|绿色低碳 清洁能源汽车 新能源 节能技术 环境保护
|数字创意 数创装备 内容创新 设计创新
您的位置:首页 > 其它 > 独家内容
挖掘有价值的数据必须借助分析学 | 悦读
2018-04-10 00:04

  本文首发于2018年4月1日

  《中国战略新兴产业》

  栏目主持:卜文娟


  《成为数据分析师》

  [ 美 ] 托马斯·达文波特

  金镇浩 著

  浙江人民出版社 出版

  湛庐文化·财富汇 图书品牌


  在数据铺天盖地的世界,数据分析变得越来越重要,数据分析正在改变各行各业的运作方式。本书为掌握数据分析技能提供了一条清晰可行的路线图,只要简单的 3 阶段 6 步骤,就能练就数据思维,快速掌握必备技能,懂得如何运用数据分析检视问题、解决问题。

  利用大数据来支撑决策制定

  数据的力量正在各行各业中崛起。如果你热爱运动,那肯定知道《点球成金》这部电影,影片主角奥克兰运动家棒球队总经理比利·比恩利用球员的表现数据和分析学革新了职业棒球运动。现在,这种革新已经延伸到了所有的主流体育项目当中。如果你喜欢玩在线游戏,可能知道星佳和美国艺电,这些社交网络游戏公司正在收集并分析用户所有的游戏行为。那电影呢?你也许知道奈飞可以利用算法预测你可能喜欢的电影,好莱坞的一些制片人会利用算法来推断什么样的电影投资回报率高,美国独立电影公司相对论传媒就是这么做的。

  数据种类各不相同。有的数据因为事务性用途被收集和管理,比如,企业和机构通过跟踪员工上班时间和剩余假期所得的数据。当企业收集到大量数据之后,就希望能读懂这些数据,并在此基础上做出决策。同样地,也可以利用分析学来研究与人力资源相关的事务性数据,企业可能会提出“下一年度有多少员工可能会退休”或者“员工休完所有的假期和其年度绩效考核之间是否存在关联”之类的问题。

  不过,数据和分析学的作用并不局限于完善内部决策的制定。像谷歌、Facebook、亚马逊和 eBay 等许多立足于互联网的企业,都在利用收集网上交易数据所形成的大数据来支撑决策制定以及为客户提供新产品和服务。无论你是想实现更富成效的内部决策,还是想为客户提供更具价值的产品,分析学必不可少,它会对数据进行汇总、分析,并找出其中的含义和内在关联。要读懂并挖掘出数据的价值,必须借助数学或统计分析,简单地说,就是分析学。

  抢先掌握大数据会奠定竞争优势

  一般情况下,我们所说的分析是指,使用大量数据、统计和定量分析、解释和预测模型以及基于事实的管理来推动决策过程与实现价值增生。

  根据分析的方法和目的,分析可以被划分为描述性分析、预测性分析和规范性分析。描述性分析包括数据收集、整理、制表、制图以及描述正要研究的事物的特征,这类分析以往被称为“报告”。描述性分析可能非常有用,但它不能解释某种结果出现的原因或者未来可能会发生的事情。

  预测性分析不仅可以对数据特征和变量(可以假定取值范围的因素)之间的关系进行描述,还可以基于过去的数据预测未来。预测性分析初次会确定变量之间的关联,然后基于这种已知关联预测另一种现象出现的可能性,比如在看到某个广告后,一位消费者可能会去买产品的可能性。虽然预测性分析中的预测是基于变量之间的关联做出的,但这并不代表预测性分析都需要明确因果关系。事实上,准确的预测并不一定需要基于因果关系。

  规范性分析是更高层次的分析,如实验设计和优化等。就像医生会在处方上建议患者采取什么行动一样,实验设计试图通过做实验给出某些事情发生的原因。为了能够在因果关系研究中信心饱满地做出推断,研究人员必须妥善处理一个或多个独立的变量,并有效控制其他无关的变量。如果处于实验环境下的测试组的表现大大优于对照组,决策制定者就应该立即推广这种实验环境。

  优化是规范性分析采用的一种方法,指试图识别出一个特定变量与另一个变量之间理想的关系水平。例如,我们可能会对识别最有可能让产品实现高收益的价格感兴趣。同样地,优化这种方法能够识别出使零售企业最大限度避免缺货情况的库存水平。

  根据分析采用的方法以及收集和分析的数据类型,我们可以将分析分为定性分析和定量分析。定性分析的目的是深入了解某种现象出现的根本原因和诱因。非结构化数据通常是从少数非代表性案例中收集而来,并进行了非统计性的分析。定性分析是分析的最初阶段,它通常是探索性研究的有效工具。定量分析是指通过统计、数学或计算的方法对现象进行系统的实证研究。通常情况下,结构化数据是从大量典型案例中收集而来,并进行统计分析。

  大数据和分析学会改变各行各业的商业职能。任何组织或个人只要抢先一步掌握大数据,就会奠定至关重要的竞争优势,就像在小数据时代占据先机进行数据分析的人能在竞争者中脱颖而出一样。因此,企业和组织机构必须抓住大数据的历史机遇。

  分析性思维有三个主要阶段

  分析性思维的第一阶段,即构建问题。构建问题的目的是确定分析工作要回答什么问题,以及基于这个问题的答案要做出什么样的决策。构建问题是一个非常重要的步骤,因为如果问题是错的,就算收集再多的数据和进行再复杂的分析,你也无法得到正确的结论。构建问题有两个步骤,一个是识别问题,另一个是回顾之前的发现。一旦你认为自己已经认识了某个问题并确定用分析方法来解决它,那你很可能会发现别人已经解决了这个问题的某些方面,而这通常能帮你更好地构建问题。

  分析性思维的第二阶段,你可能会认为这个阶段是分析工作中最重要的阶段,即解决问题的阶段。在这个阶段,需要确定模型中采用的变量,并收集测量这些变量的数据,然后实实在在地进行数据分析。如果你自己不是一位定量分析师,且没打算成为定量分析师,那么大部分工作你可能会和定量分析师一起开展。然而,对于你来说,知道哪部分工作是重要的且熟悉操作过程仍然是非常有用的。虽然你也许无法独立解决问题,你提出的问题和提供的见解会大大有助于定量分析师得出一个更好且更有效的解决方案。

  第三阶段,也就是最后一个阶段,这个阶段和其他两个阶段同等重要,却往往被忽略,即传达结果并基于结果采取行动。你如何传达分析结果是至关重要的,因为这直接关系到这个分析结果是否会导致某种行动。如果一位决策制定者(也许就是你)不理解分析师所做的工作和分析结果代表着什么,那么他就不会乐意基于这个分析结果来制定决策。如果真是这样,那么前面两个阶段的工作你就白做了,还不如不做。我们生活在一个博眼球的时代,因此以一种妙趣横生、能够吸引注意力的方式传达分析结果是非常重要的。你不能以纸上谈兵的方式来展示你的报告,更不要期望任何人会被这样的报告打动,而应基于报告上的内容采取相应行动。

关注微信公众号:

关于我们 | 联系我们 | 广告刊例 | 订阅服务 | 版权声明

地址(Address):北京市西城区广内大街315号信息大厦B座8-13层(8-13 Floor, IT Center B Block, No.315 GuangNei Street, Xicheng District, Beijing, China)

邮编:100053 电话:010-63691650 传真:010-63691514 Post Code:100053 Landline:86-010-63691655 Fax:010-63691514

Copyright 中国战略新兴产业网 京ICP备09051002号-3 技术支持:wicep