数据分析方法(Data analytics )是专注从数据中提取见解的学科,包括数据分析、收集、组织和存储数据,以及执行此操作的工具和技术。业务分析是数据分析方法的子集,Gartner 将业务分析定义为“用于构建分析模型和模拟动态以创建场景、了解现实和预测未来状态的解决方案”。
来源:THINKSTOCK
一、什么是数据分析方法(Data analytics )?
数据分析方法是一门专注于从数据中提取见解或洞察的学科。它包括数据分析和管理的过程、工具和技术,包括数据的收集、组织和存储。数据分析方法的主要目的是应用统计分析和技术来充分开发利用数据资源,以发现趋势并解决问题。数据分析在企业中变得越来越重要,因为它是分析和塑造业务流程以及改进决策和业务成果的一种手段。
数据分析从一系列学科(包括计算机编程、数学和统计学)中汲取灵感,对数据进行分析,以描述、预测和提高性能。为了确保可靠的分析,数据分析团队利用一系列数据管理技术,包括数据挖掘、数据清理、数据转换、数据建模等。
二、数据分析方法的四种类型是什么?
分析方法大致分为四种类型:描述性分析,试图描述特定时间发生的事情;诊断分析,评估事情发生的原因;预测分析,确定未来发生某事的可能性;以及规范性分析,它提供了为实现预期结果而采取的建议行动。
为了更具体地探讨这些情况,描述性分析使用来自多个来源的历史和当前数据,通过识别趋势和模式来描述当前状态或指定的历史状态。在商业分析中,这是商业智能(BI) 的职权范围。诊断分析使用数据(通常通过描述性分析生成)来发现过去表现的因素或原因。预测分析将统计建模、预测和机器学习 (ML) 等技术应用于描述性和诊断性分析的输出,以预测未来结果。预测分析通常被认为是一种“高级分析”,并且通常依赖于 ML 和/或深度学习。规范性分析也是一种高级分析,涉及应用测试和其他技术来推荐将提供预期结果的特定解决方案。在业务中,预测分析使用 ML、业务规则和算法。
三、数据分析方法和技术
数据分析师使用多种方法和技术来分析数据。根据CareerFoundry的执行编辑Emily Stevens的说法,最受欢迎的七个包括:
(一)回归分析:一组统计过程,用于估计变量之间的关系,以确定一个或多个变量的变化如何影响另一个变量,例如,社交媒体的预算投入如何影响销售。
(二)蒙特卡罗模拟:一种经常用于风险分析的数学技术,它依靠重复随机抽样来确定事件的各种结果的概率,避免由于输入的不确定性程度而无法轻易预测。
(三)影响因子分析:一种统计方法,用于获取大量数据集并将其简化为更小、更易于管理的数据集,以发现隐藏的模式,例如,用于分析客户忠诚度。
(四)队列分析:一种分析形式,其中将数据集分解为具有共同特征的组或队列进行分析,例如,了解客户细分。
(五)聚类分析:一种统计方法,其中项目被分类并组织成称为聚类的组,以揭示数据中的结构;例如,保险公司可能会使用聚类分析来调查某些位置与特定保险索赔相关的原因。
(六)时间序列分析:一种统计技术,通过分析设定时间段或间隔内的数据,以确定一段时间内的趋势,例如每周销售数字或季度销售预测。
(七)情绪分析:一种使用自然语言处理、文本分析、计算语言学和其他工具来理解数据中表达的情绪的技术,例如客户根据客户论坛中的响应对品牌或产品的感受。前六种方法旨在分析定量数据(可以测量的数据),而情感分析则试图通过将定性数据全部组织成主题来解释和分类定性数据。
四、数据分析工具
数据分析师使用一系列工具来帮助他们从数据中获取见解。一些最受欢迎的包括:
(一)Apache Spark:一个开源的数据科学平台,用于处理大数据并创建集群计算引擎
(二)Domo分析: 用于收集和转换数据的 BI SaaS 平台
(三)Excel:Microsoft用于数学分析和表格报告的电子表格软件
(四)Klipfolio:基于云的Web 应用程序,用于自助式 BI 和报告
(五)Looker:Google的数据分析和 BI 平台
(六)Power BI:Microsoft的数据可视化和分析工具,用于创建和分发报表和仪表板
(七)Python:一种深受数据科学家欢迎的开源编程语言,用于提取、汇总和可视化数据
(八)Qlik:一套用于探索数据和创建数据可视化的工具
(九)QuickSight:Amazon的一项分析服务,旨在与云数据源集成
(十)R:用于统计分析和图形建模的开源数据分析工具(An open-source data analytics tool for statistical analysis and graphical modeling)
(十五)RapidMiner:包含可视化工作流设计器的数据科学平台
(十六)SAP Analytics Cloud: 基于云的分析和规划解决方案
(十七)SAS公司:用于商业智能和数据挖掘的分析平台
(十八)Sisense:流行的自助式BI 平台
(十九)Tableau:Salesforce的数据分析软件,用于创建数据仪表板和可视化
(二十)Talend塔伦德:数据工程师、数据架构师、分析师和开发人员使用的ETL 工具
(二十一)Zoho分析:自助式 BI 和数据分析平台
五、数据分析方法与数据科学(Data analytics vs. data science)
数据分析方法是数据科学的一个组成部分,用于了解组织的数据是什么样子的。通常,数据分析方法的输出是报告和可视化。数据科学利用数据分析方法的输出来研究和解决问题。
数据分析方法和数据科学之间的区别通常在于时间尺度。数据分析方法描述了现实的当前或历史状态,而数据科学则使用该数据来预测和/或理解未来。
六、数据分析方法与数据分析技术(Data analytics vs. data analysis)
虽然数据分析方法和数据分析技术这两个术语经常互换使用(福建CIO网注:道与术的关系),但数据分析技术是数据分析方法论的一个子集,涉及检查、清理、转换和建模数据以得出结论。数据分析方法包括用于执行数据分析的工具、技术与方法。
七、数据分析方法与业务分析
业务分析是数据分析方法的另一个子集。它使用数据分析技术,包括数据挖掘、统计分析和预测建模,来推动更好的业务决策。Gartner 将业务分析定义为“用于构建分析模型和模拟动态以创建场景、了解现实和预测未来状态的解决方案”。
八、数据分析方法的示例
各行各业的组织都利用数据分析来改善运营、增加收入并促进数字化转型。这里有三个例子:
(一)费森尤斯医疗通过预测分析预测并发症:费森尤斯医疗公司专门提供肾透析服务,率先使用近乎实时的物联网数据和临床数据来预测肾透析患者何时可能遭受可能危及生命的并发症,称为透析中低血压(IDH)。
(二)UPS通过预测分析提供弹性和灵活性:跨国运输公司 UPS 创建了统一企业分析工具 (HEAT),以帮助其捕获和分析客户数据、运营数据和计划数据,以跟踪每个包裹在其网络中移动时的实时状态。该工具帮助它跟踪每天交付的大约 2100 万个包裹。
(三)预测分析帮助Owens Corning 开发涡轮叶片:制造商欧文斯·康宁(Owens Corning)在其卓越分析中心的帮助下,使用预测分析来简化测试用于制造风力涡轮机叶片玻璃织物的粘合剂的过程。预测分析帮助该公司将任何给定新材料的测试时间从 10 天缩短到大约 2 小时。
九、数据分析岗位的工资
根据PayScale 的数据,数据分析师的平均年薪为 66,310 美元,据报道的工资范围为 48,000 美元至 91,000 美元。类似职位的薪资数据包括:
职称 薪资范围 平均工资
分析经理 澳元 $74,000 - $136,000 104,540美元
业务分析师 $50,000 至 $88,000 66,898美元
IT业务分析师 澳元 $54,000 - $104,000 73,893美元
数据分析师 澳元 $48,000 - $91,000 66,310美元
市场研究分析师 澳元 $44,000 至 $80,000 59,103美元
运筹学分析师 澳元 $51,000 - $120,000 82,833美元
定量分析师 澳元 $65,000 - $142,000 92,089美元
高级业务分析师 澳元 $67,000 - $121,000 89,595美元
统计员 澳元 $59,000 - $126,000 86,349美元
PayScale还确定了数据分析师的薪水高于全国平均水平的城市。其中包括旧金山(30.8%)、纽约(10.7%)和华盛顿(10%)。