HI,下午好,新媒云不收取任何费用,公益非盈利机构
24小时服务热线: 4000-162-302
请扫码咨询

新媒易动态

NEWS CENTER

应用哪种统计分析技术?

2021-03-19

您是一家零售公司,想知道您的销售产品,销售地点和时间–记住分析数据的具体问题吗?在上面的示例中,很明显,在设定的时间段内执行的销售量告诉您需求的上升或下降的时间–您可以得到特定的KPI答案。

然后,您可以更深入地了解问题并建立其他销售机会,并找出影响产品总体销售的效果不佳的领域。

现在,让我们继续探讨最重要的数据问题之一-数据源。

03 你的数据,从哪里来?

到目前为止,您已经选择了一些数据分析问题,并且找到了可以衡量它们的评估指标。我们的下一步是确定需要挖掘所有数据的数据源,选择需要的字段,为将来可能需要的数据留出一些空间,并将所有信息收集到一个位置。在此步骤中,对数据源持开放态度–公司中的所有部门,销售,财务,IT等都有潜力提供见解。

如果您觉得大量的数据源使事情看起来很复杂,请不要担心。我们的下一步是“编辑”这些源,并确保它们的数据质量达到标准,这将摆脱其中一些有用的选择。

不过,现在,我们只是在创建草稿。您可以使用CRM数据,Facebook和Google Analytics(分析)之类的数据,公司的财务数据-让您的想象力变得扑朔迷离。利用商业智能软件也很有意义,尤其是由于近年来数据集的数量如此之大,以致电子表格无法再提供获取更高质量数据所需的快速智能解决方案。

哪些比例适用于您的不同数据集?

警告:这是“数据专家”部分。如果您喜欢或对您而言没有太大意义,则可以跳过此部分。您需要注意不同变量的度量水平,因为这会影响您可以在分析中应用的统计技术。

衡量指标基本上有4种类型:


名称:您将数据组织在无法量化或无法排名或比较的非数字类别中。

示例:

  • 不同颜色的衬衫
  • 不同类型的水果
  • 不同类型的音乐

数值–  GraphPad给出了数据的说明:

“您可能会要求患者以1到10的等级来表达他们所感觉到的疼痛程度。7分意味着比5分更多的痛苦,而3分则更大。但是,两者之间的区别是7和5可能与5和3之间的值不同。这些值仅表示顺序。另一个例子是电影分级,从0到5星。”

间隔–数据按顺序分类,并且这些类别之间的距离相等。

直接比较是可以的,可以加减,但是不能对变量进行乘或除。示例:温度额定值。华氏温度和摄氏温度均使用间隔刻度。GraphPad再次提供了一个现成的解释:“ 100度和90度之间的温度差与90度和80度之间的温度差相同。”

比率–具有所有三个早期量表的功能。

像标称刻度一样,它为每个物料都提供了一个类别,物料按顺序刻度进行排序,并且物料之间的距离(间隔)相等,并且含义相同。

使用比例尺,您可以加,减,除,乘……所有您需要用来创建平均值并获得一些有用数据的有趣的东西。例如:身高,体重,收入数字,潜在客户,客户会议。

04 如何确保数据质量?

如前所述,信息来自各种来源,它们可能是好事也可能是坏事。企业中的所有来源都具有提供数据的动机,因此,确定要使用的信息以及信息的来源应该是有关数据分析的首要问题之一。

请记住:您的数据分析问题旨在使您对现实情况有一个清晰的认识,因为这关系到您的企业更有利可图。如果您的数据不正确,您将看到对现实的扭曲看法。

这就是为什么下一步是“清理”数据集以丢弃错误或过时的信息的原因。这也是向数据添加更多字段以使其更完整和有用的适当时间。这可以由数据科学家完成,也可以单独完成,具体取决于公司的规模。

举一个非常生动的例子,一项针对数据科学家的有趣的调查发现:

  • 60%的时间用于组织和清除数据。
  • 19%的时间用于收集数据集。
  • 9%的时间用于挖掘数据以绘制图案。
  • 3%的时间用于训练数据集。
  • 4%的时间用于完善算法。
  • 5%的时间花在其他任务上。

其中有57%的人认为数据清理过程是最无聊,最不愉快的任务。如果您是小型企业主,则可能不需要数据科学家,但是您将需要清理数据并确保适当的信息标准。是的,这很烦人,但是生活中许多非常重要的事情也是如此。

完成以上工作以确保数据质量时,您将自己建立了有用的资产,这些资产可以通过统计方法进行转换,合并和度量,这些数据集准确无误。

05 应用哪种统计分析技术?

您可以使用多种统计分析技术。但是,根据我们的经验,这三种统计技术最广泛地用于业务分析:

回归分析 –统计过程,用于估计变量之间的关系和相关性。

相关推荐