大数据分析教程

在过去十年中,人们必须处理的数据量激增到难以想象的水平,与此同时,数据存储的价格也系统性地降低。私营公司和研究机构从手机和汽车等设备捕获有关用户交互、业务、社交媒体以及传感器的数 TB 数据。这个时代的挑战是理解这片数据海洋。这就是大数据分析发挥作用的地方。

大数据分析主要涉及从不同来源收集数据,以可供分析师使用的方式对其进行清理,并最终提供对组织业务有用的数据产品。

将从不同来源检索的大量非结构化原始数据转换为对组织有用的数据产品的过程构成了大数据分析的核心。

在本教程中,我们将讨论大数据分析的最基本概念和方法。

读者

本教程是为有志于学习大数据分析基础知识的软件专业人员准备的。一般从事分析的专业人士也可以使用本教程来取得良好的效果。

先决条件

在开始学习本教程之前,我们假设您之前在组织级别处理大量未处理的数据。

通过本教程,我们将开发一个迷你项目,以提供对现实世界问题的了解以及如何使用大数据分析解决它。