
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
第3章 寻找需要的数据:数据分析的基础
3.1 数据分析需要原材料
如果将数据分析比作做菜,那么在明确数据分析目标之后,我们便需要考虑必需的“食材”,也就是数据。
阿里巴巴的数据中台部门开发了一款名为“数据超市”的产品。阿里巴巴的员工可以通过这个平台浏览和申请所需的数据,并在获得批准后使用它们进行分析。此外,其还开发了一款名为“御膳房”的数据处理产品。这些形象的命名体现了阿里巴巴对数据分析的深刻理解。
数据是数据分析的核心,但获取数据并非易事。我们可能会遇到如下难题。
(1)数据尚未被储存。
(2)已知数据被储存,但不清楚存储在哪里。
(3)没有数据访问权限。
(4)数据存储格式存在问题。
(5)数据本身存在错误。
如果未做好应对这些难题的准备,那么当我们在开始数据分析前却意识到并没有可分析的数据时,便会产生挫败感。然而,获取数据本身就是一个复杂的过程,需要运用多种方法和技巧。有时,数据的获取可能占据整个数据分析过程的一半时间。
正是因为数据的获取成本较高,所以当我们确认数据分析目标后,紧接着就要依据目标判断所需要的数据。
但这可不是一件容易的事情,大多数时候数据分析目标和数据之间的关联并不那么明显,特别是对经验不那么丰富的员工而言,经常出现在拿到数据后才发现依据这些数据并不能完成分析目标的情况。
为了解决这个问题,本书列举了常见的数据类型,读者可依据自己的实际工作场景进行索引。