当我们需要分享数据或制作演示时,保障数据的安全性是至关重要的。以下是如何通过构造一个员工晋升数据集来演示数据集虚构的技巧的详细说明。
在 Tableau 可视化进阶的分享中,就是利用该虚构的晋升记录数据集搭建的演示看板。
为了保障数据集看上去更贴近真实情况,以下是我们假定该数据集应该具备的一些基本要求
数据集构造过程中模拟的参数依常识设定,请勿作为真实数据和结论参考。如有雷同,纯属巧合。
初始化和基础结构构造
首先,我们初始化Faker库来生成随机的员工姓名,并定义了数据集的基础结构:
分配员工到不同的业务、部门、岗位和人才来源
我们使用Numpy的随机选择功能来根据指定的比例将员工分配到不同的业务和岗位中:
分配晋升前级别并计算停留时长
接下来,我们根据预设的比例分配员工的晋升前级别,并计算他们在当前级别的停留时长:
判断提名条件和晋升结果
最后,我们根据员工的停留时长和级别来判断他们是否符合提名条件,是否被提名,以及是否晋升成功,并据此更新他们的级别:
通过以上步骤,我们成功构造了一个虚拟的员工晋升数据集,不仅涵盖了员工的基本信息,还模拟了他们的晋升路径。