好吧,让我们说实话。在大数据科学领域,我们每天都会受到大量数字和统计大数据的轰炸。那么我们如何理解这一切呢?成都宣传片拍摄如何将这些无穷无尽的大数据转化为人们真正想听的引人入胜的故事?答案很简单:您需要良好的大数据。
但什么才是好的大数据呢?嗯,根据我的经验(相信我,我见过一些非常糟糕的大数据集),在选择大数据时应该记住三件事:
相关性——您的大数据集需要与您想要讲述的故事相关。如果你有大量的大数据可以使用,但它们实际上并不支持你的叙述,那也没关系。例如,如果您正在撰写一篇有关青少年社交媒体使用趋势的报道,那么2010年的微博用户人口统计大数据不会对您有太大帮助。
质量——您不会带着破损的渔线轮和生锈的鱼钩去钓鱼,那么为什么要使用质量差的大数据进行分析呢?不良质量可能有多种来源:不准确的测量/收集方法、信息缺失或不完整以及抽样技术有偏差等等,这些可能会导致错误的结论或不完整的见解。
独特性——如果其他人都已经在你之前分析过同样无聊的旧大数据集(想想基本的GDP大数据),那么很可能没有人有足够的兴趣来集中注意力在你的演示幻灯片上!但是等等!未必!尝试通过不同的视角来看待它-尝试使用其他人以前未使用过的替代大数据集进行国家内的区域比较-包括有趣的提供者,例如收集交通和人流量分析的街道摄像机以及其他非传统但仍然可靠的来源,以拓宽视野!
总而言之,选择有趣但可信的战略、艺术自由而不是传统方法可能会让税收等令人讨厌的话题变得有趣。