Return to site

在(可靠):揭示您的下一个内容片段的有用数据

· seo优化

2015年9月,“哈佛商业评论”发表了一篇文章,宣称数据是内容营销的下一个重点。到那时,我们Distilled已经制作了至少三年的数据驱动内容:从静态信息图表和调查驱动的公关活动到数据驱动的测验和复杂的互动。

在这篇文章中,我将讨论在哪里可以找到适合您内容的优质数据:从国家统计数据和API到新闻通讯和播客。在我们开始讨论之前,回答一个问题很重要。

为什么首先要获得数据驱动?
出于这样或那样的原因,在Distilled为我们的客户制作和推广内容时,我们很少与他们的商业竞争对手竞争。相反,我们正在与他们的内容竞争者竞争,他们通常是出版商 - 拥有数百名编辑人员的出版商为了赢得他们要求苛刻的观众的关注而拿出故事。

因此,为了让我们的客户获得所需的展示位置和曝光率,我们必须从噪音中脱颖而出,提供比记者所能提出的更具洞察力,有趣和引人注目的东西。一种方法是使用数据。

使用数据讲述故事表明了对真相的渴望。将观点片段留给记者,制作一个数据驱动的片段,可以让你以一种揭示以前未知的东西,重申现有信念或以全新的方式呈现主题的方式来讨论某个特定主题。成功完成上述任务之一,使我们能够为客户提供大量报道,并在世界上一些顶级出版物上展示我们的工作。

那么,你是如何开始的?你从哪里开始的?

数据驱动内容之旅并不总是从数据开始。通常情况下,我开始想要一个让我想到“我们能在X上找到数据吗?”,“有没有可以显示Y的数据吗?”或“我们在哪里可以找到全面的问题”的想法。关于Z的信息?“。当我开始热切地搜索这些问题的答案并寻找数据来证实我的想法时。

首先作为数据记者,然后作为创意主管,我已经这样做了四年了,在这篇文章中,我将告诉你一些我最喜欢的地方,找到我们的想法腿的好数据。

我的首选来源
这些资源免费提供,易于访问,并以易于消化的方式提供大量数据。您需要做的就是互联网连接和电子表格软件。

国家统计
可能最容易获取且因此最常用的数据来源是政府整理的数据。在英国,它是国家统计局,在美国,它是人口普查局,以及本页详述的一组其他统计机构。

两国都在努力使他们的数据在线提供,并开发了非常方便的搜索引擎来找到它:Data.gov.uk和Data.gov。使用这些搜索引擎筛选数据集并不像浏览整齐有序的网站那样简单。但是,如果您知道自己在寻找什么,它可以让您更快地从搜索到数据集。

全球统计
欧盟统计局收集并公布欧盟统计数据,该网站收集您在一个地方和英语中通常在各国国家统计局网站上找到的数据。

对于各种全球统计数据,有像Gapminder,世界银行数据,谷歌公共数据资源管理器这样的网站,可以让您比较各种指标的世界各国。

最后,还有OECD更好的生活指数 - 在住房,教育和福祉方面对世界上35个最发达国家的生活进行了直观比较。其背后的数据可以从FAQ页面下载。

开源
首先,有维基百科。我已经可以听到你的嘲笑 - 谁使用维基百科作为可靠的来源?好吧,我们从不将它作为我们的主要来源,但它是发现其他更可靠来源的好地方。维基百科的优点在于它充满了列表:人员,机场,地点,品牌 - 这些列表可以充当下一段内容的种子数据集。

例如,在我们最近的一篇名为The Payures of the PayPal Mafia的文章中,我们从维基百科上的列表开始,并通过页面参考部分中引用的来源进行了研究。

行业报道
根据您的客户所处的行业,通常会有专业协会或组织进行研究并收集有关行业的数据。

除了特定行业的组织外,像德勤,毕马威和普华永道这样的顶级会计公司以其对一系列行业和市场的广泛研究而闻名。虽然在现成的带有统计数据的电子表格方面不是数据丰富,但它们提供了对一系列行业的可靠洞察,其中包含关键统计数据表,以证实您的内容创建工作。

更高级的资源
这些来源需要更多的努力才能使用:它们要么包含大量的数据集,这些数据集将超过Excel中的行数,要么需要一点技术知识来访问或解析数据。

政府调查
除了生活在国家统计网站上的整齐的电子表格之外,还有更大的数据集,这些数据集是您在ONS和人口普查局等网站上找到的一些核心数据的基础。它们是来自政府定期调查的数据集,这些调查涉及家庭和福祉,就业和就业,收入和收入等问题。

在英国,您可以通过英国数据服务访问这些数据集。不幸的是,因为你需要支付450英镑用于任何商业用途的数据,但如果你的想法取决于数据集,这是值得的。

在美国,它更加开放,您可以免费访问大型政府调查的数据集。

一些最受欢迎的调查包括:

美国社区调查 - 提供有关人的祖先,教育,收入,语言,移民和就业的信息。

目前的人口调查 - 包括就业,收入,工作时间,行业和职业的数据。

美国时间使用调查 - 详细说明美国人在学习,照顾他人,睡觉,工作,锻炼,购物,上下班等方面的时间。

美国新闻出版物使用这些来源制作一些最好的新闻报道,如“ 华尔街日报薪酬差距互动”或“纽约时报”关于中产阶级就业的报道。有数据可供参加。当然,这些数据并不像您在网上找到的简明整理的国家统计电子表格那样易于解析,但是它的见解绝对值得付出努力。

数据存储库
剩下的不多,但有一些值得一提。Freebase长期以来一直是Google知识图谱背后的数据库。它已被关闭,但谷歌在电影,音乐,艺术,人物,地点和事物方面的所有信息仍在那里,所有这些信息都在大量的22Gb下载中。

此列表中的另一位参赛者是Kaggle。Kaggle是数据科学和机器学习竞赛的在线平台,多年来积累了大量数据集,并向公众开放。通过涵盖各种主题,Kaggle可以找到从YCombinator公司到Shark Attacks的所有数据。

蜜蜂
免责声明:在使用之前,请务必检查API的使用条款。有些明确禁止商业用途,这通常意味着未经许可不得使用它们。

您每天使用的大多数Web服务(例如Google,Facebook,Instagram,Spotify)都可以访问通过API支持它们的数据。同样适用于更多主题资源,如RottenTomatoes或Flickr。数据主要用于构建应用程序和与上述服务集成,但它们同样可用于数据挖掘。

迄今为止我们最成功的内容之一,Instagram的Food Capitals,基于我们从Instagram API获得的hashtagged照片的数据。

从API访问数据往往需要一些基本的脚本。其中很多都是XML或JSON的,所以如果你习惯于使用XPath抓取或用JavaScript编写几行代码 - 那就太好了。如果没有,不要担心。Google表格和我们的ImportXML指南可以提供帮助,以及Paul Gambill对ImportJSON的出色表述。不过,Google表格只能帮到你,所以如果你正在考虑进行大规模的数据挖掘,可能值得做或者让某人用Python,Ruby或Javascript为你做这件事。

不太可能的来源
这些不是数据来源,但我仍然觉得有必要与你分享,因为我发现它们在我的日常工作中越来越有用。

简讯
是的,认真的。我相信你已经注意到最近新闻通讯卷土重来了,当然,还有一个像你我这样的数据迷们。Data is Plural是一个邮件列表,每周会向您发送5-6个数据集。您获得的数据集选择非常多样化,例如政变,技术问题,数以百万计的火灾,世界遗产地和文书工作。

您应该考虑订阅的其他简报包括Data Elixir和Data Science Weekly。这些是数据科学新闻简报,在这个新兴领域的更新和新闻中,您偶尔会找到有趣的数据集来探索。

播客
如果你已经进入了播客 - 很棒,这些只是添加到您的收藏夹中的一些。如果你不是,但你是数据 - 你会喜欢这些。现在,显然,您没有从播客中获取数据。但是,如果你听这两个,你可以听到正在使用的酷数据集以及它们的来源。

Data Stories是一个关于数据和数据可视化的播客,由Moritz Stefaner和Enrico Bertini领导 - 这是dataviz世界的两位着名人物。每一集都是对数据记者或dataviz设计师的采访,谈论他们最近的一个项目。他们讨论了它背后的想法,它是如何创建的,以及它们使用了什么数据以及如何使它工作。

Partially Derivative是一个数据科学播客,主持人讨论数据在人类努力的众多领域中的作用:来自艺术,科学,新闻,政治,体育和性。除了听到关于人们如何使用数据来促进我们对世界的理解的迷人故事之外,您还会了解他们使用的数据类型以及他们在哪里找到它

其他信息图表的来源
这感觉有点像作弊,但相信我没关系。如果你不相信毕加索说好的艺术家抄袭和伟大的艺术家偷窃,那么请阅读这本书,关于创造力如何将不同的灵感和信息来源汇集在一起​​。

如果您在Google图片中搜索<topic> + infographic,您会发现很多设计糟糕的信息图表。但是,如果您没有寻找视觉灵感,那么这些可以证明在确定特定主题的可用数据来源方面非常有用。

我们的一些最好的工作受到了我们在网上发现的信息图表的启发,他们发现了他们的消息来源,并制作了大量内容,提供了更好的用户体验,因为这些内容为现有的叙述带来了新的东西。

着名创意的每日例程,我最喜欢的一个,受到这个静态信息图表的启发。我们希望对习惯及其在创造力中的作用做一些内容,并找到了静态的部分,如果还有其他任何东西,我们就会把我们带到可以使我们成为可能的数据源 - 这本名为Daily Rituals的书。

结论
这份清单并非详尽无遗,它仅仅是我多年来积累的资源集合。每次我们开始新的内容时,我都要离开并从头做研究。但是,上面的资源是站点和数据库,我发现自己经常回到这些站点和数据库。

它不是没有电子表格的数据文章,所以这里是一个包含上述所有来源的GS表。

如果我不得不在这个圆桌会议结束时留下一个想法,那就是这个。您的数据集越独特,您的故事就越有可能成为原创。这并不意味着您无法在ONS或人口普查局的统计数据中找到原始故事。但是,如果数据集很容易获得,那么一个敏锐的记者可能已经掌握了这一数据并且可能会对其进行编写。因此,使用不同的来源,将数据集混合在一起并挖掘出见解。

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OK