免费数据计划

向大家介绍一项福利 —— 简直免费数据计划。

大约在 2012 年,我还是一名数据研究员,对甲方会以咨询顾问自居,名片上会洋气地印上「数据分析师」。不过做的无非是 SPSS、画图表和写报告。一年多工作下来最大的痛苦是,很难获得大量有用的数据,单靠调查问卷所收集到不足以支撑整个研究项目。

后来老板说,除了问卷的数据(主要是主观的,态度与行为相关的)、还有一个领域是可以通过加码或者爬虫等技术手段去获取更多的数据,于是开始学写程序、了解爬虫。

初学 PHP,练手做了一个叫「围脖图表」的小项目,用来根据微博 ID 批量查询用户信息,然后定期把产生的数据分享到网上。这大概就是我分享数据的开始。

我当时还在知乎上有一个回答,介绍这个小工具。

https://www.zhihu.com/question/20346390/answer/14839433

几年后这个工具已经不在了(都怪微博作大死封锁了很多接口),我的职位从数据分析师变成了产品经理(是呢,十块砖头能砸死九个的产品经理),社交用户的主战场也从微博变成了微信,我的关注点领域也随之改变,自媒体这个行业史无前例地红火了起来,大家对于微信账号和文章数据的需求愈加强烈,所有这些,最后催生了一个新的项目——简直平台。

简直平台提供了一个工具(简直微信助手),能够方便地获取微信公众号的文章数据(包括公众号的文章列表,每篇文章的阅读、点赞、评论、打赏、原创标识、多媒体素材等)。跟四年前的「围脖图表」相近,我将这个工具生产的数据中不涉及隐私的部分发到网上,分享给需要的人使用。

如果你是自媒体运营者,或者数据分析师,或者产品经理,或者创投圈子的金主,你可能会需要它。

不,你肯定会需要它。

简直平台与其他类似的各种榜单产品不同,是一个相对开放的平台。它提供的不是加工后的二手数据,而是直接采集的尽量完整的原始数据。

不仅如此,所有数据还可以导出为 Excel 文件,供需要的人二次处理。做过数据分析的朋友应该清楚,别人处理过、混淆过的二手数据,往往失真严重难以还原,即便能够还原也需要复杂的处理流程。而简直平台不会让数据失真,它会把最原始最全面的数据,原原本本地提供给你。

「简直平台免费数据计划」就是这个平台的产物,我们会分析当下的时事热点和需求热点,制作社交账号或事件的数据专题,免费分享给订阅者。

第一期的内容主要有:

  • 《2016 年 5 月微信文章数据》,csv 格式,随机 1 万条
  • 《2016 年 6 月微信文章数据》,csv 格式,随机 1 万条
  • 《关于雷洋案件的热门评论》,xlsx 格式,2283 条数据,采集自微信公众号文章留言
  • 《热门母婴类微信公众号数据》,csv 格式,50 个热门公众号的近千篇文章数据

欢迎订阅简直平台免费数据,订阅的方法是关注公众号 neineican,发送「免费数据」四个字,在回复的表单中提交自己的邮箱即可。第一期数据将于 6 月初发送到大家邮箱,时间不多订阅请抓紧。