摘要
专业数据分析团队“城市数据团”全新力作,“团支书”结合社会热点,用大数据和数据挖掘分析数据背后的故事。趣味性强,语言幽默,知识丰富,教会读者用大数据做出正确的判断。
数据不说谎 大数据之下的世界 内容简介
这是一本让你“脑洞大开”的图书,让你尝试从大数据角度来解读这个世界,你会发现,有些问题,和你的直觉完全不一样。本书内容分为三部分:第一部分可概括为“脑洞大开”,以淘宝、旅游、餐馆取名等不同的角度切入,说明数据可以用于做许多有趣的事情。第二部分数据与工作,包括了做公务员、二三线城市的衰落、创业等若干热门话题。第三部分数据与生活,包括用数据帮助理解生活现象、用数据挖掘生活中的趣味、以及用数字看房市三个专题。
数据不说谎 大数据之下的世界 目录
第1章 数据,另一种视角 / / 0011.1数据之下的中国 / / 003
1.1.12015年,中国人是怎么花钱的 / / 003
1.1.2游遍全国,我们的假期够吗 / / 017
1.1.3淘宝改变了哪些城市 / / 025
1.2数据之下的城市 / / 35
1.2.1人口疏解,让城市更拥堵 / / 035
1.2.2在上海上班,地铁和开车哪个快 / / 048
1.2.3上海餐馆取名大法 / / 056
第2章 数据之于工作 / / 0672.1学习/就业指南 / / 069
2.1.1好好学习,是另一种童年 / / 069
2.1.2应该去哪里买书呢 / / 077
2.1.3月薪多少才配坐高铁 / / 086
2.1.4哪些公务员最辛苦 / / 095
2.1.5奔赴大城市,还是回家乡 / / 103
2.2在创业的风口上 / / 112
2.2.1一个估值10亿美元的养猪O2O项目 / / 112
2.2.2大鹏猪肉,为红烧而生 / / 121
2.2.3如何在上海开一家靠谱的餐馆 / / 130
2.2.4快捷连锁酒店选址的空间陷阱 / / 140
第3章 数据之于生活 / / 153
3.1理性生活: 那些你所不知道的事 / / 155
3.1.1你的消费水平给上海拖后腿了吗 / / 156
3.1.2如何面对注定平庸的人生 / / 165
3.1.3下雨天外卖会变多吗 / / 175
3.1.4“双12”规避“假折扣”指南 / / 183
3.1.5上海的水源安全吗 / / 189
3.1.6“控制人口”——开给上海的一剂毒药 / / 198
3.2感性生活: 八卦新玩法 / / 212
3.2.1高颜值的人都在哪儿 / / 212
3.2.2中国正在二次元化吗 / / 221
3.2.3如何像白富美一样生活 / / 232
3.2.4长三角城市那些不得不说的八卦 / / 242
3.2.5上海哪所高校的吃货最幸福 / / 249
3.3生活之重: 生为房奴 / / 259
3.3.1上海的房子都被谁买走了 / / 259
3.3.2上海购房攻略 / / 268
3.3.3遥不可及的学区梦 / / 278
3.3.4房地产泡沫有多大 / / 287
附录1:我们是怎么学会玩城市数据的? / / 297
附录2:城市数据团工作方法简介 / / 305
数据不说谎 大数据之下的世界 精彩文摘
第1章
数据,另一种视角你消费吗?旅游吗?上班吗?
你知道别人是怎么消费、怎么旅游、怎么上班的吗?
我们对于世界和城市的认知,往往来源于自己和身边其他人的生活经验。
所以,我们的认知往往是主观化和碎片化的。
但是,当我们拥有了“数据”这个工具的时候,我们就获得了重新认识世界的机会。
1.1数据之下的中国
本节内容主要涉及一个主题:如何脑洞大开地搜集和利用各种数据,以非常规的方式呈现出中国经济发展的三个截面。
数据之下的中国,是一个让你既熟悉又新鲜的中国。
1.1.12015年,中国人是怎么花钱的
在一波接一波的寒潮侵袭之后,期盼已久的春节假期终于到了。同事同学们纷纷放假回家,连亲爱的学姐也不在上海,只留我一个人凄冷地坐在工作台前,独自迎接假期前最难熬的几天。
一个人的时候,总是会想很多。
是的。回首即将逝去的羊年,我感慨万千。虽然不出意外地又(为什么要加一个又字呢)穷困潦倒地度过了漫长的一年,但幸运的是在这期间认识了不少天南海北的朋友。
因此,虽然还在孤独地加班,但我仍然心系着祖国人民,安静地准备完成春节前的最后一项数据工作:
数据不说谎:大数据之下的世界第1章数据,另一种视角0000年度全国消费数据总盘点。
好吧,问题来了——
Q1:2015年,全国人民到底花了多少钱?
2015年全球范围内可使用银联卡商户共3390万家,ATM共200万台,境外共发行银联卡5200万张。
根据刷卡交易统计,2015年全年,全国人民的刷卡交易总金额达到53.9万亿元。
53.9万亿元,是个什么概念呢?
我们可以想象一下:如果把这53.9万亿元全换成100元的人民币钞票,并将其一张一张紧挨着排列起来的话,这些钱大概可以绕地球赤道2100圈;从地球排到太阳的话,可以走一半多一点的路程。
假如这还想象不出来的话,我们可以换个角度来看:
根据国家统计局的数据,2015年,全国GDP总额约为67.7万亿元。也就是说,仅是刷卡消费,全国人民就刷掉了年度国内生产总值的79.6%。
亲爱的,你2015年创造了多少GDP?又刷掉了多少份额呢?
算好了吗?
好的话,我们不妨再来研究一下第二个问题,看看你的消费和全国总体水平相比如何呢?问题来了。
Q2:这53.9万亿元,都是怎么花掉的呢?
首先,让我们来看看这些钱是在什么时间内被花掉的呢?
我们统计了境内日均刷卡的交易金额,并将其细分到每一个小时。2015年日均逐小时交易曲线见图11,银联卡交易类型占比见图12。
图11日均逐小时交易曲线
图122015年银联卡交易类型占比
假如我们把2015年全年浓缩到一天来看的话,可以发现:14:00~15:00和8:00~9:00是全国人民刷卡的高峰时段,分别占全天交易总额的12%与8%。
亲爱的,你的卡是不是在这个时段内被刷爆的呢?
看完了交易时间,我们再来看一下交易的类型。我们将年度刷卡交易总金额分配到交易类型上,如下所述。
(1)从全国尺度上来看,最多的刷卡交易金额发生在批发行业,份额第一,大概可以购买16个阿里巴巴。
(2)份额第二的是金融行业,大概可以购买7个中国工商银行。
(3)份额第三的是零售行业(俗称买买买),大概可以购买5个沃尔玛。
也许你会觉得,这种全国宏观尺度上的消费特征,和个人没什么关系。那么,我们不妨从个人消费者的角度出发,看一下与市民生活关系最大的消费门类吧。
一般而言,各种消费类型中,与市民生活关系最大的应该是衣食住行金融教育六个大类。结果如何呢?
(1)排名第一:金融。毫无悬念。
(2)排名第二:住房。其交易总额大约是金融类的三分之一。
(3)排名第三:旅游。虽然交易总额排名第三,但也不过是住房类的零头而已。
(4)排名第四:衣(衣物类零售)。其总额大约是旅游的三分之一。
(5)排名第五:吃(餐饮)。交易总额与衣物类零售不相伯仲。
(6)排名最后:教育。其交易总额大约是餐饮的70%。没错,这个结果毫不意外、发人深省。
亲爱的,你的消费结构和全国人民相比,究竟怎样呢?
每个人的消费结构自然千奇百怪。
且不说个人,即使从省市的角度上去区分,也可以看到消费结构上的巨大差异。我们来看看:
Q3:全国各省的消费结构有什么样的偏好呢?
我们仍然将数据聚焦在衣物、餐饮、住房、旅游、金融和教育六个大类上。然后将各类消费金额占总消费金额的比例作为消费偏好的核心指标,分配到各省,可以得到以下结果。
(1)衣物类消费偏好前五名省市:云南、浙江、甘肃、山西、湖北。
想必云南四季如春,民族众多,姑娘们想怎么打扮就怎么打扮吧。见图13。
(2)餐饮类消费偏好前五名省市:海南、上海、西藏、宁夏、北京。
吃货集聚在上海、北京,这点毫不意外。但没想到海南、西藏、宁夏等边远地区的吃货能量同样惊人,见图14。
图13各省衣物类消费占比
图14各省餐饮类消费占比(3)住房类消费偏好前五名省市:海南、四川、贵州、北京、安徽。
非常出乎意料的,前三名竟然不是以高房价著称的北上广哦!看来虽然北上广的绝对房价居高不下,但从真实的消费结构上,海南和四川的房价水平也不容小觑。相比北京排名第四,而上海甚至都没有挤进前五,见图15。
图15各省住房类消费占比
(4)旅游类消费偏好前五名省市:西藏、海南、青海、新疆、云南。
从图16可以看到,西部的旅游消费偏好明显高于东部。而排名前五的省市,也都是以旅游胜地著称的地区。
图16各省旅游类消费占比
(5)金融类消费偏好前五名省市:福建、重庆、广东、湖南、上海。
从图17可以看到,我国东南地区在金融类消费偏好中可谓一枝独秀,福建省拔得头筹。排名前五的省市中,上海市已经是最北方的地区了。
图17各省金融类消费占比
(6)教育类消费偏好前五名省市:陕西、四川、北京、海南、湖南。
从图18可以看到,陕西省、四川省在教育类消费上的偏好明显高于全国其他地区。我在想,这些地方的孩子们是不是从幼儿园就开始上补习班了?
图18各省教育类消费占比
说明一下:本书消费数据中没有统计到中国台湾地区的数据,所以地图上台湾地区的颜色与其他省市不同。
看完各省的比较,我们不妨再来聚焦北上广深四个一线城市的情况。
00哪个城市最土豪呢?
从卡均消费金额的平均数来看,
深圳市人民卡均消费金额达到11.7万元,高居首位;广州市以7.6万元居第二位;而上海市以6.4万元的微弱优势战胜北京市的6.3万元,位居第三。
在感叹深圳市人民真土豪的同时,你是不是发现自己又拖后腿了?没关系,我们再来看看中位数,这次数字就变得和谐多了,见图19。
图192015年四大城市卡均消费金额(中位数)(单位:元)深圳市人民卡均消费的中位数金额达到20000元,仍然居首,北京市、上海市以15000元并列第二,而广州市则以11000元收尾。
顺便说一句题外话:从刷卡消费特征上看,四个城市的市民最爱的餐饮品牌也截然不同。
(1)北京市民最爱海底捞,热气腾腾的火锅既热闹又抵御寒气。
(2)上海市民则最爱王品,上海市民依然很小资,对牛排情有独钟。
(3)广州市民最爱百胜(肯德基、必胜客的老东家),原来除了当地特色美食,肯德基、必胜客等西式快餐同样也受市民欢迎。
(4)深圳市民则最爱春满园,经典粤式老牌餐厅还是深深地征服了深圳人民的胃口,让其他外来饮食逊色不少。
以上,我们盘点了全国刷卡总交易、各类型及各省市交易的特征。接下来,我们聚焦进入一个更核心的问题:
Q4:2015年,都是哪些人在花钱呢?
我们以上海为参照吧。
我们选出了常住城市在上海、一年中刷卡交易笔数在20笔以上的银行卡50万张,作为研究的样本。并按照性别、年龄将持卡人分为6组,统计其在零售方面的消费特征。
结论来了:
男性花钱多、老人花钱多。
首先,我们不区分消费类别,计算出各个分组的刷卡交易总金额,得到图110。
图1102015年交易金额的年龄性别分布
从交易总金额来看,各个分组之间的差异并不太明显,但仍然可以看到:
(1)消费最多的是老年男性,其次是中年男性和青年男性;
(2)而在女性组中消费能力最强的中年女性,其消费份额也没能超过男性组中份额最小的青年男性。
这不科学啊!难道女性的花钱能力还不如男性?
我们再计算出每个组别的人均(取中位数,下同)刷卡交易金额,见图111。
图111各组持卡人年均交易金额(单位:元)
没错,无论在哪个年龄组,男性的人均交易金额都比女性要高。
另外,可怕的是,随着年龄的增长,男性会花得越来越多!
本文来自呆到深处自然萌投稿,不代表电子书资源网立场,如若转载,请联系原作者获取。