本文中有很多图片,建议阅读10分钟。
本文将各省作为边界来计算每个省的推荐菜肴和餐厅品牌,并发现一个可怕的事实,全国各地的人们都喜欢吃蘑菇,还发现许多具有“区域特征”的菜肴。
我长期以来想计算某个组的食物数据。很长一段时间后,我终于编写了一份代码,以捕获全国所有食物数据,共有60万餐厅。
本文以省份为边界来计算每个省的推荐菜肴和餐厅品牌,并发现一个可怕的事实,全国各地的人们都喜欢吃蘑菇(见您);并发现许多具有“区域特征”的菜肴。
快来找到您家乡人们最喜欢的菜肴。
1。统计概述
编辑可视化地图上的60万餐厅,但图片并没有达到我的预期结果。我认为60W数据应该比目前的数据更为壮观,但是从可视化文件来看,餐厅的数量实际上是“很少”的。我分析了原因,大概是因为:
数据中的餐厅被过度集中,导致可视化后的亮点聚集在一起。从地图上,雄甘地地区主要集中在北京,长江三角洲,珍珠河三角洲和成都 - 昌以及尚旺以及地区。
数据的纬度和经度坐标精度不足,这会导致可视化后的大量重叠。我捕获的数据也有可能被中毒。
省维度的统计:
以下两张图是地图可视化和条形图。您会看到,广东省最多的餐厅,约有66,000。
通常,沿海地区的餐馆数量略高,影响因素主要是人口,餐饮业和互联网的普及。由于具有O2O餐饮模型,因此某些地区的商店未在线列出。
城市维度的分析:
以下两张图片是城市维度的可视化。很明显,在第一张照片中,圆圈越大,其含义越多,其中4个都在一流的城市列表中 - 北京,上海,广州和深圳。
当然,毫无疑问,其他两个城市都在名单上,两个以饮食而闻名的城市,不想在来后离开 - 成都和重庆。
祝贺成都赢得了第一名!
2。每个省的餐馆推荐菜肴
让我们看看各地餐馆中流行的菜肴。
首先,让我们看看整体情况。全国各地的餐馆推荐菜肴:
蘑菇的三个大词在眼前。是的,蘑菇排名第一!我真的很好奇为什么,看到您有如此出色的魅力?除此之外,没有区域特征。
让我们首先看北京和上海,因为北京的移民人数很大,而且来自各个地方的人们都有它们,因此这些菜肴相对受欢迎,而且特殊的菜肴并不明显。我对上海的了解不多,但是在北京,大多数餐馆都应该提供酸李子汤,包括辛辣的热锅,Kung Pao鸡肉切丁,烤鸭和烤鱼。我以为这个笑话只在北京可用,但我没想到会在上海提供。由于北京的O2O餐饮非常发达,因此许多餐馆将代金券直接写入推荐的菜肴。
北京:
上海:
让我们看一下沿海地区,福建和广东是最独特的。
福建:从菜肴来看,已经有一些沿海风味。
广东:牛肉球是可以理解的,蘑菇在哪里?茶位是指喝茶的地方吗?要求解释。
看着海岸后,让我们看一下独特的重庆和四川。
重庆:看起来像是锅的气味。是的,火锅需要油盘,牛肚需要新鲜度,火锅需要旧油,红汤锅的底部,无骨的鸡脚,鱼,鹌鹑蛋,鸭肠和辣牛肉一定不能缺少。吃了火锅后,您还需要一些西瓜和一些颤抖的汤。重庆 - 一个红色的城市。
四川:像重庆一样,您需要吃油菜和红糖粘性米饭。
: 是必须的;我以前从未吃过椰子米饭,但我真的很想吃。海南有海鲜的风味。
让我们看看其他省份!
:
:
广西:绿色蔬菜?
瓜苏:纸巾一团糟。
:小蛋糕,非常可爱。
河南:炖面条,冷盘,豆腐皮。
:的人们真的很喜欢吃串,我吃了锅面包和提拉米苏。
湖北:
湖南:匈奴人有点热!
吉林:
江苏:
江西:
骗子:
内蒙古:确实有很多蛋糕店!还有牛肉和羊肉!
:
青海:
山东:
:
:
天津:这也是代金券的节奏。
西藏:我真的很想吃藏族火锅。
新疆:
云南:马铃薯很友善,实际上意味着土豆。
:
3。在各个省份占主导屏幕的统计数据
让我们首先看一下国家概述:连锁店在屏幕上占主导地位。老实说,我真的不知道鸡肉牛排〜
有一个预感,将来,所有省份都将由鸡肉牛排和肯德基主导,当然会有例外。
以北京,上海和广州为例。北京,上海和广东的外国人人数相对较大,他们吃的食物应该是“大杂货店”,但仍然可以看到这些特征。
北京:北京的 到处都可以看到,编辑还多次吃掉了它,包括金芬·钦奇安格,虾锅,和 ,它们都在帝国资本中的人民红色商店周围。
还有 ,这只是编辑订购外卖的一家特殊餐厅。奇怪的是,在北京,新的鸡排不在清单上。
上海:鸡排是最好的,有很多牛奶茶店,有很多甜点。
广东:鸡肉牛排,肯德基和华莱士都在列表中,当然,各种茶都是必不可少的。我觉得广东人民的生活非常精致。
让我们看一下独特的重庆和四川:
重庆:酸奶牛和一口酸奶?我从未听说过,请解释。
四川:它仍然是一头酸奶牛。也许重庆和四川的人们刚刚完成了他们的火锅,想喝点牛奶来润湿喉咙。
钢管工厂区5 Gan ,一种熟悉的感觉。
: Daos在名单上,编辑也是一个醉酒的并吃了红色香肠的人。
:这很有趣。辛辣怪兽鸭和辣鸭之间有什么关系?
让我们看一下福建和海南。
福建:什么是?感觉非常本地化。
海南:椰子鸡好吃吗?编辑还看到了重庆的刘 ,哈哈。
:
:的结果非常有趣,并且商店名称非常独特。
广西:
:
:
河南:
湖北:
匈奴:哪个餐厅在上一篇文章中出售辣椒炸猪肉?你为什么不能告诉它?
江苏:
江西:
骗子:
内蒙古:
:检查后,是一家蛋糕店。
青海:
山东:说实话,重庆鸡肉锅不是重庆菜,而是一个名叫张重庆的人发明的,重庆是这样的。
:
:
天津:
西藏:
新疆:
云南:
:
四。
以下是技术实施说明:
1。数据刮擦
还使用了此数据爬网。
难度1:在分析阶段,如果要获取整个国家数据,则必须将块用作单位。主要原因是每个列表页面默认情况下仅显示30页,每个页面约有20个消息。如果我们从城市的维度爬上它,则相当于每个城市只能从商店中获得多达600条消息。
那么,爬行的爬行意味着什么?
例如:
北京 - 哈迪安地区 - 苏朗尤寿
对应于:
市政级行政单位界
编辑已经找到了许多繁华的街区,每个街区的商店清单不超过30页,这确保我们可以获取全部数据。
难度2:列表页面只能获取商店的基本信息,并且还需要爬网的详细信息页面,总计超过60万页。 IP禁令非常强大,并且有足够的IP和代理随机算法。
2。可视化
这种可视化与往常一样。
特定的实现和相关的代码编辑器已记录了一个视频,以在文章“开源代码 - 微信朋友分析”中解释。有兴趣的朋友可以参考该文章,使用的技术是相同的。
唯一的区别是,无法实现此处600,000家餐厅的完整可视化。因为原理是使用HTML的生成和文件将数据直接写入HTML文本,并且一代后,它将具有数百个MB的大小,这会导致浏览器在打开时崩溃,因此在这里,我在这里使用JSON数据文件的本机读取来实现它。
版权声明:本文为 “博览广文网” 原创文章,转载请附上原文出处链接及本声明;
工作时间:8:00-18:00
客服电话
0755-88186625
电子邮件
admin@lanyu.com
扫码二维码
获取最新动态