Author Archives: admin

[携程网]全国所有城市酒店数据(含房型价格,63w条)2020年11月份更新

数据说明:
携程网全国各城市酒店数据(含开业年份、装修年份、房间数、经纬度、各房型价格以及评论数和评分等等,详细见下面的字段说明部分),总计634,643条。和2019年12月份数据相比,新增(收录)了58,440家(根据酒店ID判断)。其中”房间数”不为空的的共有600,727条。
本次采集的数据源是APP,不是PC版网站。

为什么2020年增加了5.8w多家,总数却比2019年12月份版本少呢?
因为2020年有20w家酒店关闭了,对应的链接在携程打开已经无任何信息,例如https://hotels.ctrip.com/hotels/6880222.html。
本数据包中含如下内容:
(1)2020年最新采集的,63w在营业中的酒店。
(2)2020年检测发现20w家已关闭酒店在2019年的对应数据(根据酒店id对应)。

各城市的数量统计:
点击查看各城市数量统计

更新时间:
开始于2020年10月,结束于2020年11月。每条数据的更新时间,详见updated字段。

字段说明:
“hotel_id” – 酒店ID,与平台一致;
“name” – 酒店中文名称;
“name_en” – 酒店英文名称;
“short_name” – 酒店简称(new);
“province_id” – 省份ID(new);
“province” – 所在省份;
“city_id” – 城市ID(new);
“city” – 所在城市;
“star” – 酒店星级(new);
“grade” – 酒店类型;
“open_year” – 开业年份(new);
“fitment_year” – 装修年份(new);
“room_quantity” – 房间数(以前叫room_num);
“zone” – 所属商圈(new);
“area” – 行政区;
“address” – 地址;
“phones” – 联系电话;
“hotel_logo” – 酒店Logo图链接(new);
“lat” – 纬度(百度地图);
“lng” – 经度(百度地图);
“comment_total” – 评论总数;
“total_score” – 总评分;
“health_score” – 卫生健康评分(new);
“enviromental_score” – 环境评分(new);
“service_score” – 服务评分(new);
“facilities_score” – 设施评分(new);
“features” – 特色标签;
“tags” – 其它标签;
“has_certificate” – 是否有“品质保证”(new);
“hotel_facilities_simple” – 酒店设施简版(new);
“hotel_facilities_full” – 酒店设施详细版;
“hotel_policy” – 酒店政策;
“hotel_awards” – 酒店获奖情况(new);
“images” – 酒店相册图;
“description” – 酒店介绍;
“traffic” – 周边交通;
“video_url” – 视频介绍文件URL;
“min_price” – 最低房型价格;
“rooms” – 每种房型价格;
“updated” – 本条数据采集更新的时间;
“url” – 酒店URL;

在线示例数据:
点击查看携程酒店2020年在线示例数据

数据格式:
CSV(UTF-8编码)。

文件大小:
1.96GB。

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

外卖平台全国各品类商家基本信息数据266万(2020年10月版)

数据说明:
外卖全国各品类商户数据,包含全国360个城市(点击查看各城市数量),共计266万条(准确数字:2,663,288 条)商户。数据源是某外卖APP。
本数据自2020年7月中旬开始采集,至2020年10月中旬采集完毕。

各分类数据统计如下:
美食 – 1994183条;
超市便利 – 188569条;
浪漫鲜花 – 59919条;
甜蜜蛋糕 – 40286条;
甜点饮品 – 209426条;
生鲜果蔬 – 105235条;
送药上门 – 49823条;
未知分类 – 15847条;

更新时间:
2020年07月中旬开始采集,到2020年10月中旬采集完成。

详细字段说明:
“id” – 店铺ID(APP内的店铺ID,固定不变);
“province” – 省份(根据经纬度反查得到);
“city” – 城市(根据经纬度反查得到);
“name” – 店铺名称;
“score” – 店铺评分;
“comment_number” – 评论数量;
“month_sales” – 月销量(从商户列表页获取,有205w家有该信息);
“avg_price” – 人均价格(从商户列表页获取,有92w家有该信息);
“category” – 店铺所属分类;
“image” – 店铺图像 ;
“delivery_time” – 配送耗时;
“min_price” – 起送价;
“shipping_fee” – 配送费;
“phone” – 商家联系电话(从APP商家TAB获取,有265w家有该信息,注意:有些店铺本身就没公布电话);
“address” – 商家地址(从APP商家TAB获取,有266w家有该信息);
“lat” – 店铺所在位置纬度;
“lng” – 店铺所在位置经度;
“hours” – 营业时间;
“discounts” – 优惠活动;
“tip” – 店铺贴士;
“recommend” – 推荐理由;
“trade_area” – 所属商圈(有130w家有该信息);
“is_online” – 店铺是否仍在线(1 – 仍在营业, 0 – 已下线。总共有1944973 家店铺仍在营业,718315家店铺被标记下线。注意:当前下线的店铺后面可能会恢复营业,当前在营业的店铺后面也可能下线);
“menu_categories” – 店铺菜品分类;
“updated” – 数据更新时间;

示例数据:
点击查看外卖商家基本信息(2020年10月版)在线示例数据
说明:为了保护个人隐私,示例数据里对联系电话做了脱敏处理。

数据格式:
CSV(UTF-8编码)。

数据大小:
约1.76GB。

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

全国省、市、县级的行政区划边界GeoJSON数据(2020年10月更新)

GeoJSON数据说明:
全国省、市、县级的行政区划边界GeoJSON数据,2020年10月更新。更新中使用到的全国省市区adcode(行政区划编码)共3219个,其中有行政区边界GeoJSON数据的adcode共3089个。一个adcode对应一个.json数据文件。

说明:
(1)这个全国行政区划边界GeoJSON数据,其中的坐标使用的是WGS1984坐标系,即大地地理坐标系、GPS坐标系。
(2)每个adcode对应的GeoJSON数据,只是本级行政区域的边界数据,不包含子区域的边界数据。

更新时间:
2020年10月

索引文件说明:
索引文件是用于映射adcode与对应的geojson文件的索引关系的数据文件,是gbk编码的csv文件。有两种展示方式,说明如下:

(1)行政区划只保留了名称,没有反映省、市、区县级别的归属关系。数据字段如下:
‘adcode’(行政区划编码), ‘name’(行政区划名称), ‘lng’(经度), ‘lat’(纬度), ‘geojson_path’(当前adcode对应的geojson文件的存储路径)

(2)行政区划按省、市、区县三级展示。数据字段如下:
‘adcode’(行政区划编码), ‘province’(省级行政区划名称), ‘city’(市级行政区划名称), ‘county’(区县级行政区划名称), ‘lng’(经度), ‘lat’(纬度), ‘geojson_path’(当前adcode对应的geojson文件的存储路径)

说明:geojson_path字段值为空的,是对应的adcode查询不到边界数据的。这样的adcode在全部的3219个adcode中共有130个。

示例数据:

数据格式:
JSON

字符编码:
GBK。

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

房天下全国新房楼盘+二手房小区数据(2020年09月更新)

数据说明:
房天下(fang.com)全国642个城市的新房楼盘+二手房小区数据,2020-09-03至2020-09-26日更新。数据量共45万多条,其中新房楼盘数据6万多条,二手房小区数据39万多条。

更新时间:
2020-09-03至2020-09-26日更新。

详细字段说明:
新房/二手房数据字段:
“省份”, “城市”, “区县”, “商圈”, “类型”, “小区名称”, “小区地址”, “所属区域”, “邮编”, “项目特色”, “产权描述”, “物业类别”, “竣工时间”, “开发商”, “建筑结构”, “建筑类别”, “建筑面积”, “占地面积”, “楼栋总数”, “总户数”, “绿化率”, “容积率”, “物业费”, “停车位”, “开盘时间”, “交房时间”, “产权最大年限”, “开盘日期”, “交房日期”, “建筑年代”, “小区简介”, “交通状况”, “周边信息”, “经度”, “纬度”, “物业公司”, “价格”, “页面链接”, “地图链接”, “装修情况”, “物业地址”, “环比上月”, “在售均价”, “在售房源”, “在租均价”, “在租房源”, “环线位置”, “总层数”, “层高”, “标准层面积”, “开间面积”, “电梯数量”, “详情页链接”, “新房/二手房”, “newcode”(房天下的小区ID)

说明:
(1)新房楼盘与二手房小区数据存储在一个数据文件里,通过”新房/二手房”字段来区分是新房数据还是二手房数据。
(2)房天下用的地图是百度地图,所以数据中的”经度”、”纬度”字段是百度地图的坐标数据。【注:百度地图使用的是BD09坐标系。】

示例数据:
(1)新房楼盘示例数据
点击查看在线示例数据
(2)二手房小区示例数据
点击查看在线示例数据

数据格式:
CSV(最通用的数据交换格式)

字符编码:
GBK。

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

链家网全国新房楼盘+二手房小区数据(2020年09月更新)

数据说明:
链家网全国130余城市的新房楼盘数据和二手房小区数据。其中,新房楼盘数据27562条,二手房小区数据263202条。

更新时间:
2020年09月24日。

详细字段说明:
(1)新房楼盘数据字段
“省份”, “城市”, “区域位置”, “楼盘名称”, “楼盘别名”, “楼盘价格”, “楼盘状态”, “项目特色”, “预售资格”, “项目地址”, “售楼处地址”, “开发商”, “物业公司”, “最新开盘”, “物业类型”, “楼盘户型”, “交房时间”, “已交房楼栋数”, “容积率”, “产权年限”, “绿化率”, “规划户数”, “物业费用”, “车位情况”, “车位配比”, “供暖方式”, “供水方式”, “供电方式”, “建筑类型”, “嫌恶设施”, “占地面积”, “建筑面积”, “经度”, “纬度”, “URL”

(2)二手房小区数据字段
“省份”, “城市”, “区域位置”, “小区名称”, “均价”, “地址”, “建筑年代”, “建筑类型”, “物业费用”, “物业公司”, “开发商”, “楼栋总数”, “房屋总数”, “附近门店”, “经度”, “纬度”, “URL”

说明:链家网用的地图是百度地图,所以数据中的”经度”, “纬度”数据也是百度地图的坐标数据。【注:百度地图使用的是BD09坐标系。】

示例数据:
(1)新房楼盘示例数据
点击查看在线示例数据
(2)二手房小区示例数据
点击查看在线示例数据

数据格式:
CSV(最通用的数据交换格式)

字符编码:
UTF-8。

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

中国土地市场网“土地供应-结果公告”1998年1月1日-2020年7月31日数据约260万条

数据说明:
中国土地市场网“土地供应-结果公告”1998年1月1日到2020年7月31日数据,共计约260万条(2,597,895)。
包括”项目位置”经纬度数据。
PS:网站本身没有经纬度信息,该经纬度数据(“Lng”,”Lat”)是使用高德地图API根据地址(”行政区”和”项目位置”)查询而来的,部分地址无法查询到经纬度数据,所以部分经纬度信息(“Lng”,”Lat”)是空的。

更新时间:
2020年8月更新。

详细字段说明:
“行政区”,”电子监管号”,”项目名称”,”项目位置”,”面积(公顷)”,”土地用途”,”土地使用年限”,”土地级别”,”土地来源”,”供地方式”,”行业分类”,”成交价格(万元)”,”土地使用权人”,”约定容积率_下限”,”约定容积率_上限”,”约定交地时间”,”约定开工时间”,”约定竣工时间”,”实际开工时间”,”实际竣工时间”,”批准单位”,”合同签订日期”,”分期支付约定”,”URL”,”Lng”,”Lat”

示例数据:
点击查看中国土地市场网“土地供应-结果公告”在线示例数据

数据格式:
CSV(GBK编码)。

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

阿里巴巴1688全国供应商数据2020年更新(共560万)

数据说明:
阿里巴巴(1688.com)供应商库全国数据,本次共采集更新数据超过560万条(5,601,363条)。本次采集的数据源为1688 APP。

更新时间:
2020年6月-8月。

详细字段说明:
“公司名称”,”所在地区”,”经营模式”,”主营产品”,”供应等级”,”联系人”,”联系电话”,”联系地址”,”诚信通年份”,”商品数量”,”满意度”,”交易勋章”,”lng”,”lat”,”认证”,”工商注册信息”,”member_id”,”URL”

在线示例数据:
点击查看1688供应商在线示例数据
PS:为了保护个人隐私,示例数据中的手机号码做了脱敏处理。

数据格式:
CSV(最通用的数据交换格式)。

字符编码:
UTF-8。

文件大小:
2.6GB。

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

房天下全国新房楼盘+二手房小区数据(2020年07月更新)

数据说明:
房天下(fang.com)全国653个城市的新房楼盘+二手房小区数据,2020-07-07至2020-07-31日更新。数据量共43万多条,其中新房楼盘数据6万多条,二手房小区数据36万多条。

更新时间:
2020-07-07至2020-07-31日更新。

详细字段说明:
新房/二手房数据字段:
“省份”, “城市”, “区县”, “商圈”, “类型”, “小区名称”, “小区地址”, “所属区域”, “邮编”, “项目特色”, “产权描述”, “物业类别”, “竣工时间”, “开发商”, “建筑结构”, “建筑类别”, “建筑面积”, “占地面积”, “楼栋总数”, “总户数”, “绿化率”, “容积率”, “物业费”, “停车位”, “开盘时间”, “交房时间”, “产权最大年限”, “开盘日期”, “交房日期”, “建筑年代”, “小区简介”, “交通状况”, “周边信息”, “经度”, “纬度”, “物业公司”, “价格”, “页面链接”, “地图链接”, “装修情况”, “物业地址”, “环比上月”, “在售均价”, “在售房源”, “在租均价”, “在租房源”, “环线位置”, “总层数”, “层高”, “标准层面积”, “开间面积”, “电梯数量”, “详情页链接”, “新房/二手房”, “newcode”(搜房网的小区ID)

说明:
(1)新房楼盘与二手房小区数据存储在一个数据文件里,通过”新房/二手房”字段来区分是新房数据还是二手房数据。
(2)房天下用的地图是百度地图,所以数据中的”经度”、”纬度”字段是百度地图的坐标数据。【注:百度地图使用的是BD09坐标系。】

示例数据:
(1)新房楼盘示例数据
点击查看在线示例数据
(2)二手房小区示例数据
点击查看在线示例数据

数据格式:
CSV(最通用的数据交换格式)

字符编码:
GBK。

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制