Author Archives: admin

链家网全国新房楼盘+二手房小区数据(2021年09月更新)

数据说明:
链家网全国140余城市的新房楼盘数据和二手房小区数据。
新房楼盘数据共27306条。其中:
“楼盘名称” 不为空的共 27306 条,占全部数据的 100.0%;
“楼盘价格” 不为空的共 23068 条,占全部数据的 84.4796015528%;
“规划户数” 不为空的共 26993 条,占全部数据的 98.8537317806%;
“经度, 纬度” 不为空的共 27306 条,占全部数据的 100.0%;

二手房小区数据306000条。其中:
“小区名称” 不为空的共 306000 条,占全部数据的 100.0%;
“均价” 不为空的共 222464 条,占全部数据的 72.7006535948%;
“房屋总数” 不为空的共 306000 条,占全部数据的 100.0%;
“经度, 纬度” 不为空的共 306000 条,占全部数据的 100.0%;

更新时间:
2021年09月30日。

详细字段说明:
(1)新房楼盘数据字段
“省份”, “城市”, “区域位置”, “楼盘名称”, “楼盘别名”, “楼盘价格”, “楼盘状态”, “项目特色”, “预售资格”, “项目地址”, “售楼处地址”, “开发商”, “物业公司”, “最新开盘”, “物业类型”, “楼盘户型”, “交房时间”, “已交房楼栋数”, “容积率”, “产权年限”, “绿化率”, “规划户数”, “物业费用”, “车位情况”, “车位配比”, “供暖方式”, “供水方式”, “供电方式”, “建筑类型”, “嫌恶设施”, “占地面积”, “建筑面积”, “经度”, “纬度”, “URL”

(2)二手房小区数据字段
“省份”, “城市”, “区域位置”, “小区名称”, “均价”, “地址”, “建筑年代”, “建筑类型”, “物业费用”, “物业公司”, “开发商”, “楼栋总数”, “房屋总数”, “附近门店”, “经度”, “纬度”, “URL”

说明:链家网用的地图是百度地图,所以数据中的”经度”, “纬度”数据也是百度地图的坐标数据。【注:百度地图使用的是BD09坐标系。】

示例数据:
(1)新房楼盘示例数据
点击查看在线示例数据
(2)二手房小区示例数据
点击查看在线示例数据

数据格式:
CSV(最通用的数据交换格式)

字符编码:
UTF-8。

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

全国外卖店铺商品/菜品数据1.54亿条

数据说明:
全国各类外卖店铺商品(菜品)数据,共计1.54亿条(准确数字154,808,718),涉及350多万外卖店铺。
其中1.35亿条(准确数字135,837,860)带有月销量数据(“month_saled_content”字段)。

更新时间:
2020年和2021年。

详细字段说明:
“id” – 商品(菜品)ID,唯一;
“shop_id” – 对应的外卖店铺ID(可与店铺基本信息库关联 );
“shop_name” – 店铺名称;
“category” – 商品(菜品)分类;
“name” – 商品(菜品)名称;
“min_price” – 商品(菜品)最低价;
“origin_price” – 商品(菜品)市场价;
“unit” – 单位;
“description” – 描述;
“spec” – 规格;
“real_stock” – 库存;
“month_saled_content” – 月销量(共有1.35亿条有该信息,约占总量87.7%);
“praise_content” – 点赞数;
“promotion_info” – 优惠信息;
“picture” – 商品(菜品)主图;
“updated” – 采集时间;

示例数据:
点击查看全国外卖店铺商品在线示例数据

数据格式:
CSV(最通用的数据交换格式)

字符编码:
UTF-8。

文件大小:
42GB。

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

链家网全国新房楼盘+二手房小区数据(2021年08月更新)

数据说明:
链家网全国130余城市的新房楼盘数据和二手房小区数据。
新房楼盘数据共26645条。其中:
“楼盘名称” 不为空的共 26645 条,占全部数据的 100.0%;
“楼盘价格” 不为空的共 22436 条,占全部数据的 84.2034152749%;
“规划户数” 不为空的共 26327 条,占全部数据的 98.8065303059%;
“经度, 纬度” 不为空的共 26639 条,占全部数据的 99.9774817039%;

二手房小区数据297751条。其中:
“小区名称” 不为空的共 297751 条,占全部数据的 100.0%;
“均价” 不为空的共 211430 条,占全部数据的 71.0089974509%;
“房屋总数” 不为空的共 297751 条,占全部数据的 100.0%;
“经度, 纬度” 不为空的共 297751 条,占全部数据的 100.0%;

更新时间:
2021年08月17日。

详细字段说明:
(1)新房楼盘数据字段
“省份”, “城市”, “区域位置”, “楼盘名称”, “楼盘别名”, “楼盘价格”, “楼盘状态”, “项目特色”, “预售资格”, “项目地址”, “售楼处地址”, “开发商”, “物业公司”, “最新开盘”, “物业类型”, “楼盘户型”, “交房时间”, “已交房楼栋数”, “容积率”, “产权年限”, “绿化率”, “规划户数”, “物业费用”, “车位情况”, “车位配比”, “供暖方式”, “供水方式”, “供电方式”, “建筑类型”, “嫌恶设施”, “占地面积”, “建筑面积”, “经度”, “纬度”, “URL”

(2)二手房小区数据字段
“省份”, “城市”, “区域位置”, “小区名称”, “均价”, “地址”, “建筑年代”, “建筑类型”, “物业费用”, “物业公司”, “开发商”, “楼栋总数”, “房屋总数”, “附近门店”, “经度”, “纬度”, “URL”

说明:链家网用的地图是百度地图,所以数据中的”经度”, “纬度”数据也是百度地图的坐标数据。【注:百度地图使用的是BD09坐标系。】

示例数据:
(1)新房楼盘示例数据
点击查看在线示例数据
(2)二手房小区示例数据
点击查看在线示例数据

数据格式:
CSV(最通用的数据交换格式)

字符编码:
UTF-8。

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

全国各城市地图POI数据8255万条2021年更新

数据说明:
2021年7月完成采集的全国各城市地图POI数据,涉及国内373个城市,23个分类(事件活动、交通设施服务、住宿服务、体育休闲服务、公共设施、公司企业、医疗保健服务、商务住宅、地名地址信息、室内设施、摩托车服务、政府机构及社会团体、汽车服务、汽车维修、汽车销售、生活服务、科教文化服务、购物服务、通行设施、道路附属设施、金融保险服务、风景名胜、餐饮服务),数据总量82,551,807条。

更新时间:
2021年1月到7月。

详细字段说明:
“poiid”(地图ID,唯一)
“name”(poi名称)
“alias”(poi别名)
“address”(地址)
“districtcode”(行政区代码)
“districtname”(行政区名称)
“citycode”(城市代码)
“cityname”(城市名称,点击查看各城市数量统计
“provincecode”(省份代码)
“provincename”(省份名称,点击查看各省份数量统计
“business_area”(商圈)
“telephone”(电话,该字段不为空的数据共计29,322,975条)
“lng”(经度) 【注】坐标系是GCJ02坐标系,也就是俗称的火星坐标系。
“lat”(纬度) 【注】坐标系是GCJ02坐标系,也就是俗称的火星坐标系。
“typecode”(类型代码)
“type”(类型,点击查看各一级分类数量统计
“parent”(父POI的ID)
“brand_title”(品牌名称)
“averagecost”(均价)
“rating”(评分)
“opentime”(营业时间)
“tags”(标签)
“photos”(图片)
“bound”(POI边界,经纬度列表,该字段不为空的数据共计1,690,539条)
“src_url”(收录源)
“src_star”(源评分)
“src_id”(源ID)
“src_score_envi”(源环境评分)
“src_score_service”(源服务评分)
“src_score_taste”(源口味评分)
“src_type”(源平台)
“is_404″(是否已下线,未被标记下线的共计55,616,224条)
“new_poiid”(部分历史POI的ID发生了变化,这是POI的新ID)
“updated”(数据更新时间)

示例数据:
点击查看全国地图POI在线示例数据

数据格式:
CSV(最通用的数据交换格式)

字符编码:
UTF-8。

文件大小:
34GB。

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

[携程网]全国所有城市酒店数据(含房间数)68万家2021年8月份更新完成

数据说明:
携程网全国各城市酒店数据(含开业年份、装修年份、房间数、经纬度、评论数和评分、酒店全部图片、各房型的图片价格等等,详细见下面的字段说明部分),总计酒店基本信息689,472条,酒店图片79,832,406条,酒店房型1,986,214条。
本次采集的数据源是APP,不是PC版网站。

各城市的数量统计:
点击查看各城市数量统计

更新时间:
本次采集结束于2021年8月。

字段说明:
(1) 酒店基本信息(详情)表(ctrip_hotels_details_202108)
“hotel_id” – 酒店ID,与平台一致;
“name” – 酒店中文名称;
“name_en” – 酒店英文名称;
“short_name” – 酒店简称;
“province_id” – 省份ID;
“province” – 所在省份;
“city_id” – 城市ID;
“city” – 所在城市;
“star” – 酒店星级;
“grade” – 酒店类型;
“open_year” – 开业年份(共计有61w条有该信息);
“fitment_year” – 装修年份;
“room_quantity” – 房间数(共计有66w条有该信息);
“zone” – 所属商圈;
“area” – 行政区;
“address” – 地址;
“phones” – 联系电话;
“main_photo” – 酒店主图(URL);
“lng_gd” – 高德经度;
“lat_gd” – 高德纬度;
“lng_bd” – 百度经度;
“lat_bd” – 百度纬度;
“comment_total” – 评论总数;
“total_score” – 总评分;
“health_score” – 卫生健康评分;
“enviromental_score” – 环境评分;
“service_score” – 服务评分;
“facilities_score” – 设施评分;
“features” – 特色标签;
“honor_tags” – 荣誉标签;
“bullet_screen_info” – 视频弹幕信息:
“has_certificate” – 是否有“品质保证”;
“hotel_facilities_popular” – 酒店热门设施;
“hotel_facilities_full” – 酒店设施详细版;
“hotel_policy” – 酒店政策;
“hotel_awards” – 酒店获奖情况;
“images” – 酒店相册图(URL,更多更完整的图片见酒店相册表);
“description” – 酒店介绍;
“traffic” – 周边交通;
“video_url” – 视频介绍文件URL;
“min_price” – 最低房型价格;
“base_rooms” – 基础房型列表;
“updated” – 本条数据采集更新的时间;
“url” – 酒店URL;

(2) 酒店相册表(ctrip_hotels_pictures_202108)
“picture_id” – 图片ID;
“hotel_id” – 酒店ID(用于和酒店基本信息表关联);
“source” – 相册列表;
“category_name” – 图片内容列表;
“picture_title” – 图片标题;
“large_url” – 图片大图或视频URL;
“small_url” – 图片小图或视频封面图URL;
“is_video” – 是否是视频;
“picture_description” – 图片描述;

(3) 酒店基本房型表(ctrip_hotels_base_rooms_202108)
“hotel_id” – 酒店ID(用于和酒店基本信息表关联);
“base_room_id” – 基本房型ID;
“base_room_name” – 基本房型名称;
“min_price” – 房型最低售价;
“base_room_cover_url” – 房型封面图URL;
“images” – 房型相册URL;
“room_facilities” – 房型内设施;

在线示例数据:
(1) 酒店基本信息(详情)示例数据
点击查看携程酒店2021年酒店基本信息在线示例数据

(2) 酒店相册示例数据
点击查看携程酒店2021年酒店相册在线示例数据

(3) 酒店基本房型示例数据
点击查看携程酒店2021年酒店基本房型在线示例数据

数据格式:
CSV(UTF-8编码)。

文件大小:
酒店基本信息表 : 2.1GB;
酒店相册表:19GB;
酒店基本房型表:1.7GB;

按“酒店星级”(star字段)的数量统计:
0星: 261,425家
1星: 7,499家
2星: 345,917家
3星: 49,893家
4星: 19,777家
5星: 4,789家

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

外卖平台全国各品类商家基本信息数据357万(2021年8月版)

数据说明:
外卖全国各品类商户数据,包含全国342个城市(点击查看各城市数量),共计357万条(准确数字:3,572,379条)商户。数据源是某外卖APP。

各分类数据统计如下:
美食 – 2564110条;
超市便利 – 277614条;
浪漫鲜花 – 100290条;
甜蜜蛋糕 – 51940条;
甜点饮品 – 285328条;
送药上门 – 107300条;
生鲜果蔬 – 146522条;
未知 – 39275条;

更新时间:
2021年8月初采集完成。

详细字段说明:
“id” – 店铺ID(APP内的店铺ID,固定不变);
“province” – 省份(根据经纬度反查得到);
“city” – 城市(根据经纬度反查得到);
“name” – 店铺名称;
“score” – 店铺评分;
“comment_number” – 评论数量;
“month_sales” – 月销量(从商户列表页获取,有305家有该信息);
“avg_price” – 人均价格(从商户列表页获取,有144w家有该信息);
“category” – 店铺所属分类;
“image” – 店铺图像 ;
“delivery_time” – 配送耗时;
“delivery_tip” – 配送方式;
“min_price” – 起送价;
“shipping_fee” – 配送费;
“phone” – 商家联系电话(从APP商家TAB获取,有356w家有该信息,注意:有些店铺本身就没公布电话);
“address” – 商家地址(从APP商家TAB获取,有357w家有该信息);
“lat” – 店铺所在位置纬度;
“lng” – 店铺所在位置经度;
“hours” – 营业时间;
“discounts” – 优惠活动;
“tip” – 店铺贴士;
“recommend” – 推荐理由;
“trade_area” – 所属商圈(有146w家有该信息);
“is_online” – 店铺是否仍在线(1 – 仍在营业, 0 – 已下线。总共有236w 家店铺仍在营业,121w家店铺被标记下线。注意:当前下线的店铺后面可能会恢复营业,当前在营业的店铺后面也可能下线);
“menu_categories” – 店铺菜品分类;

示例数据:
点击查看外卖商家基本信息(2021年08月版)在线示例数据

数据格式:
CSV(UTF-8编码)。

数据大小:
约2.36GB。

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

淘宝天猫商品分类/品牌映射表2021年最新更新(根据categoryId查询分类/根据brandId查询品牌)

数据说明:
淘宝天猫商品分类/品牌映射表2021年最新采集,其中包括分类16,296条,分类下的品牌14,725,879条(根据”品牌id+分类id”联合去重,单独按”品牌id”去重是2002,439条)。
如何使用这个数据呢?
例如,如下图所示,是某淘宝商品详情页的HTML源码,可以看到”categoryId”:”1512″和”brandId”:”11813″,经过查表可知分类ID”1512″对应的分类是”手机”,品牌ID”11813″对应的品牌名称是”Huawei/华为”。
淘宝商品categoryid_brandid示例

更新时间:
2021年7月。

详细字段说明:
1. 分类表
“id”(分类ID);
“name”(分类名称);
“path”(分类名称路径,多级分类名称);
“idpath”(ID路径,多级ID);
“group_name”(分组名称);
“spell”(拼音缩写);
“leaf”(是否最末级分类);
“tips”(提示信息);

2. 品牌表
“id”(品牌ID);
“name”(品牌名称);
“cat_id”(所属分类ID);
“cat_name”(所属分类名称);
“cat_path”(分类名称路径);
“cat_group”(分类所属分组);

在线示例数据:
点击查看淘宝商品分类表在线示例数据
点击查看淘宝商品品牌表在线示例数据

数据格式:
CSV(最通用的数据交换格式)。

字符编码:
UTF-8。

文件大小:
分类表:2.65MB;
品牌表:1.62GB;

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

阿里司法拍卖住宅用房数据42.6万

数据说明:
阿里司法拍卖(淘宝司法拍卖)https://sf.taobao.com/,”住宅用房”类型标的物,2019年10月1日-2021年2月28日数据,共计42.6万条。2021年4月份采集。

更新时间:
2021年4月。

详细字段说明:
item_id -url中页面的ID
title – 拍卖物品的标题,包含详细地址等信息
apply_num – 报名人数
notfiy – 设置提醒人数
seer – 围观人数
tags – 包含变卖,贷款,限购,等信息
url – 对应拍品的网页URL
status – 拍卖状态(流拍,结束,进行,撤回,拍卖中止等)
reason, – 拍卖中止/暂缓的原因,
bidding_record, -拍卖完成的竞买记录(包含成交价,用户代码,竞争价格)
start_time – 拍卖开始时间
end_time – 拍卖结束时间
delay_count – 延时次数
image_list – 拍品图片介绍(网页上方小图片)
current_price – 当前价格
ensure_money – 保证金
pre_pay – 变卖预缴款
start_price – 起拍价
value_price – 评估价
bidding_cycle – 竞价周期
add_extent – 加价幅度
priority_bool – 优先购买人(有/无)
priority_user – 优先购买人姓名
delay_cycle – 延时周期
market_price – 市场价
sale_cycle – 变卖周期
bidding_rule – 竞价周期
sale_price – 变卖价
program – 程序
pay_type – 支付方式
pay_deadline – 支付截止时间
location -省市区
auction_address – 详细地址
introduction_pic – 拍品图片介绍
movie_url- 拍品视频介绍链接
seller_nick – 处置单位
connect_people – 联系人
phone – 联系电话
latlong – 经纬度
project_id – 项目id
attaches_introduction -附件(标的物介绍中)
attaches_announcement – 附件(竞买公告中)
manager_name – 拍卖单位
one_one – 一案一户
supervise – 监督单位
introduction_html – 标的物介绍
announcement_html – 竞买公告
notice_html – 竞买须知

在线示例数据:
点击查看阿里司法拍卖住宅用房类型在线示例数据
PS:由于introduction_html、announcement_html和notice_html内容较大,示例数据中将这三个字段移除了。完整数据中是包含的。

数据格式:
CSV(最通用的数据交换格式)。

字符编码:
UTF-8。

文件大小:
CSV数据文件:713MB,解压后21GB。
详情页源码:1.3GB,解压后超过30GB。

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制