Author Archives: admin

NCBI PMC医学论文430万篇(含文章页面完整HTML)

数据说明:
NCBI PubMed Central®是美国国立卫生研究院国家医学图书馆(NIH/NLM)的生物医学和生命科学期刊文献的免费全文档案。本数据采集于2018年8月,共采集到不重复的医学论文数量超过430万篇,包含文章详情页面(例如https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4706274/)的完整HTML存档。

NCBI PMC论文数据统计

采集时间:
2018年08月份。

详细字段说明:
arc_id 文章ID(e.g. PMC4706274 唯一);
title 文章标题(文献名);
published 发布时间(日期);
journal_name 期刊名称(e.g. The AAPS Journal);
doi DOI值;
pmcid PMCID值;
pmid PMID值;
authors 所有作者;
page_saved_path 文章详情页面本地存储路径(完整HTML)相对路径;

示例数据:
点击查看NCBI PMC医学论文在线示例数据

数据格式:
CSV(最通用的数据交换格式)。

字符编码:
UTF-8。

价格:
人民币:¥10000元
美元:$1350
点击下面的链接可直接使用PayPal购买:

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

中原地产网全香港房地产市场数据(含历史成交记录)

数据说明:
中原地产网(中原地產http://hk.centanet.com/)全香港房地产市场资料,含历史成交记录数据。
共计:3.4w条房产,133w条历史成交记录。

采集时间:
2019年08月份。

详细字段说明:
(1)地产基本信息表:
Region-c
Region-e
Property name
Property address
Unit cnt(單位總數)
Blg age(樓齡)
X cnt(每層伙數)
Y cnt(層數)
Tags(分類標籤)
Bldg cnt (物業總數)
Phases(屋苑期數)
School net(所屬校網)
Lat
Lng
CblgCode
CestCode
URL(详情页URL)

(2)历史成交记录表:
Cblgcode(用以和基本信息产生关联)
Cestcode(同上)
CName(房产名称,例如 “曉峰居 3期 A座”)
CX_Axis(例如 “2室”)
CY_Axis(樓層)
NArea(實用)
GArea(建築)
Price(價錢)
Reg year(年份)
Price change(升跌)

示例数据:
点击查看中原地产香港地产基本信息示例数据
点击查看中原地产香港地产历史成交记录示例数据

数据格式:
CSV(最通用的数据交换格式)。

字符编码:
UTF-8。

价格:
人民币:¥3000元
美元:$400
点击下面的链接可直接使用PayPal购买:

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

小红书”留学教育”笔记数据1.7万条

数据说明:
小红书笔记数据,搜索关键词如下:
美国留学
美国高中
澳洲留学
澳洲高中
英国留学
英国高中
欧洲留学
孩子美食
健康美食
家庭教育
素质教育
孩子体育
教学
培训机构
幼升小
小升初
高考
国际学校
学区房
大学生活

共计1.7万条。小红书手机APP的笔记搜索结果只有前1000条可见,由于各关键词出来的结果有重叠,这是根据note_id去重后的结果。

采集时间:
2019年09月份。

详细字段说明:
“note_id” – 小红书笔记ID;
“keyword” – 搜索使用的关键词;
“title” – 小红书笔记标题;
“desc” – 小红书笔记描述;
“images” – 小红书笔记相关图片(链接);
“type” – 小红书笔记类型;
“note_url” – 小红书笔记Web链接;
“likes” – 小红书笔记点赞数;
“user_id” – 小红书作者ID;
“user_nickname” – 小红书作者昵称;
“user_logo” – 小红书作者图像(链接);
“content” – 小红书笔记内容;
“publish_time” – 小红书笔记发布时间;
“comment_number” – 小红书评论总数;
“star_number” – 星数;
“author_note_number” – 小红书作者笔记总数;
“author_fans_number” – 小红书作者粉丝数;
“author_collect_number” – 小红书作者收藏数;
“comment1″ – 小红书笔记第一条评论;
“comment2″ – 小红书笔记第二条评论;
“comment3″ – 小红书笔记第三条评论;

示例数据:
点击查看小红书笔记示例数据

数据格式:
CSV(最通用的数据交换格式)。

字符编码:
UTF-8。

价格:
人民币:¥1500元
美元:$200
点击下面的链接可直接使用PayPal购买:

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

食品药品监督局SFDA网站179万页原始数据

数据说明:
食品药品监督局网站“药品、机械、化妆品、保健食品、互联网服务、药品广告、网上药店”类目下,所有条目对应的列表页(如下图1和图2)和详情页(如下图3)数据,包括“国产药品,进口药品和药品广告”,共计179万页(如下图4),MongoDB格式,数据Zip压缩后约17GB。2018年7月份采集更新。

sfda_list1

sfda_list2

sfda_details

sfda_pages_count

更新时间:
2018年07月份。

数据格式:
MongoDB。

字符编码:
UTF-8。

价格:
人民币:¥5000元(开票加10%税点)
美元:$750
点击下面的链接可直接使用PayPal购买:

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

Yelp.com美国加州(CA)餐馆7.9W条2019年7月更新

数据说明:
Yelp.com美国加州(CA)餐馆数据,共计7.89W条。2019年7月更新。

更新时间:
2019年07月份。

详细字段说明:
business_name – 餐馆名称;
review_count – 评论数量;
categories – 菜品分类;
rating – 店铺评分;
address – 详细地址:
price_range – 价格区间;
lat – 纬度;
lng- 经度;
hours – 营业时间;
health_score – 健康评分;
phone – 电话号码;
claimed – 是否有人认领;
oldest_comment_date – 最早评论日期(按date_asc排序后第一条评论的日期);
url – URL(据此去重);

示例数据:
点击查看yelp.com餐馆示例数据

数据格式:
CSV(最通用的数据交换格式)。

字符编码:
UTF-8。

价格:
人民币:¥4000元(开票加10%税点)
美元:$550
点击下面的链接可直接使用PayPal购买:

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

京东到家全国商户数据约17W条

数据说明:
京东到家(https://daojia.jd.com/html/index.html)全国各城市门店数据,共计17W家。2019年2月份采集。

更新时间:
2019年02月份。

详细字段说明:
“店铺名称”,”门店ID”,”城市”,”门店首图”,”基础运费”,”月售”,”综合评分”,”商家公告”,”商品数量”,”关注人数”,”营业时间”,”门店地址”,”门店电话”,”门店url”,”门店状态”
PS:门店状态为3的表示门店已下线了。

示例数据:
点击查看京东到家店铺示例数据

数据格式:
CSV(最通用的数据交换格式)。

字符编码:
UTF-8。

价格:
人民币:¥3000元(开票加10%税点)
美元:$450
点击下面的链接可直接使用PayPal购买:

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

搜房网(房天下)全国新房楼盘+二手房小区数据2019年05月份更新

数据说明:
搜房网(房天下,fang.com)全国所有城市新房楼盘+二手房小区数据2019年05月份采集更新。
楼盘小区数据共约31万条(如下图所示),其中二手房小区约26万条,新房楼盘约5万条。

更新时间:
2019年05月份。

详细字段说明:
“小区名称”,”城市”,”小区地址”,”项目特色”,”所属区域”,”邮编”,”产权描述”,”物业类别”,”竣工时间”,”开发商”,”建筑结构”,”建筑类别”,”建筑面积”,”占地面积”,”楼栋总数”,”总户数”,”绿化率”,”容积率”,”物业费”,”停车位”,”开盘时间”,”交房时间”,”产权最大年限”,”开盘日期”,”交房日期”,”建筑年代”,”小区简介”,”交通状况”,”周边信息”,”经度”(百度地图),”纬度”(百度地图),”物业公司”,”价格”,”页面链接”,”地图链接”,”区县”,”装修情况”,”物业地址”,”商圈”,”环比上月”,”详情页链接”,”新房/二手房”,”newcode”(搜房网的小区ID),”amap_lng”(高德地图),”amap_lat”(高德地图),”province”(经纬度反查出来的省份),”city”(经纬度反查出来的城市),”district”(经纬度反查出来的区县)

示例数据:
点击查看搜房网(房天下)小区楼盘在线示例数据(201905更新)

数据格式:
CSV(GBK和UTF8编码)。

价格:
人民币:¥4000元
美元:$700
点击下面的链接可直接使用PayPal购买:

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制

多点生活超市全国各城市数据共计177万条(2019年4月更新)

数据说明:
多点生活APP(https://www.dmall.com)全国各城市门店、分类、单品数据,其中单品数据共计177万条。2019年4月份采集。

更新时间:
2019年04月份。

详细字段说明:
1. 店铺表
“Store Id” – 店铺ID;
“Store Name” – 店铺名称;
“Vender Name” – 供应商;
“Lat” – 纬度;
“lng” – 经度;
“city” – 城市;

店铺表示例数据:
点击查看多点超市店铺表示例数据

2. 商品分类表
“Category Id” – 分类ID;
“Category Name” – 分类名称;
“Store Id” – 店铺ID;

商品分类表示例数据:
点击查看多点超市商品分类表示例数据

3. 商品信息表
“Product Id” – 商品ID;
“Sku” – 商品SKU;
“Product Name” – 商品名称;
“Product Price” – 商品价格;
“Category Id” – 分类ID;
“Category Name” – 商品名称;
“Month sales” – 月销量;
“Image” – 商品图片链接;
“Store Id” – 店铺ID;
“Store Name” – 店铺名称;

商品信息表示例数据:
点击查看多点超市商品信息表示例数据

数据格式:
CSV(最通用的数据交换格式)。

字符编码:
UTF-8。

价格:
人民币:¥3000元(开票加10%税点)
美元:$450
点击下面的链接可直接使用PayPal购买:

温馨提示:
如果您发现示例数据无法打开了,请联系在线客服QQ(1649677458或312602670)处理。

这不是我想要的数据,点击申请定制