展开

关键词

DBLP数据使用Python解析

但是,基于DBLP数据这些基本的元素,可以挖掘、利用的也是很多。例如官网给出的统计信息,就能引申出很多东西。 http://dblp.uni-trier.de/xml/ dblp原始数据示例 <? > dblp数据建表语句 /* Navicat MySQL Data Transfer Source Server : localmysql Source Server Version <author>Mr.B</author> 此代码修正了上述不足,然后将解析后字段导入数据库 读取数据dblp.xml 2.01G 导入Mysql:170万+ 导入表:visual_dataset.dblp () 对于dblp数据的使用 (待续)

1.5K41

DBLP数据简介及简单用法

前一段时间利用大名鼎鼎的DBLP数据做关于论文合作关系推荐的实验,感觉确实是一个非常不错的数据,可挖掘的东西很多很多,在此对DBLP及其用法做一个简单介绍。 官网发了这篇文章,对DBLP做了详细解释。 另外,DBLP数据开放免费,版权和许可在这。 提供的服务 DBLP的支持团队基于DBLP数据做了很多工作。 提供各种搜索、统计等服务,并提供了API和可下载数据。这里有些有意思的统计数据,并用google chart tool做了可视化处理。 </dblpperson> DBLP可下载数据 下载地址在这 。 其中:dblp.xml是我们需要的数据dblp.dtd是格式说明文件。解析的时候和前者放在一 起。 但是,基于DBLP数据这些基本的元素,可以挖掘、利用的也是很多。例如官网给出的统计信息,就能引申出很多东西。

5.3K60
  • 广告
    关闭

    腾讯云图限时特惠0.99元起

    腾讯云图是一站式数据可视化展示平台,旨在帮助用户快速通过可视化图表展示大量数据,低门槛快速打造出专业大屏数据展示。新用户0.99元起,轻松搞定数据可视化

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    数据 | 图书数据

    下载数据请登录爱数科(www.idatascience.cn) 由电商平台爬取的图书信息,包括书名、出版信息、当前价格等。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 当当网搜索页面爬取。

    27040

    数据 | 鲍鱼数据

    下载数据请登录爱数科(www.idatascience.cn) 通过物理测量预测鲍鱼的年龄。 从原始数据中删除了缺失值的样本,并且对连续值的范围进行了缩放。数据共4177个样本,8个字段 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 Warwick J Nash, Tracy L Sellers, Simon R Talbot, Andrew J Cawthorn and Wes B Ford (1994) "The Population 数据引用 Nash W J, Sellers T L, Talbot S R, et al.

    20240

    数据 | 订购数据

    下载数据请登录爱数科(www.idatascience.cn) 该数据记录了一家全球超市4年的订购数据,包含订单的订单号、下单时间、发货时间、运输模式、顾客名称和地区等信息。 1. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    9530

    数据 | 行星数据

    下载数据请登录爱数科(www.idatascience.cn) 其记录了2014年之前天文学家在恒星(除了太阳)周围发现的行星的信息。 1. 字段描述 2. 数据预览 3. 数据来源 来源于UCI机器学习库。

    9620

    数据 | 小费数据

    下载数据请登录爱数科(www.idatascience.cn) 小费数据 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源

    7820

    数据 | 广告数据

    下载数据请登录爱数科(www.idatascience.cn) 数据由 Jose Portilla 和 Pierian Data 为他的 Udemy 课程(Python 数据科学和机器学习训练营) 创建,适合用于数据分析与逻辑回归预测。 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    12730

    数据 | 苹果股价数据

    下载数据请登录爱数科(www.idatascience.cn) 这个数据涵盖了过去6年苹果公司的股价。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    10330

    数据 | 超市购物数据

    下载数据请登录爱数科(www.idatascience.cn) 人口稠密的城市中超市数量在快速增加,市场竞争也很激烈。 该数据记录了几家超市在3个不同分店中3个月的历史销售额,包含顾客性别、商品单价、销售数量、销售日期、总收入和顾客评价等信息。预测数据分析方法很容易应用于此数据。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    33720

    数据 | 中风预测数据

    数据下载请登录爱数科(www.idatascience.cn) 根据世界卫生组织(WHO)的数据,中风是全球第二大死亡原因,约占总死亡人数的11%。 该数据用于根据输入参数(例如性别,年龄,各种疾病和吸烟状况)预测患者是否可能中风。数据中的每一行都提供有关患者的相关信息。 1. 字段描述 2. 数据预览 3. 字段诊断信息

    19440

    数据 | Udemy课程数据

    下载数据请登录爱数科(www.idatascience.cn) 该数据包含来自Udemy的4个科目(商业金融、平面设计、乐器和网页设计)的3.682条课程记录。 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。 5. 数据引用

    14320

    数据 | 婚姻情况数据

    下载数据请登录爱数科(www.idatascience.cn) 某社会实验内容为男人和女人签约嫁给一个他们以前从未见过的完全陌生的人。专家根据测试和面试对夫妇进行配对。 该数据记录了十次该社会实验的数据。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    7410

    数据 | 药品分类数据

    下载数据请登录爱数科(www.idatascience.cn) 本数据记录了在对患有相同疾病的患者使用五种药物时,患者的个人信息以及对这些药物的反应。您可以使用这个数据进行多分类任务。 1. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle

    12110

    数据 | 水质数据

    下载数据请登录爱数科(www.idatascience.cn) 该数据包含3276个不同水体的水质指标。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    19820

    数据 | 家具订购数据

    下载数据请登录爱数科(www.idatascience.cn) 该数据记录了2010年至2015年美国某公司每周家具产品的订购数量,包括年份、季度、产品名称和订购数量等信息。 1. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    8520

    数据 | 投注策略数据

    下载数据请登录爱数科(www.idatascience.cn) 用于数据分析和机器学习的足球数据库,包括 25,000 场比赛 11个欧洲国家获得领先冠军, 2008 年至 2016 年多达 10 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    6620

    数据 | 深海珊瑚数据

    下载数据请登录爱数科(www.idatascience.cn) 该数据包含由NOAA和NOAA的合作伙伴收集的有关深海珊瑚和海绵的信息。 1. 字段描述 2. 数据预览 3. 数据来源 来源于Kaggle。

    11530

    数据 | 手机定价数据

    下载数据请登录爱数科(www.idatascience.cn) 本数据包含了一系列手机的型号,各种配置信息以及价格信息。您可以利用机器学习等算法来预测一个特定配置手机的售价。 1. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    7820

    数据 | 印度污染数据

    下载数据请登录爱数科(www.idatascience.cn) 数据包含印度各州的污染数据。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    7020

    扫码关注腾讯云开发者

    领取腾讯云代金券