首页
学习
活动
专区
工具
TVP
发布

大数据智能实战

大数据与人工智能方向的论文复现、技术探索、工程实践的点滴记录和积累。
专栏成员
256
文章
410875
阅读量
56
订阅数
批量获取百度地图中的县级以上行政区域的边界数据
最近在做一个演示DEMO的时候,需要省界和市一级界线的数据。以前自己是有这样的SHP数据的,然而现在由于行政区划更新很快,而自己之前下的数据还是2010年版本的国家基础数据。
sparkexpert
2022-05-07
7300
基于spark的网络爬虫实现
爬虫是获取网络大数据的重要手段,爬虫是一种非常成熟的技术了,然而想着在spark环境下测试一下效果.
sparkexpert
2022-05-07
4960
面向大规模社会关系网络数据的层次数据发现
现在随便哪个关系网络的数据规模都非常庞大,如https://snap.stanford.edu/data/上面公开的数据集,动不动都是几万个节点,十几万个边的。
sparkexpert
2022-05-07
2010
Spark Hive在Eclipse代码中直接编译问题
利用Eclipse进行Spark开发过程中,特别是针对Hive开发时,经常会碰到这样一个问题,就是无法找到metastore。而一旦找不到的时候,hive会自动创建一个临时的本地的metastore,其提示INFO信息如下:
sparkexpert
2022-05-07
4810
spark sql 无法访问 hive metastore问题解决
Spark SQL on Hive是Shark的一个分支,是HIVE执行分析引擎的一个重要利器。在Spark 1.5.1的时候,可以非常简单地在spark shell中进行Hive的访问,然而到了Spark 1.5.2时,发现进入Spark Shell的时候,总是出现报错,其原因总是无法访问hive的metastore,从而无法进行各种操作,相当的烦人的。 看了说明,说是要配置hive thrift服务,然而总是报各种失败! 困扰了很多天,终于搞定了。于是在这边将过程写下来。
sparkexpert
2022-05-07
1.1K0
使用Stanford NLP工具实现中文命名实体识别
使用斯坦福大学的分词器,下载地址http://nlp.stanford.edu/software/segmenter.shtml,从上面链接中下载stanford-segmenter-2014-10-26,解压之后,如下图所示
sparkexpert
2022-05-07
1.5K0
AI展示框架(4):基于flask的图像场景识别web程序构建
图像场景识别是DL+计算机视觉处理的入门程序之一,因此在构建AI展示框架的第一步,则是实现基于flask的图像场景识别。
sparkexpert
2019-05-26
1K0
AI展示框架(3):配置eclipse + pydev + flask中的html编辑器
eclipse + pydev并没有默认支持的html编辑器,因此在html页面设置的效率极其低下,因此需要进行配置。
sparkexpert
2019-05-26
8520
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档