首页
学习
活动
专区
工具
TVP
发布

大数据智能实战

大数据与人工智能方向的论文复现、技术探索、工程实践的点滴记录和积累。
专栏作者
256
文章
389573
阅读量
56
订阅数
Ubuntu环境下Neo4j图数据库的安装与测试
neo4j(http://neo4j.com/),号称为The World's Leading Graph Database
sparkexpert
2022-05-07
3460
从Oracle批量导出CSV导入到HIVE中(含去掉引号)
以往很多系统经常用的是oracle数据库,在大数据环境下,许多应用都是去IOE的,那么其中老旧数据的迁移或者测试就是其中一块。
sparkexpert
2022-05-07
1.2K0
HIVE备份之批量导出所有的HIVE建表字段
在HIVE实际工程部署当中,经常会用到一些备份,其中有一项就是如何保存所有HIVE表的建表命令语句。 当HIVE中表格特别多的情况下,如何批量进行存储呢。 针对这个问题,网上没有任何相关的资源。 不过从HIVE本身提供的语句是支持这个,只是需要批量处理。 最基本的两个语句:show tables; show create tables XXX. 于是建立一个SH文件,来实现批量化处理。如下: #!/bin/bash  hive -e "show tables;" > tables.txt sleep(2)
sparkexpert
2018-01-09
1.4K0
Hbase的后缀过滤查询
HBase原生自带了对RowKey的很多种查询策略。通过这个过滤器可以在HBase中的数据的多个维度(行,列,数据版本)上进行对数据的筛选操作,也就是说过滤器最终能够筛选的数据能够细化到具体的一个存储单元格上(由行键,列明,时间戳定位)。 其API中提供的Filter大致如下: CompareFilter 是高层的抽象类,下面我们将看到他的实现类和实现类代表的各种过滤条件 RowFilter,FamliyFilter,QualifierFilter,ValueFilter 行,列组,列,值等的过滤
sparkexpert
2018-01-09
3.6K0
facebook Faiss的基本使用示例(逐步深入)
摘要总结:本文介绍了Faiss库的基本使用示例,包括构造实验数据、为向量集构建索引、进行k-近邻搜索、加快搜索速度、进一步缩小存储空间等方法。
sparkexpert
2018-01-09
3.5K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档