前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >文件解析中间件,用SQL去读取各种格式的文件! 顶

文件解析中间件,用SQL去读取各种格式的文件! 顶

作者头像
无毁的湖光-Al
发布2018-08-14 11:00:43
4560
发布2018-08-14 11:00:43
举报
文章被收录于专栏:解Bug之路解Bug之路

Rider 文档解析中间件

用SQL解析文件

(1)完全支持MySql协议 (2)完全支持Mybatis-Generator (3)支持Schema和Table (4)支持客户端创建Schema和Table (5)支持常用select语句where,condition,行运算等 (6)支持视图功能,即用旧表的SQL定义新表 (7)支持各种文件格式(各种分隔符分割,Xlsx)

QQ群

608733920

##启动

代码语言:javascript
复制
git clone https://github.com/alchemystar/Rider.git
mvn clean package
cd target && tar zxvf rider.tar.gz
cd ./bin
sh start.sh

配置文件,在./conf中

代码语言:javascript
复制
<database>
    <port>8090</port> <!--server 端口号-->
    <user>pay</user> <!--server 用户名-->
    <pass>123123123</pass> <!--server 密码-->
    <schema>  <!--schema定义-->
        <name>test</name> <!--schema名称-->
         <table>
            <sql> create table if not exists t_view (id BIGINT comment 'id view',nameExtension VARCHAR comment 'name extension')Engine='archer',Charset='gbk'
            </sql>
            <!--这是一个视图表,其表内容为下面的viewSql的执行结果-->
            <viewSql> select a.id*1000,a.name||b.extension,a.id from t_archer as a join t_archer as b where a.id=b.id </viewSql>
        </table>
        <table> <!--表定义-->
            <sql> <!--表定义sql-->
                create table if not exists t_archer( id BIGINT comment 'id test ', name VARCHAR comment 'name
                test',
                extension VARCHAR comment 'extension' )Engine='archer' SEP=',' SKIPWRONG='false' comment='just for test'
            </sql>
            <skipRows>3</skipRows> <!--忽略掉前skipRows行-->
            <pathPattern>/Users/alchemystar/tmp/rider/rider_%d{yyyy-MM-dd}.txt</pathPattern> <!--当前表对应的文件地址,可用时间格式渲染-->
        </table>
    </schema>
</database>

使用

直接连接 mysql -upay -p123123123 -P8090 -h127.0.0.1 jdbc连接 jdbc:mysql://127.0.0.1/test?user=pay&password=MiraCle

创建表

代码语言:javascript
复制
create table if not exists t_archer( 
 id BIGINT comment 'id test ', 
 name VARCHAR comment 'name test',
extension VARCHAR comment 'extension' )
Engine='archer' SEP=',' Charset='gbk' SkipWrong='false'  comment='just for test'

Engine=archer 默认引擎,即默认以换行符和分隔符来组织文件的结构 SEP=',',可以指定当前文件用哪种分隔符来分隔 Charset='gbk',指定当前文件的编码格式 SkipWrong='false' false:文件某一行列数和定义列数不匹配,则报error|true,忽略当前行

配置表对应的文件路径

session内配置:

代码语言:javascript
复制
set table_path="t_archer:/home/work/archer.txt" 

配置文件内配置:

代码语言:javascript
复制
<pathPattern>/Users/alchemystar/tmp/rider/rider_%d{yyyy-MM-dd}.txt</pathPattern> <!--当前表对应的文件地址,可用时间格式渲染-->

视图配置,viewSql可以是任意sql(可以用视图再次创建视图):

代码语言:javascript
复制
 <viewSql> select a.id*1000,a.name||b.extension,a.id from t_archer as a join t_archer as b where a.id=b.id </viewSql>

查询表

(1)支持*符

代码语言:javascript
复制
select * from t_archer; 

(2)支持行运算

代码语言:javascript
复制
select (id+1)*6,name||extesion,extension from t_archer;

(3)支持where condition

代码语言:javascript
复制
select * from t_archer where (id >1 and extension='rider') or (extension='archer')

(4)支持设置字符集

代码语言:javascript
复制
set names gbk;

(5)支持两表join

代码语言:javascript
复制
select a.id,b.id from t_rider as a join t_archer as b on a.id=b.id where id>1;
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017/01/06 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Rider 文档解析中间件
  • 用SQL解析文件
  • QQ群
  • 使用
    • 创建表
      • 配置表对应的文件路径
        • 查询表
        相关产品与服务
        云数据库 SQL Server
        腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档