首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

大数据ETL实践探索(9)---- postgresSQL 数据入库使用pandas sqlalchemy 以及多进程

我想了几种办法: 使用psycopg2 原生 api 使用pgAdmin 页面 建立好table 直接导入csv 使用pandas to_sql 方法 使用 sqlalchemy 批量录入方法 使用python...多进程,pandas 数据清洗后用 sqlalchemy 批量录入方法 且听我娓娓道来 ---- 基础性工作 连接类 主要作用是是数据库链接时候进行数据库链接字符串管理 # data_to_database.py...pool_size=2, # 连接池大小 pool_timeout=30, # 池中没有线程最多等待时间,否则报错...具体导入速度待测试 ---- pandas 数据清洗与to_sql方法录入数据 数据清洗 pandas 数据清洗细节可以参考我文章: 大数据ETL实践探索(5)---- 大数据ETL利器之 pandas...) 明细['单位名称'] = 住院明细['单位名称'].apply(pandas_to_postgresql.desensitization_location) to_sql 数据录入 参考文档:to_sql

1.4K30

Python之关系数据库读取、插入、删除

我们可以连接到关系数据库以使用Pandas库分析数据,以及另一个用于实现数据库连接额外库。 这个软件包被命名为sqlalchemy,它提供了在python中使用完整SQL语言功能。...我们首先创建一个数据库引擎,然后使用SQLAlchemy库to_sql函数连接到数据库引擎。 在下面的例子中,我们通过使用已经通过读取csv文件创建数据帧中to_sql函数来创建关系表。...然后使用Pandasread_sql_query函数来执行和捕获来自各种SQL查询结果。...the db engine engine = create_engine('sqlite:///:memory:') # Store the dataframe as a table data.to_sql...('C:/Users/Rasmi/Documents/pydatasci/input.csv') engine = create_engine('sqlite:///:memory:') # Store

95820

使用SQLAlchemy将Pandas DataFrames导出到SQLite

在本教程中,我们还将使用: pandas(项目主页 和源代码),本教程中版本1.1.5 SQLAlchemy (项目主页和 源代码),本教程1.3.20 SQLite(项目首页 和源代码),Python...将DataFrame保存到SQLite 我们将使用SQLAlchemy创建与新SQLite数据库连接,在此示例中,该数据库将存储在名为文件中save_pandas.db。...engine = create_engine('sqlite:///save_pandas.db', echo=True) sqlite_connection = engine.connect() 我们设置...然后to_sql 在save_df对象上调用该方法时使用该变量,这是我们pandas DataFrame,它是原始数据集子集,从原始7320中筛选出89行。...engine = create_engine('sqlite:///save_pandas.db', echo=True) sqlite_connection = engine.connect()

4.7K40

SQLite使用指南! ⛵

图片 创建表接下来我们可以在连接数据库中创建一个表,并将数据插入其中。在创建表之前,我们需要创建一个游标 cursor(用于建立连接以执行 SQL 查询对象),我们将使用它来创建表、插入数据等。...SQLite 只有 5 种数据类型:Null:缺失值INTEGER:没有小数点数字(例如,1、2、3、4)REAL:带小数点数字(例如,6.2、7.6、11.2)TEXT:任何字符数据Blob:二进制数据集合...截止目前完整代码如下:# 导入工具库import sqlite3# 创建连接conn = sqlite3.connect('students.db')# 游标c = conn.cursor() #...图片截止目前为止所有代码如下# 导入工具库import sqlite3# 创建连接conn = sqlite3.connect('students.db')# 游标c = conn.cursor()...,都可以通过上述方式进行查询和交互 SQLite 配合 Pandas 应用SQLite 可以与 PandasDataframe搭配使用。

2.8K92

python访问数据库

一:SQLite 1.1.Sqlite数据库简介   SQLite是一个嵌入式数据库,他数据库是个文件。   SQLite本身是c语音写,所以经常被集成到各种应用程序。   ...1.2使用SQLite数据库 python中内置与mysql交互方法如下: #导入SQLit3 import sqlite3 #连接sqlite3数据库,数据库文件是test.db,如果文件不存在会自动在当前目录中创建...要确保打开Connection对象Cursor对象都正确地被关闭,否则,资源就会泄露。 如何才能确保出错情况下也关闭掉Connection对象Cursor对象呢?...book表是通过外键关联到user表: user_id = Column(String(20), ForeignKey('user.id'))   当我们查询一个User对象时,该对象books...属性返回一个包含若干个Book对象list。

2K30

20个经典函数细说Pandas数据读取与存储

,当然我们还可以采用上面提到另外一种格式 parse_dates={"date_column": {"format": "%d/%m/%y"}}) to_sql()方法 我们来看一下to_sql()...方法,作用是将DataFrame当中数据存放到数据库当中,请看下面的示例代码,我们创建一个基于内存SQLite数据库 from sqlalchemy import create_engine engine...= create_engine('sqlite://', echo=False) 然后我们创建一个用于测试数据集,并且存放到该数据库当中, df = pd.DataFrame({'num': [1...(x) > 4) prefix: 当导入数据没有header时候,可以用来给列名添加前缀 df = pd.read_csv("data.csv", header = None) output...10 1 name2 10 2 name3 20 3 name4 30 当然我们要是想一次性读取多个Sheet当中数据也是可以,最后返回数据是以dict形式返回

3K20

产生和加载数据集

图片 速查表pdf 文本数据读写 python 读取文件常用一种方式是 open()函数,open 里写文件路径,读取后返回一个文件对象,借助 file_obj.read()函数可以调取出文件对象数据...另外一种读取文件方法是利用 with 关键词来打开文件建立对象,打开文件对象会在 with 区块内跳出时关闭文件对象。...逐行读取文件 逐行读取第一种方法是直接通过循环对文件对象进行操作,每次读取出一行行末换行符可通过 restrip()函数删除 第二种方法是直接调用文件对象 readline()方法,该方法将会返回一个字符串组成列表...('读取数组为:\n',loaded_data) csv文件 pandas 读写文本文件时需要借助pandas.read_table()或者pandas.read_csv()函数 pandas.read_table...fp 传到 csv.reader()中(返回可迭代对象)。

2.6K30

python从SQL型数据库读写dataframe型数据

pandasread_sql和to_sql函数就可以很方便得从sql数据库中读写数据。...read_sql 参见pandas.read_sql文档,read_sql主要有如下几个参数: sql: SQL命令字符串 con:连接sql数据库engine,一般可以用SQLalchemy或者pymysql...columns: 要选取列。一般没啥用,因为在sql命令里面一般就指定要选择列了 chunksize:如果提供了一个整数值,那么就会返回一个generator,每次输出行数就是提供大小。...以链接常见mysql数据库为例: import pandas as pd import pymysql import sqlalchemy from sqlalchemy import create_engine...to_sql 参见pandas.to_sql函数,主要有以下几个参数: name: 输出表名 con: 与read_sql中相同 if_exits: 三个模式:fail,若表存在,则不输出;replace

1.8K20

Pandas操作MySQL数据库

Pandas操作MySQL数据库 本文介绍是如何使用Pandas来操作MySQL数据库。...主机ip user 用户名 password 密码 database 数据库 port 端口号 charset 字符集 调用 cursor() 方法即可返回一个新游标对象,在连接没有关闭之前,游标对象可以反复使用...: 8 In [4]: cur 结果表明是个游标对象: Out[4]: In [5]: cur.description 主要返回游标的属性信息...通过游标获取查询结果集特点: 可以获取1条、多条和全部数据 在获取数据时候是按照顺序读取 fetchall函数返回剩下所有行 如果是末尾,则返回空元组; 否则返回一个元组,其元素是每一行记录封装一个元组...读取 使用Pandas自带read_sql函数能够自行读取数据,读取上面创建数据: import pandas as pd from sqlalchemy import create_engine

46610

精品教学案例 | 基于Python3证券之星数据爬取

: url:需要发送Request对象地址 params:(可选)以字典形式传递参数 2.etree.HTML()从字符串中以树结构解析HTML文档,返回解析后根节点。...另一方面是返回结果,lxml中xpath()方法返回对象始终是一个list,处理起来比较尴尬;而BeautifulSoup中方法相对灵活,适合不同场合。 适用场合 这里主要提一下使用禁区。...数据库文件 database 链接,如果数据库成功打开,则返回一个连接对象。...如果提供了该参数,则它必须是一个扩展自sqlite3.Cursor自定义cursor 类。...其中,需要了解参数: name:SQL名字 con:一般为sqlalchemy.engine.Engine或者sqlite3.Connection if_exists:如果表已存在,该如何处置,

2.7K30

python高阶教程-使用数据库(mysql, sqlite, sqlalchemy)

() 方法创建一个游标对象 cursor cursor = db.cursor() # 使用 execute() 方法执行 SQL 查询 cursor.execute("SELECT VERSION...用直接方式使用sqlite sqlite3是python3内置模块,无需安装 连接数据库示例 import sqlite3 conn = sqlite3.connect('test.db') print...和mysql操作逻辑相似 依然要对sqlite3语法有所了解 用sqlalchemy做对象映射 sqlalchemy是一个对象映射库,自动帮我们完成从数据库数据类型到python数据类型对映射,...(bind=engine) 添加记录 # 创建session对象: session = DBSession() # 创建新User对象: new_user = User(id='5', name='Bob...,如果调用all()则返回所有行: user = session.query(User).filter(User.id=='5').one() 参考: sql中文文档 sqlite可视化管理工具汇总 sqlite

1.9K20

python-Python与SQLite数据库-处理SQLite查询结果(二)

使用fetchall()和pandas库获取数据框如果我们想要将查询结果转换为数据框,并使用数据框来处理数据,我们可以使用pandas库。...以下是一个将customers表中所有数据转换为数据框示例:import sqlite3import pandas as pd# Create a connection to the databaseconn...处理结果集元数据查询结果集还包含有关返回结果元数据,例如结果集中包含数量、名称和类型等。我们可以使用description属性访问这些信息。...以下是一个获取customers表中所有行示例,同时还打印出元数据信息:import sqlite3# Create a connection to the databaseconn = sqlite3...然后,我们使用description属性获取查询结果集元数据,并使用循环遍历每个字段并打印其名称和类型。

64920
领券