专栏首页新码农博客Python:读写csv文件

Python:读写csv文件

1、读文件

import csv

csv_reader = csv.reader(open("data.file", encoding="utf-8"))
for row in csv_reader:
    print(row)

csv_reader把每一行数据转化成了一个list,list中每个元素是一个字符串。

2、写文件

读文件时,我们把csv文件读入列表中,写文件时会把列表中的元素写入到csv文件中。

list = ["1", "2", "3", "4"]
out = open(outfile, "w")
csv_writer = csv.writer(out)
csv_writer.writerow(list)

可能遇到的问题:直接使用这种写法会导致文件每一行后面会多一个空行。

解决办法如下:

out = open(outfile, "w", newline="")
csv_writer = csv.writer(out, dialect="excel")
csv_writer.writerow(list)

在stackoverflow上找到了比较经典的解释,原来 python3里面对 str和bytes类型做了严格的区分,不像python2里面某些函数里可以混用。所以用python3来写wirterow时,打开文件不要用wb模式,只需要使用w模式,然后带上newline=''。

3、示例

  • 简单读写
import csv


class writer:
    def __init__(self):
        self.dict = {
            "标题": "标题",
            "链接": "链接",
            "服务": "服务",
            "dsr": "dsr",
            "店铺名": "店铺名",
            "价格": "店铺名",
            "付款人数": "付款人数",
            "发货地": "发货地",
        }
        out = open("outfile.csv", "w", newline="")
        self.csv_writer = csv.writer(out, dialect="excel")
        self.csv_writer.writerow(self.dict)

    def writer_to(self, key_value):
        self.csv_writer.writerow(key_value)


if __name__ == "__main__":
    a = writer()
    new = {
        "链接": "http://www.baidu.com",
        "标题": "我是标题",
    }
    a.dict.update(new)
    print(a.dict)
    a.writer_to(a.dict.values())
  • 结合爬虫
import csv
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import TimeoutException, NoSuchElementException
from selenium.webdriver.common.action_chains import ActionChains

driver = ["1", "2"]
colspan = ["1", "2"]
try:
    out = open("类目.csv", "w", newline="")
except PermissionError:
    print("文件被其他程序占用")
    input("")
csv_writer = csv.writer(out, dialect="excel")
csv_writer.writerow(["宝贝ID", "类目"])


def open_chrome():
    driver[0] = webdriver.Chrome()
    driver[0].get("https://www.dianchacha.com")
    input("请登陆后按回车:")


def EC_located(one_group, value):
    """
     目的:简化代码长度,参数1选择one或者group切换选中模式
    :param value:要找的值【CSS选择器】
    :return:选择到的对象
    """
    wait = WebDriverWait(driver[0], 10)
    if one_group == "one":
        try:
            ecl = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, value)))
            return ecl
        except TimeoutException:
            print(value, "1元素未加载成功,等待超时")
    else:
        try:
            ecl = wait.until(
                EC.presence_of_all_elements_located((By.CSS_SELECTOR, value))
            )
            return ecl
        except TimeoutException:
            print(value, "1元素---组---未加载成功,等待超时")


def operating(ID):
    # 先获取ID输入框
    driver[0].get("https://www.dianchacha.com/item/info/index/iid/" + ID)
    html = driver[0].page_source
    if "未能找到亲的宝贝" not in html:
        colspans = EC_located("group", ".colspan-1")
        colspan[0] = str(colspans[1].text).replace("宝贝类目: ", "")
    else:
        return operating(ID)
    print(colspan)


def writer_txt():
    csv_writer.writerow([url[0], colspan[0]])
    print("保存", url[0], colspan[0], "成功")


url = ["0", "1"]


def main():
    open_chrome()
    file = "宝贝ID.txt"
    with open(file) as f:
        for line in f.readlines():
            url[0] = line
            print(line)
            operating(url[0])
            writer_txt()
        out.close()
        print("已完成")


if __name__ == "__main__":
    main()

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • MySQL创建视图

    视图定义中引用的表或视图必须存在。但是,创建完视图后,可以删除定义引用的表或视图。可使用 CHECK TABLE 语句检查视图定义是否存在这类问题。

    弄啥嘞
  • Python:输出带颜色的字

    转义序列是以ESC开头,即用\033来完成(ESC的ASCII码用十进制表示是27,用八进制表示就是033)。

    弄啥嘞
  • Kali:Aircrack破解无线网络详解

        出现信息(WPA handshake)密码信息抓取成功,抓取到的密码默认保存在主目录中

    弄啥嘞
  • 怕不怕?第一批AI已经开始干这种事了

    导读:我们曾在《那个陪你聊微信、发自拍的妹子,可能不是人》中提到过跟你自动聊微信的机器人,在本文中我们会给你看更多类似案例。

    华章科技
  • Python数据处理从零开始----第二章(pandas)⑧pandas读写csv文件(3)

    如果我们有来自许多来源的数据,如果要同时分析来自不同CSV文件的数据,我们可能希望将它们全部加载到一个数据帧中。在接下来的示例中,我们将使用Pandas rea...

    用户1359560
  • SAP最佳业务实践:FI–资产会计(162)-16在建工程-AIAB维护在建资产结算规则

    4.6.6 AIAB维护在建资产结算规则 在以下步骤中,您可以维护在建资产的结算规则。. 您已执行前面在建资产的相关步骤。 会计核算 -财务会计 -固定资产 ...

    SAP最佳业务实践
  • Python读写CSV文件

    py3study
  • Gephi-Toolkit的引入与使用

    Gephi-Toolkit是一个工具包,可以不依赖NetBeans平台来对输入数据进行可视化,输入数据一般是gexf等格式的文件,大多已经完成了坐标计算过程,用...

    ZONGLYN
  • SpringCloud Feign实现MultipartFile文件上传

    在Feign Client中引用配置类FeignMultipartSupportConfig,在FeignMultipartSupportConfig中,实例化...

    似水的流年
  • HBase 性能测试之读写P999延时压测实践

    我们在使用HBase的时候,必须要能够清楚HBase服务端的性能,这对HBase的合理使用以及性能调优都非常重要,所以一般在使用HBase之前,建议做一些必要的...

    大数据技术架构

扫码关注云+社区

领取腾讯云代金券