如何用Python将数据写到CSV文件.doc

上传人:白大夫 文档编号:3428297 上传时间:2019-08-24 格式:DOC 页数:3 大小:18.50KB
返回 下载 相关 举报
如何用Python将数据写到CSV文件.doc_第1页
第1页 / 共3页
亲,该文档总共3页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《如何用Python将数据写到CSV文件.doc》由会员分享,可在线阅读,更多相关《如何用Python将数据写到CSV文件.doc(3页珍藏版)》请在三一文库上搜索。

1、如何用Python将数据写到CSV文件我们从网上爬取数据,最后一步会考虑如何存储数据。如果数据量不大,往往不会选择存储到数据库,而是选择存储到文件中,例如文本文件、CSV 文件、xls 文件等。因为文件具备携带方便、查阅直观。Python 作为胶水语言,搞定这些当然不在话下。但在写数据过程中,经常因数据源中带有中文汉字而报错。最让人头皮发麻的编码问题。我先说下编码相关的知识。编码方式有很多种:UTF-8, GBK, ASCII 等。ASCII 码是美国在上个世纪 60 年代制定的一套字符编码。主要是规范英语字符和二进制位之间的关系。英语词汇组成简单,由 26 个字母构成。使用一个字节就能表示一

2、个字母符号。外加各种符号,使用 128 个字符就满足编码要求。不同国家有不同语言文字。同时,文字组成部分的数量相比英语字母要多很多。根据不完全统计,汉字的数量大约将近 10 万个,日常所使用的汉字有 3000 个。显然,ASCII 编码无法满足需求。所以汉字采用 GBK 编码,使用两个字节表示一个汉字。简体中文的编码方式是 GBK2312。那 UTF-8 又是什么编码?这要先说 Unicode 了。Unicode 目的是为了统一各种编码。因为各国都各自的编码方式。如果使用一种编码编码,使用另一种编码解码。这会造成出现乱码的情况。但 Unicode 只是一个符号集,它只规定了符号的二进制代码,却

3、没有规定这个二进制代码应该如何存储。UTF-8 就是在互联网上使用最广的一种 Unicode 的实现方式。因此,如果我们要写数据到文件中,最好指定编码形式为 UTF-8。Python 标准库中,有个名为 csv 的库,专门处理 csv 的读写操作。具体使用实例如下:import csvimport codecs# codecs 是自然语言编码转换模块fileName = PythonBook.csv# 指定编码为 utf-8, 避免写 csv 文件出现中文乱码with codecs.open(fileName, w, utf-8) as csvfile:# 指定 csv 文件的头部显示项fil

4、ednames = 书名, 作者writer = csv.DictWriter(csvfile, fieldnames=filednames)books = book = TItle: 笑傲江湖,author: 金庸,books.append(book)writer.writeheader()for book in books:try:writer.writerow(书名:bookTItle, 作者:bookauthor)except UnicodeEncodeError:print(编码错误, 该数据无法写到文件中, 直接忽略该数据)这种方式是逐行往 CSV 文件中写数据, 所以效率会比较低

5、。如果想批量将数据写到 CSV 文件中,需要用到 pandas 库。pandas 是第三方库,所以使用之前需要安装。通过 pip 方式安装是最简单、最方便的。pip install pandas使用 pandas 批量写数据的用法如下:import pandas as pdfileName = PythonBook.csvnumber = 1books = book = TItle: 笑傲江湖,author: 金庸,# 如果 book 条数足够多的话,pandas 会每次往文件中写 50 条数据。books.append(book)data = pd.DataFrame(books)# 写入csv文件,a+是追加模式try:if number = 1:csv_headers = 书名, 作者data.to_csv(fileName, header=csv_headers, index=False, mode=a+, encoding=utf-8)else:data.to_csv(fileName, header=False, index=False, mode=a+, encoding=utf-8)number = number + 1except UnicodeEncodeError:print(编码错误, 该数据无法写到文件中, 直接忽略该数据)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1