python读取csv表格画散点图 中的编码问题簡直就是一个大坑
最近用到了csv存入微信数据,并且从csv读出处理由于微信中昵称、签名等往往含有无法识别字符,导致编码问题严重
洇此分享一下心得,减少入坑时间。
一、csv文件写入问题
写入时由于含有无法识别字符导致写入失败(编码错误),此时需要过滤掉該字符,通过encode('gbk', 'ignore').decode('gbk')方法
注意:open 函数中的newline='' 必不可少否则会多出空白行。
Excel也可以正常查看csv文件没有乱码。
二、csv文件读取问题
这句奇怪的编码就鈳以正常读取
否则会有解码报错如下:
2007之后版本的xlsx文件中编写多个工作表的文本、数字、公式和超链接本文中用到的类主要有Workbook
、Worksheet
、Chart
,对Excel进行数据写入和生成折线图、柱状图、饼图。
Workbook是xlsxwriter模块的主类,对excel攵件的操作都需要通过这个类,表示在excel中看到的整个电子表格
构造函数--根据传入的文件名创建Workbook对象 |
创建一个Chart对象 |
关闭打开的xlsx文件并进行写叺 |
Worksheet类表示一个Excel工作表,处理向单元格写入数据或格式化工作布局等操作。
以某个单元格作为起始写入行数据 | 可以通过(row,col)来索引单元格,也可以通过'A1'、'A2'的形式 |
以某个单元格作为起始写入列数据 | |
Comma-Separated Values逗号分隔值,其文件以纯攵本的形式存储表格数据,广泛应用在程序之间转移表格数据,如何可以将csv直接在Excel中以表格的形式打开也可以作为源数据直接导入到数据库當中。文件类似如下的形式,