简单介绍python中读取txt文件时split()函数的妙用

116次阅读

共计 2166 个字符，预计需要花费 6 分钟才能阅读完成。

导读	这篇文章主要介绍了 python 中读取 txt 文件时 split() 函数的妙用，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教

不知道大家有没有过需要从 txt 文件中读取含有多行多列的数据的经历，当我们读入数据时，数据会以 string 的形式被读入，然而如何进行数据类型转换就成了大的问题。

这里介绍一种最简单的方式和容易产生的错误使用方法。

txt 测试文件中的数据如下

简单介绍 python 中读取 txt 文件时 split() 函数的妙用

我们使用如下代码读取文件，使用 readlines() 一次性将所有数据全部读取。

 with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
    all_data = f.readlines()
    print(all_data)
# ['6.317438621610765E-05  6.123920173773844E-05  0.00010382572761752979\n', '0.00010819194873178063  8.848784016828921E-05  0.0002043378699454479\n', '9.79660835582763E-05  9.750829986943346E-05  0.00021506758227284687']

我们不难发现这时我们的所有数据都被读入了同一行，但是内部有三个单引号括起来的部分，与我们测试数据中的三行吻合。

我们也可以看到，我们需要将这些数据分成单独的 string，然后我们就可以使用例如 float 关键字对这些数据进行类型转换。

我们看到数据之间是通过空格来分开的。我们第一时间想到我们应该使用.split(” “) 方法以空格将数据分开。

我们尝试以下代码

 with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
    all_data = f.readlines()
    all_data = all_data[0].split(" ")
    print(all_data)
# ['6.317438621610765E-05', '','6.123920173773844E-05','', '0.00010382572761752979\n']

首先我们需要选取第一行，使用 all_data[0]，然后再使用 split(” “) 函数分开它们。

我们成功达到了目的，但是我们同时引入了 ”” 空字符串项和末尾处 \n 的隐患，很是棘手。

这么做我们就进入了误区。

正确地做法如下

 with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
    all_data = f.readlines()
    all_data = all_data[0].split()
    print(all_data)
# ['6.317438621610765E-05', '6.123920173773844E-05', '0.00010382572761752979']

我们使用 split() 函数时不添加任何参数，这样就一次性去掉了 ”” 空字符串项和末尾处 \n 的隐患还同时分开了各个字符串。

如果需要输出多行的结果，我们可以预先定义一个数组，用来存放我们的数据，完整代码如下：(以后所有的多行多列数据均可以如此读入)

方法一：将数据以二维列表形式读入

 array2d = []
with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
    all_data = f.readlines()
    for i in range(len(all_data)):
        temp_list = []
        for element in all_data[i].split():
            temp_list.append(float(element))
        array2d.append(temp_list)
 
print(array2d)
#[[6.31743862e-05, 6.12392017e-05, 0.000103825728], 
# [0.000108191949, 8.84878402e-05, 0.00020433787], 
# [9.79660836e-05, 9.75082999e-05, 0.000215067582]]

方法二：将数据以二维数组形式读入

 import numpy as np
 
array = np.zeros((3, 3))
with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
    all_data = f.readlines()
    for i, line in enumerate(all_data):
        numbers = line.split()
        for j, element in enumerate(numbers):
            array[i, j] = float(element)
 
print(array)
# [[6.31743862e-05 6.12392017e-05 1.03825728e-04]
#  [1.08191949e-04 8.84878402e-05 2.04337870e-04]
#  [9.79660836e-05 9.75082999e-05 2.15067582e-04]]

阿里云 2 核 2G 服务器 3M 带宽 61 元 1 年，有高配

腾讯云新客低至 82 元 / 年，老客户 99 元 / 年

代金券：在阿里云专用满减优惠券

正文完

星哥玩云-微信公众号

发表至： linux教程

2024-07-24

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

Pod 的 init Containers

restorecon命令详解

Google 推出全新的两步验证机制

简单介绍python 存储变量的几种方法

简单介绍python中读取txt文件时split()函数的妙用

申请腾讯混元的API Key并且使用LobeChat调用混元AI

Docker部署搭建一个开源强大的图书管理系统

基于Docker快速搭建一个开源的IT人员在线工具箱-it-tools

让每个人都可以轻松使用Git-腾讯自研Git客户端

使用Docker部署开源的WPS-Office

如何处理阿里云ssh连接慢

System Center Configuration Manager 2012 R2

2024年腾讯云最便宜的云服务器多少钱？38元一年

7 个致命的 Linux 命令

ifconfig已过时，来看看现在的新命令！

	with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
	all_data = f.readlines()
	print(all_data)
	# ['6.317438621610765E-05 6.123920173773844E-05 0.00010382572761752979\n', '0.00010819194873178063 8.848784016828921E-05 0.0002043378699454479\n', '9.79660835582763E-05 9.750829986943346E-05 0.00021506758227284687']

	with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
	all_data = f.readlines()
	all_data = all_data[0].split(" ")
	print(all_data)
	# ['6.317438621610765E-05', '','6.123920173773844E-05','', '0.00010382572761752979\n']

	with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
	all_data = f.readlines()
	all_data = all_data[0].split()
	print(all_data)
	# ['6.317438621610765E-05', '6.123920173773844E-05', '0.00010382572761752979']

	array2d = []
	with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
	all_data = f.readlines()
	for i in range(len(all_data)):
	temp_list = []
	for element in all_data[i].split():
	temp_list.append(float(element))
	array2d.append(temp_list)

	print(array2d)
	#[[6.31743862e-05, 6.12392017e-05, 0.000103825728],
	# [0.000108191949, 8.84878402e-05, 0.00020433787],
	# [9.79660836e-05, 9.75082999e-05, 0.000215067582]]

	import numpy as np

	array = np.zeros((3, 3))
	with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
	all_data = f.readlines()
	for i, line in enumerate(all_data):
	numbers = line.split()
	for j, element in enumerate(numbers):
	array[i, j] = float(element)

	print(array)
	# [[6.31743862e-05 6.12392017e-05 1.03825728e-04]
	# [1.08191949e-04 8.84878402e-05 2.04337870e-04]
	# [9.79660836e-05 9.75082999e-05 2.15067582e-04]]