在查找数据集的时候发现,并不是所有的数据集都是以csv的格式存储,也就是每一列特征数据的分割并不是都以逗号分割,有的数据格式是以空格为分割

例如.data格式,

接下来就实现对.data格式数据的读取:

(数据来源于Boston房价预测数据集,文件名称为“housing.data”)

import pandas as pd
data = pd.read_csv('./housing.data', delim_whiteshape=True)

以上代码就是实现了对空格的分割,但是不知道针对也是以一列存储,并且数据分割也是空格的csv文件此方法还行得通不。

另外pd.read_csv()中的参数sep和delimiter表示的意义一样,具体如何使用不清楚,目前用到不多。

遇到读取文件不知如何操作的,最后要访问下官方文档或者google查询。

pd.read_csv官方文档

另外,可以直接在原数据集文件加后缀名.csv即可转换成csv文件,但前提是data中的数据已经以,分割好了。

pd.read_csv()中读取文件时,默认第一行作为列名,但有时候第一行也是我们需要的数据,这时需制定参数header=None,或者给每列提前设置好名字,names=[‘column0',‘column1',…]

补充:python 实现以空格分隔的文件读写及二维数组按列折半查找

最近文件读写的工作比较多,每一次读文件都会写单独的函数来适应文件格式,所以写了一个类对文件进行操作。

(用pandas.read_csv读取文件更好用)

import os
class DealData:
    # 数据加载函数
    def load(self, filename):
        data = []
        file = open(filename, 'r')
        for line in file.readlines():
            line = line.strip('\n')         # 除去换行
            line = line.split(' ')          # 文件以“ ”分隔
            if "" in line:                  # 解决每行结尾有空格的问题
                line.remove("")
            data.append(line)
        file.close()
        return data
 
    # 折半查找                               # array是一个二维数组,函数实现的功能是按照array的第lie列折半查找
    def search(self, array, lie, target):
        low = 0
        high = len(array) - 1
        while array[low][lie] <= array[high][lie]:
            mid = int((low + high) / 2)
            midval = array[mid][lie]
            if midval < target:
                low = mid + 1
            elif midval > target:
                high = mid - 1
            if high < 0 or low >= len(array):
                break
        return high
    # 将数据保存到文件                
    def save(self, data, filename):
        file = open(filename, 'w')
        for i in range(0, len(data), 1):
            for k in range(0, len(data[i]), 1):
                file.write(str(data[i][k]))
                file.write(" ")
            file.write("\n")
        file.close()

可以将Dealdata类单独创建一个python文件,命名为Dealdata,调用方法如下:

from DealData import DealData 
deal = DealData()
totaldata = deal.load("E:\low_data.txt")

之前先引用类:from Dealdata import Dealdata, 其中第一个Dealdata为被调用的python文件名, 第二个Dealdata为被调用的类名。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持程序员的世界。如有错误或未考虑完全的地方,望不吝赐教。

python 读取以空格分开的文件操作的更多相关文章

  1. 用python-webdriver实现自动填表的示例代码

    在日常工作中常常需要重复填写某些表单,如果人工完成,费时费力,而且网络延迟令人十分崩溃。如果能够用程序实现自动填表,效率可以提高一倍以上,并且能够移植到多台计算机,进一步提高工作效率。webdriver是python的selenium库中的一个自动化测试工具,它能完全模拟浏览器的操作,无需处理复杂的......

  2. python求列表对应元素的乘积和

    那天偶尔看到看到一个小问题:两个不等长列表a=[1,2,3],b=[4,5,6,7],求它们对应元素的乘积的和。我一开始想到的方法就是选择更小数组作为循环长度然后相乘求和:a = [1,2,3]b = [4,5,6,7]sum = 0for i in range(0,min(len(a),len(b......

  3. python将YUV420P文件转PNG图片格式的两种方法

    方法一:import osimport cv2 as cvimport numpy as np# 读取yuv420p的一帧文件,并转化为png图片if __name__ == '__main__':filepath = 'one_frame_of_highway.yuv'binfile = open......

  4. python 制作网站筛选工具(附源码)

    一.思路1.整体思路2.代码思路思路很简单,就是用python发送请求,提取响应体中的状态码加以判断,最后保存到本地txt文本中,以实现网站信息的筛选。二.撰写代码import timeimport requestsimport urllib3from concurrent.futures impo......

  5. python编写函数注意事项

    1、编写注意(1)给函数指定描述名。(2)函数名称只包括小写字母和下划线。(3)每一个函数都应该包含简要说明其功能的注释,注释应该紧跟在函数定义之后,并且采用文档字符串格式。2、给形参指定默认值时,等号两侧不得有空格def function_name(parameter_0, parameter_1......

  6. 如何用python批量调整视频声音

    今天来研究python中moviepy模块的用途近来有大量处理视频的需求,常会碰到一个问题是下载的视频音量过小,会需要将它调大声,虽然有在线工具VideoLouder可以免费调整视频音量大小,但毕竟若量很大的话一个一个上传视频也是挺麻烦的事情,因此决定再用程序帮忙解决。使用教学基础程序调整一个视频音......

  7. Python+MySQL随机试卷及答案生成程序

    一、背景本文章主要是分享如何使用Python从MySQL数据库中面抽取试题,生成的试卷每一份都不一样。二、准备工作1.安装Python3下载地址:https://www.python.org/downloads/windows/2.安装库pip install python-docx==0.8.......

  8. Python学习(6)(函数定义、调用、函数注释、形参与实参、函数返回值、函数嵌套)

    Python学习(6)一、python的函数 概念二、python的 函数定义和调用三、Pycharm 的调试工具四、python 函数的文档注释五、python 函数的参数1. 参数的作用2. 形参和实参六、python 函数的返回值七、python 函数的嵌套使用一、python的函数 概念函数......

  9. python 合并列表的八种方法

    Python 语言里有许多(而且是越来越多)的高级特性,是 Python 发烧友们非常喜欢的。在这些人的眼里,能够写出那些一般开发者看不懂的高级特性,就是高手,就是大神。但你要知道,在团队合作里,炫技是大忌。为什么这么说呢?我说下自己的看法:越简洁的代码,越清晰的逻辑,就越不容易出错;在团队合作中,......

  10. Python实现贪心算法的示例

    今天一个研究生同学问我一个问题,问题如下:超市有m个顾客要结账,每个顾客结账的时间为Ti( i取值从1到m)。超市有n个结账出口,请问全部顾客怎么选择出口,可以最早完成全部顾客的结账,并用代码实现。其实利用的就是贪心算法来解决这个问题,那么,什么是贪心算法?怎么用贪心算法解决这个问题?让我一一道来。......

随机推荐

  1. R语言求一行(列表、list)数据的平均数操作

    R语言求一个列表的平均数可以使用mean() :mean英文意思有平均数的含义x=c(1,3,5,7,9)max(x)#这样即可求得平均数为 : 5假如读取过一个csv文件之后,要求其中一行数据中指定某个区间内的平均数可以使用rowMeans()data = read.csv(“input.csv&......

  2. 在nodejs中创建child process

    目录简介child process异步创建进程同步创建进程在nodejs中创建child process简介nodejs的main event loop是单线程的,nodejs本身也维护着Worker Pool用来处理一些耗时的操作,我们还可以通过使用nodejs提供的worker_threads来......

  3. Wi-Fi 6 与 5G 相比哪个更快?

    随着 iPhone12 的发布,iOS 系统正式开始拥抱 5G,智能手机全面进入了 5G 时代。伴随着各大运营商的 5G 推广以及相关基站建设的如火如荼,5G 成了大家广泛讨论的热门词汇。这样热门的光芒让其他新词汇不得不退让并离开大家的视野,然而有另一项新技术却悄悄登场并且完成了属于自己的市场迭代,......

  4. C# 中的动态类型

    翻译自 Camilo Reyes 2018年10月15日的文章 《Working with the Dynamic Type in C#》 [1].NET 4 中引入了动态类型。动态对象使您可以处理诸如 JSON 文档之类的结构,这些结构的组成可能要到运行时才能知道。在本文中,Camilo Reye......

  5. python中编写函数并调用的知识点总结

    能够调用自己编写的函数,这在很多开发语言中,都会用到一个叫做mian的主函数,这个函数一般都是程序的入口,当程序启动时,首先执行这个函数。在Python中,main函数的主要作用就是你写的模块既可以导入到别的模块中用,也可以在模块本身执行使用。下面就来了解具体使用操作吧。编写简单的函数并调用:def......

  6. unity 如何使用文件流读取streamingassets下的资源

    目的:读取streamingassets下的文件中指定的一段字节已知:文件中的起始位置,和需要读取的长度1.android下读取1.1 不能直接使用C#的FileStream,读取失败var buffer = new byte[size];FileStream stream = File.OpenR......

  7. MySQL全面瓦解16:存储过程相关

    概述大多数SQL语句都是针对一个或多个表的单条语句。但并非所有业务都这么简单,经常会有复杂的操作需要多条语句才能完成。比如用户购买一个商品,要删减库存表,要生成订单数据,要保存支付信息等等,他是一个批量的语句执行行为。存储过程简单来说,就是为以后的使用而保存的一条或多条MySQL语句的集合。可将其视......

  8. Perl 调用 MySQL 存储过程并获得返回值

    $stmt=$my_db->prepare("SELECT isodd(?)") or die($my_db->error);$stmt->bind_param('i',$aNumber) or die($stmt->error);$stmt->ex......

  9. Java多线程总结(二)

    四.Java多线程的阻塞状态与线程控制上文已经提到Java阻塞的几种具体类型。下面分别看下引起Java线程阻塞的主要方法。1.join()join —— 让一个线程等待另一个线程完成才继续执行。如A线程线程执行体中调用B线程的join()方法,则A线程被阻塞,知道B线程执行完为止,A才能得以继续执行......

  10. Python 使用dict实现switch的操作

    Python3还是没有switch,可以利用if-else来实现,但是非常不方便。使用dict来实现会比较简洁优雅。# -*- coding: utf-8 -*-"""Python利用dict实现switch""" def add(x, y......