前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >c++ fstream + string 处理大数据

c++ fstream + string 处理大数据

作者头像
CSDN技术头条
发布于 2018-02-08 09:48:26
发布于 2018-02-08 09:48:26
2.4K0
举报
文章被收录于专栏:CSDN技术头条CSDN技术头条

起因

(1)之前处理文本数据时,各种清洗数据用的都是java的File,FileReader/FileWriter,BufferedReader/BufferedWriter等类,详见java读写文件

(2)应用java的原因是java里面的map非常灵活,eclipse编译器更是给力,而且ctrl可以追踪函数等,详见java map的排序

(3)应用java的另一个原因是java里面的string类的字符串处理非常灵活,各种函数是应用尽有。

(4)上面两点算是自己的误解吧,因为c++里面也有也有与之对应的fstream类,c++map容器类,详见c++ map简介

(5)c++里面也有相对比较成熟的string类,里面的函数也大部分很灵活,没有的也可以很容易的实现split,strim等,详见c++string实现

(6)最近从网上,看到了一句很经典的话,c++的风fstream类 + string类也可以非常好的处理文本文件,让我们一起来见证

fstream的前世今生

(1)简介

包含的头文件#include<fstream>using namespace std;

C++中的三个文件流

a----ofstream ofs("文件名",打开方式);b----ifstream ifs("文件名", 打开方式);c----fstream fs("文件名",输入打开方式|输出打开方式);三种文件流分别用于写文件、读文件、读写文件,一般用a b两种方式进行,因为一个文件同时进行读写的情况采用c方式。

三种文件流都可先定义,再打开文件,以fstream为例

fstream fs;fs.open("文件名",输入打开方式|输出打开方式);

其中“打开方式”可以不给出。若不给出,对于oftream默认为ios::out,iftream默认为ios::in

(2)文件打开函数

在C++中,对文件的操作是通过stream的子类fstream(file stream)来实现的,所以,要用这种方式操作文件,就必须加入头文件fstream.h。下面就把此类的文件操作过程一一道来。

打开文件在fstream类中,有一个成员函数open(),就是用来打开文件的,其原型是:

void open(const char* filename,int mode,int access);

参数:

filename:要打开的文件名

mode:要打开文件的方式

access:打开文件的属性

(3)打开方式

ios::out 输出数据覆盖现有文件 (默认的写代开方式,文件不存在,创建之;若存在,则覆盖原来的内容)

ios::app输出数据填加之现有文件末尾(追加末尾写代开方式,不覆盖原内容)

ios::ate打开文件并移动文件指针至末尾

ios::in打开文件以输入 (默认读的打开方式)

ios::trunc输出文件中现有内容(ios::out的默认操作)

ios::binary二进制打开供读写

(4)文件指针定位

和C的文件操作方式不同的是,C++I/O系统管理两个与一个文件相联系的指针。一个是读指针,它说明输入操作在文件中的位置;另一个是写指针,它下次写操作的位置。每次执行输入或输出时,相应的指针自动变化。所以,C++的文件定位分为读位置和写位置的定位,对应的成员函数是seekg()和seekp(),seekg()是设置读位置,seekp是设置写位置。它们最通用的形式如下: istream &seekg(streamoff offset,seek_dir origin); ostream &seekp(streamoff offset,seek_dir origin); streamoff定义于iostream.h中,定义有偏移量offset所能取得的最大值,seek_dir表示移动的基准位置,是一个有以下值的枚举:

ios::beg:文件开头 ios::cur:文件当前位置 ios::end:文件结尾 这两个函数一般用于二进制文件,因为文本文件会因为系统对字符的解释而可能与预想的值不同。 例:

file1.seekg(1234,ios::cur);//把文件的读指针从当前位置向后移1234个字节 file2.seekp(1234,ios::beg);//把文件的写指针从文件开头向后移1234个字节 file1.seekg(-128,ios::end);//把文件的读指针从文件末尾向前移128个字节

注意:一个汉字是占用两个字节的,一个字母占用一个字节。

(5)fstream,stream;ifstream,istream;ofstream,ostream等的关系

三:实战篇

(1)read word by word ;no write

代码语言:js
AI代码解释
复制
 //读取方式: 逐词读取, 词之间用空格区分(遇到空格认为本次读取结束),输出之后进行下一次读取 
 //read data from the file, Word By Word 
 //when used in this manner, we'll get space-delimited bits of text from the file 
 //but all of the whitespace that separated words (including newlines) was lost. 
void ReadDataFromFileWBW()  
{  
    ifstream fin("data.txt");  
    string s;  
    cout << "*****start*******" << endl;  
 while( fin >> s )  
    {  
          cout << "Read from file: " << s << endl;  
    }  
    cout << "*****over*******" << endl;  
}  

(2)read by line  fin.getline(char*,n)

代码语言:js
AI代码解释
复制
 //读取方式: 逐行读取, 将行读入字符数组, 行之间用回车换行区分 
 //If we were interested in preserving whitespace, 
 //we could read the file in Line-By-Line using the I/O getline() function. 
void ReadDataFromFileLBLIntoCharArray()  
{  
    ifstream fin("data.txt",ios::in);// 默认的打开模式就是ios::in 
    ofstream fout("out.txt",ios::out);// 默认代开模式就是ios::out 
 const int LINE_LENGTH = 100;  
 char str[LINE_LENGTH];  
    fout << "****CharArray start******" << endl;  
    cout << "****CharArray start******" << endl;  
    fin.seekg(-20,ios::end);// -20表示从end向前移动20字节,汉字占两字节;20表示向后移动指针 
 while( fin.getline(str,LINE_LENGTH) )  
    {  
        fout << str << endl;  
        cout << "Read from file: " << str << "..." << endl;// ****str里面本身包含着换行的,原来是什么样子,现在保存的就是什么样子 
    }  
    fout << "*****over*******" << endl;  
    cout << "*****over*******" << endl;  
}  

(3) read by line fin.getline(fin,string)

代码语言:js
AI代码解释
复制
 //读取方式: 逐行读取, 将行读入字符串, 行之间用回车换行区分 
 //If you want to avoid reading into character arrays, 
 //you can use the C++ string getline() function to read lines into strings 
void ReadDataFromFileLBLIntoString()  
{  
    ifstream fin("data.txt",ios::in);// 默认的打开模式就是ios::in 
    ofstream fout("out.txt",ios::app);// 追加到文件尾的方式打开 
    string s;  
    cout << "****start******" << endl;  
 while( getline(fin,s) )  
    {  
        fout << s << endl;// ofstream是默认,若文件不存在,则先建立此文件,并且再向文件写的过程中换行已经不存在了,这与cout控制台输出一样哦。。。 
        cout << "Read from file: " << s << endl;//****s同str里面本身已经没有了换行的,这和原来的getline()函数是一样的;数据原来是什么样子,现在保存的就是什么样子 
    }  
    fout << "*****over*******" << endl;  
    cout << "*****over*******" << endl;  
    fout.close();  
}  

(4) main函数

代码语言:js
AI代码解释
复制
#include <iostream> 
#include <fstream> 
#include <string> 
#include <cstdlib>// exit()函数 
using namespace std;  
 //输出空行 
void OutPutAnEmptyLine()  
{  
      cout<<"\n";  
}  
 //带错误检测的读取方式 
 //Simply evaluating an I/O object in a boolean context will return false 
 //if any errors have occurred 
void ReadDataWithErrChecking()  
{  
    string filename = "dataFUNNY.txt";  
    ifstream fin( filename.c_str());  
 if( !fin )  
    {  
          cout << "Error opening " << filename << " for input" << endl;  
          exit(-1);  
    }  
}  
int main()  
{  
      ReadDataFromFileWBW(); //逐词读入字符串 
      OutPutAnEmptyLine(); //输出空行 
      ReadDataFromFileLBLIntoCharArray(); //逐词读入字符数组 
      OutPutAnEmptyLine(); //输出空行 
      ReadDataFromFileLBLIntoString(); //逐词读入字符串 
      OutPutAnEmptyLine(); //输出空行 
      ReadDataWithErrChecking(); //带检测的读取 
 return 0;  
}  

data文本文件的数据格式

(插入c 与 c++文件处理对比)

代码语言:js
AI代码解释
复制
#include <iostream>  
#include <fstream> 
#include <cassert> 
#include <ctime> 
#include <cstdio> 
using namespace std;</p><p>void test_read()  
{  
 const char* read_file = "D:\\zyp\\大数据实验<a target=_blank href="file://\\TOKEN_ENEX_201404_20W_yuansi.csv">\\TOKEN_ENEX_201404_20W_yuansi.csv</a>"; 
 const int BUF_SIZE = 1024 ;  
 char buf[BUF_SIZE];  
 //c++ style writing file 
  ifstream ifs(read_file,ios::binary);  
  assert(ifs);  
 time_t start, end;  
  start =  clock();  
 while(!ifs.eof())  
  {  
    ifs.read(buf,BUF_SIZE);  
  }  
  end = clock();  
  ifs.close();  
  cout<<"C++ style: "<<end - start <<" ms"<<endl;  
 //c style writing file 
 FILE* fp = fopen(read_file, "rb");  
  start =  clock();  
 int len = 0;  
 char *pline = NULL;  
 do 
  {  
 //len = fread(buf,1,BUF_SIZE,fp); 
      pline = fgets(buf,BUF_SIZE,fp);  
      cout << buf << endl;  
 //cout<<len<<endl; 
  }while(pline != NULL);  
  end = clock();  
  fclose(fp);  
  cout<<"C style: "<<end - start <<" ms"<<endl;  
  cin.get();  
}  
int main()  
{  
    test_read();  
 return 0;  
}</p>总之,/fread() 的效率 是 ifstream.read()的将近十倍!但是,fstream 对于处理数据而言,还是统一的应用STL的标准好;总之,语言仅仅是一门工具,本身没有优劣之分。fgets(char*,int,File*); getline(stream,string),还是个人习惯的好。如今,还是建议应用面向对象的语言好一些,java 或者 c++,java更加强大一些,有自己的各种类库。c++没有的,链接JDBC的东东的  

总结

第一条,(写了这么多了,用两句话概括吧)最近从网上,看到了一句很经典的话,c++的风fstream类+string类也可以非常好的处理文本文件;

第二条,语言仅仅是一种工具,本身并没有优劣之分

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2014-11-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CSDN技术头条 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
C++ fstream详解[通俗易懂]
C语言里面对文件的操作是通过文件指针,以及一些相关的函数,那么C++中是如何对文件进行操作的呢?没错,就是通过 fstream 这个文件流来实现的。当我们使用#include 时,我们就可以使用其中的 ifstream,ofstream以及fstream 这三个类了(ofstream是从内存到硬盘,ifstream是从硬盘到内存),也就可以用这三个类来定义相应的对象了,这三个类分别代表一个输入文件,一个输出文件,以及一个输入输出文件。Ifstream类支持>>操作符,ofstream类支持<<操作符,fstream类同时支持>>和<<操作符。
全栈程序员站长
2022/11/05
2.1K0
f stream_fstream
ofstream是从内存到硬盘,ifstream是从硬盘到内存,其实所谓的流缓冲就是内存空间;
全栈程序员站长
2022/09/29
4940
如何用C++做文件和流
⭐本文介绍⭐ 到目前为止,我们已经使用了 iostream 标准库,它提供了 cin 和 cout 方法分别用于从标准输入读取流和向标准输出写入流。
iOS Magician
2023/03/22
6980
C++读写文件操作(fstream、ifstream、ofstream、seekg、seekp、tellg、tellp用法)[通俗易懂]
本文主要总结用C++的fstream、ifstream、ofstream方法读写文件,然后用seekg()、seekp()函数定位输入、输出文件指针位置,用tellg()、tellp()获取当前文件指针位置。
全栈程序员站长
2022/09/03
6.4K0
C++读写文件操作(fstream、ifstream、ofstream、seekg、seekp、tellg、tellp用法)[通俗易懂]
c++ 文件操作详解
C++ 通过以下几个类支持文件的输入输出: ofstream: 写操作(输出)的文件类 (由ostream引申而来) ifstream: 读操作(输入)的文件类(由istream引申而来) fstream: 可同时读写操作的文件类 (由iostream引申而来) 打开文件(Open a file) 对这些类的一个对象所做的第一个操作通常就是将它和一个真正的文件联系起来,也就是说打开一个文件。被打开的文件在程序中由一个流对象(stream object)来表示 (这些类的一个实例) ,而对这个流对象所做的任何
拾点阳光
2018/05/10
1.9K0
c++中fstream是什么意思_汽车配置参数图文详解
‍1,几个文件流类名称:fstream,ifstream,ofstream,iofstream
全栈程序员站长
2022/11/04
1.2K0
c++中fstream是什么意思_c++形式参数
最近出于学习需要, 接触了一些C++的程序, 对于文件的操作, 在C++中的实现方法与C中有些不同,
全栈程序员站长
2022/11/04
6720
fstream的用法_fun 的用法
在C++中输入输出到指定文件,或者从指定文件中读出数据使用fstream类较为方便。
全栈程序员站长
2022/10/02
3.3K0
c++读写文件的几种方法_include有什么用
在看C++编程思想中,每个练习基本都是使用ofstream,ifstream,fstream,以前粗略知道其用法和含义,在看了几位大牛的博文后,进行整理和总结:
全栈程序员站长
2022/11/04
1.2K0
c++读写文件的几种方法_include有什么用
C++文件读写操作分析文本文件与二进制文件
ios::app 与 ios::ate 的区别主要在多线程写文件时有区别,ios::app:第一个线程(进程)往里面写了个d,第二个线程(进程)写了个e的话,结果是abcde
CtrlX
2022/09/23
6350
C++ fstream文件流读写文件操作详解
掌握文本文件读写的方法 了解二进制文件的读写方法C++文件流: fstream  // 文件流 ifstream  // 输入文件流 ofstream  // 输出文件流
horsley
2022/08/16
2.8K0
c++那些事儿7.0 I/O流,文件操作
知识点综述: ---- C++ I/O: 在iostream头文件中定义 istream //通用输入流和其它输入流基类。 ostream //通用输出流和其它流基类。 iostream //通用输入输出流和其它输入输出流基类。 在fstream头文件中定义 ofstream //文件写操作 内存写入存储设备 ifstream //文件读操作,存储设备读区到内存中
热心的社会主义接班人
2018/04/27
1.7K0
c++那些事儿7.0 I/O流,文件操作
【C++学习】 IO 流揭秘:高效数据读写的最佳实践
🚀C++ IO 流(输入输出流)是一种用于处理数据流的机制,允许程序读取和写入数据。它包括
IsLand1314
2024/10/15
3360
【C++学习】 IO 流揭秘:高效数据读写的最佳实践
C++文件读写
在C++中,所有的输入输出操作大部分都继承自 ios_base 基类,详细的继承体系如下图所示
范中豪
2021/05/27
1.2K0
c++文件操作2
读取文件操作: 1.包含头文件:#include< fstream > 2.创建流对象:ifstream ifs 3.打开文件,判断文件是否打开成功:ifs.open(“打开路径”,打开方式) 4.读取数据:有四种方式,下文用代码方式展现 5.关闭文件:ifs.close();
大忽悠爱学习
2021/02/22
4080
c++文件读写操作
近期适配几款游戏的数据,因为重复量太大,因此写一个对数据进行处理的程序,下面是整个过程中接触到的一些东西。
全栈程序员站长
2022/09/05
1.3K0
c++文件读写操作
[C++][IO]fstream用法
void open(const char* filename,int mode,int access);
静默虚空
2022/05/07
9100
C++中文件的读写
通过文件,可以将数据持久化。C++ 中对文件的操作需要包含头文件<fstream>。 文本文件,以文本的ASCII码的形式存储在计算机中。 二进制文件,以二进制的形式存储在计算机中,用户一般无法直接阅读。 操作文本的3个类:ofstream,写操作;ifstream,读操作;fstream,读写操作。
耕耘实录
2022/05/09
8000
从零开始学C++之IO流类库(三):文件的读写、二进制文件的读写、文件随机读写
文章主要讲述了C++流和文件操作的相关内容。包括标准I/O流、自定义I/O流、文件操作、文件的随机读写以及文件指针的移动。
s1mba
2017/12/28
3.2K0
c++输入文件流ifstream用法详解
每个IO 对象都维护一组条件状态 flags (eofbit, failbit and badbit),用来指出此对象上是否可以进行 IO 操作。如果遇到错误—例如输入流遇到了文件末尾,则对象的状态变为是失效,所有的后续输入操作都不能执行,直到错误纠正。
全栈程序员站长
2022/07/02
2K0
c++输入文件流ifstream用法详解
推荐阅读
相关推荐
C++ fstream详解[通俗易懂]
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文