我要学习
终身会员
终身会员
  • 注册日期2011-08-05
  • 发帖数371
  • QQ
  • 火币2232枚
  • 粉丝43
  • 关注24
阅读:3661回复:0

用C语言读取大文件的问题--内存映射

楼主#
更多 发布于:2011-08-24 16:08
Windows对文件的读写提供了很丰富的操作手段,如:
1. FILE *fp, fstearm...; (C/C++)
2. CFile, CStdioFile...; (MFC)
3. CreateFile, ReadFile...;(API)
...
在处理一般的文件(文本/非文本),这些足够了。然而在处理比较大的文件如
几十M, 几百M, 甚至上G的文件, 这时再用一般手段处理,系统就显的力不从心了
要把文件读出,再写进,耗费的是cpu利用率与内存以及IO的频繁操作。这显然是
令用户难以忍受的
为了解决这个吃内存,占CPU,以及IO瓶颈,windows核心编程提供了内存映射文件技术
(Maping File)
至于Maping File是什么原理,我不多说了,网上转载资源一箩筐,我只想从应用层
来考虑,怎样用这个技术,实现日常项目中的应用
举例来说:
可能项目中,会经常用到一些大量的常量,而这些大量常量用宏来替代写再源文件中
显然不可取,一般是写在文件中,给常量一些编号,通过编号来索引
一般文件比较小时候,常用做法也是先预读到内存中,毕竟从内存中读比从文件中读要快(IO操作的瓶颈)
比较好的做法,读到STL MAP 中去:
例如一个索引文件:
SEU07201213=一颗欲枯的草
FANG=方
SEU07201214=CSDN
............
打开文件,解析=号,在解析方面有CString操作,strtok,strstr, boost 正则表达式匹配等等,但我比较喜欢
[pre]
    sscanf(szIndex, "%[^=]=%[^=]", sName, sValue);
  1. sscanf(szIndex, "%[^=]=%s", sName, sValue);
  2. fscanf(stream, "%[^=]=%[^=]", sName, sValue);
[/pre]
之类,
然后再定义一个map:
map<string, string> m_Map;
m_Map[sName] = sValue;
但是文件比较大的时候,笔者做过测试,用上面方法处理一个15M, 25万行的文本文件,占用内存非常
的高,达70多M,处理的速度也非常的慢,这还不包括回写到文件
这时,Maping File就派上用场了,这里处理大文件就抛弃了map的应用(因为容器占用很多内存)
而是直接利用字符指针来操作,不用其他封装,不多说了,请看示例:
 
 
[pre]
    #pragma warning(disable: 4786)  
  1. #include <windows.h>
  2. #include <stdio.h>
  3. #include <iostream>
  4. #include <string>
  5. using namespace std;
  6. string GetValue(const TCHAR *, const TCHAR *);  //根据name得value
  7. void main(int argc, char* argv[])
  8. {
  9.    // 创建文件对象(C: est.tsr)
  10.    HANDLE hFile = CreateFile("C:/test.tsr", GENERIC_READ | GENERIC_WRITE,0, NULL, OPEN_EXISTING, FILE_ATTRIBUTE_NORMAL, NULL);
  11.    if (hFile == INVALID_HANDLE_VALUE)
  12.    {
  13.        printf("创建文件对象失败,错误代码:%d ", GetLastError());
  14.        return;
  15.    }
  16.    // 创建文件映射对象
  17.    HANDLE hFileMap = CreateFileMapping(hFile, NULL, PAGE_READWRITE, 0, 0, NULL);
  18.    if (hFileMap == NULL)
  19.    {
  20.        printf("创建文件映射对象失败,错误代码:%d ", GetLastError());
  21.        return;
  22.    }
  23.    // 得到系统分配粒度
  24.    SYSTEM_INFO SysInfo;
  25.    GetSystemInfo(;SysInfo);
  26.    DWORD dwGran = SysInfo.dwAllocationGranularity;
  27.    // 得到文件尺寸
  28.    DWORD dwFileSizeHigh;
  29.    __int64 qwFileSize = GetFileSize
[/pre]

喜欢0 评分0
游客

返回顶部