C#的二进制文件操作及汉字编码转换-weikent-ChinaUnix博客

记住忘记的东西！weikent.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

weikent

博客访问： 602288
博文数量： 208
博客积分： 3286
博客等级：中校
技术积分： 1780
用户组：普通用户
注册时间： 2007-09-24 20:38

文章分类

全部博文（208）

XCode（0）
sql（0）
Iphone4（0）
路由（1）
Nero（2）
Python（2）
wav（1）
正则表达式（2）
VS单元测试（2）
net命令（5）
Http（4）
VRML（10）
Linux（14）
x3D学习（16）
SilverLight（6）
InstallShield（18）

InstallShielBuil（13）
CSharp（23）
vtk（1）
XNA（26）

转载??XNA高级编（23）
感悟，经验（7）
emacs（10）
我的日记（3）
我的C小程序（18）
我的DirectX（5）

转载??Clayman（5）
未分配的博文（32）

文章存档

2012年（7）

2011年（28）

2010年（21）

2009年（76）

2008年（65）

2007年（11）

我的朋友

山定子

最近访客

推荐博文

C#的二进制文件操作及汉字编码转换

分类：

2009-09-03 17:04:37

C#的二进制文件操作及汉字编码转换

1．数值应保存在二进制文件
首先列举文本、二进制文件的操作（读写）方法：
方式1：
//文本文件操作：创建/读取/拷贝/删除
using System;
using System.IO;
class Test
{
   string path = @"f:\t.txt";
   public static void Main()
   {
      //创建并写入(将覆盖已有文件)
      if (!File.Exists(path))
      {
//StreamWriter m=new
//StreamWriter(path,true,Encoding.Default,1);//ASCII,1   Encoding.Default：即//UTF-8编码这样就可以指定编码方式
    using (StreamWriter sw = File.CreateText(path))
         {
            sw.WriteLine("Hello");
         }
      }
      //读取文件
      using (StreamReader sr = File.OpenText(path))
      {
        string s = "";
        while ((s = sr.ReadLine()) != null)
        {
           Console.WriteLine(s);
        }
     }
     //删除/拷贝
     try
     {
        File.Delete(path);
        File.Copy(path, @"f:\tt.txt");
     }
     catch (Exception e)
     {
        Console.WriteLine("The process failed: {0}", e.ToString());
     }
   }
}

方式2：
//流文件（二进制）操作
private const string name = "Test.data";
public static void Main(String[] args)
{
    //打开文件() ,或通过File创建立如：fs = File.Create(path, 1024)
    FileStream fs = new FileStream(name, FileMode.CreateNew);
    //转换为字节写入数据(可写入中文)
    Byte[] info = new UTF8Encoding(true).GetBytes("This is some text in the file.");
    //字节数组,字节偏移量,最多写入的字节数
BinaryWriter   w   =   new   BinaryWriter(fs);
//设置要写入的偏移量
fs.Position=fs.Length;
// fs.Write(info, 0, info.Length);   这个也可以
    w.Close();
    fs.Close();
    //打开文件
    fs = new FileStream(name, FileMode.Open, FileAccess.Read);
    //读取
    BinaryReader r = new BinaryReader(fs);
    for (int i = 0; i < 11; i++)
    {
        Console.WriteLine(r.ReadInt32());
    }
    w.Close();
    fs.Close();
在将一系列二进制数如方式1写入到file.txt(二进制)文件后，打开file.txt后显示的数据二进制数有些错误，有些正确。（与存入的不一样）向文件中写入的默认（也可以设置）都是使用UTF-8编码。打开file.txt是也是默认UTF-8编码。

若将其如方式2存入二进制文件，则显示的数据一致。若将二进制数（整数）保存为文本文件出错。二进制文件是直接写入文件的（磁盘）没有经过编码和读取时的解码。

2．汉字编码转换
相关：
UNICODE是为了处理包括中文，日文等字符而提出的一种通用的字符集。最初的UNICODE为双字节字符集，即16位编码，能够包括65，536个字符。但这样的容量并不能满足所有需要，因此，现在的UNICODE已经扩展到4个字节，能够容纳1,112,064 个字符，而这些在16位之后的扩展背称为增补字符。

UTF-32、UTF-16 和 UTF-8 是 Unicode 标准的编码字符集的字符编码方案。
UTF-8 使用一至四个字节的序列对编码 Unicode 代码点进行编码
UTF-8 使用一至四个字节的序列对编码 Unicode 代码点进行编码。U+0000 至 U+007F 使用一个字节编码，U+0080 至 U+07FF 使用两个字节，U+0800 至 U+FFFF 使用三个字节，而 U+10000 至 U+10FFFF 使用四个字节。UTF-8 设计原理为：字节值 0x00 至 0x7F 始终表示代码点 U+0000 至 U+007F（Basic Latin 字符子集，它对应 ASCII 字符集）。这些字节值永远不会表示其他代码点，这一特性使 UTF-8 可以很方便地在软件中将特殊的含义赋予某些 ASCII 字符。

　GB2312(1980年)一共收录了7445个字符，包括6763个汉字和682个其它符号。汉字区的内码范围高字节从B0-F7，低字节从A1-FE，占用的码位是72*94=6768。其中有5个空位是D7FA-D7FE。当然也可以表示数字和字符（一个字节，与ASCII表示相同）。

要读取一个以GB2312编码的包含汉字、数字、字母的二进制文件。
String strName =Encoding.GetEncoding("gb2312").GetString(name,0,i) ;
// name是读取的二进制数组。
这样就能将二进制数组转换为汉字、数字或字母

同样：也可以将包含汉字、数字、字母的字符串转换为二进制数组保存到二进制文件。
String unicodeString =   "备用43E";
Byte[] encodedBytes = Encoding.GetEncoding("gb2312").GetBytes(unicodeString);

当然也可以进行二进制数组与UNICODE，UTF-8等编码方式的转换
Byte[] encodedBytes = utf8.GetBytes(unicodeString);
String decodedString = utf8.GetString(encodedBytes);

UnicodeEncoding unicode = new UnicodeEncoding();
Byte[] encodedBytes = unicode.GetBytes(unicodeString);
String decodedString = unicode.GetString(encodedBytes);

本文来自CSDN博客，转载请标明出处：http://blog.csdn.net/Daisy423XU/archive/2006/10/13/1333151.aspx

阅读(2522) | 评论(0) | 转发(0) |

上一篇：C# 中关于汉字与16进制转换的代码

下一篇：VRML教程及VRML Script学习

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6