Chinaunix首页 | 论坛 | 博客
  • 博客访问: 97353
  • 博文数量: 34
  • 博客积分: 10
  • 博客等级: 民兵
  • 技术积分: 225
  • 用 户 组: 普通用户
  • 注册时间: 2011-03-14 09:52
文章分类

全部博文(34)

文章存档

2022年(2)

2017年(15)

2016年(17)

我的朋友

分类: C/C++

2016-05-25 12:30:19

用std::string取代char*


 本文主要针对那些有C语言背景知识,而现在开始使用C++语言编程的程序员。事实上,C++继承了大多数C语言的功能,但有些方面还是不得不要留意的,如new和delete取代了malloc和free,且C++还使用了STL容器类来静态或动态地分配数组。本文中要讲的是用std::string来取代char*,将会演示C风格数组带来的一系列问题,及如何使用std::string来避免这些问题。


 避免“病态”的char数组声明

 当声明一个char数组时,许多程序员都会这样做:


char* name = "marius";


 乍看起来好像没什么问题,但如果想让字符串首字符大写,最简单的实现方法是:


name[0] = 'M';


 代码生成时没有问题,但在运行时会崩溃,因为这是未定义的行为,且依赖于编译器的实现(在VS2005中,可通过编译,但在运行时会崩溃)。对此的解答是:“marius”是一个文字上的字符串,且存储于程序的数据区,“name”只是一个指向数组的指针,因为存储字符串的数据区为只读,所以不允许你修改它。正确的声明形式应该像下面这样:


const char* name = "marius";


 这样一来,只要试图修改其中的一个字符,都会被编译器发现,并抛出一个错误:cannot modify a constant variable。


 “令人讨厌”的C风格方法

 可用char[]来定义一个定长的字符数组:


char name[] = "marius";
name[0] = 'M';


 在本例中,name是一个7字符的数组(包括终止符),其由字符串“marius”进行初始化,具有读写权限。
 现在,试着用strcat()衔接一个字符串:


char name[] = "marius";
strcat(name, " bancila");


 但程序只要一运行就会崩溃,因为strcat不能确定缓冲区是否可以装下追加的字符串,导致数组越界破坏了内存。
 当然了,你也可声明一个更大的数组来解决这个问题,只要保证它能放下所有的字符就行了,比如说,50个字符长度应该可以放下一个英文名了:


char name[50] = "marius";
strcat(name, " bancila");


 这就行了,但如果有Carlos Marìa Eduardo García de la Cal Fernàndez Leal Luna Delgado Galván Sanz这样的名字呢,而且这只是单个西班牙名,另外还有内存空间浪费的问题,如果声明了100个字符长度,平均使用只有20,那一份十万个名字的列表,要浪费800万字节了。


 动态分配内存

 那么接下来就是寻找动态分配内存最合适的方法:


char* name = new char[strlen("marius")+1];
strcpy(name, "marius");


 在此例中,你可重新分配所需的内存,如下所示:


char* temp = new char[strlen(name) + strlen(" bancila") + 1];
strcpy(temp, name);
strcat(temp, " bancila");

delete [] name;
name = temp;


 这需要编写及维护更多的代码,另外,在涉及到类时,情况会变得更加复杂。


 确保类中内存的正确处理

 如果有一个Person类,它存储了人名,你的第一个反应它可能会像下面这样:


class Person
{
   char* name;
};


 好像看上去没什么问题,但这个类还应有:

? 一个构造函数,它可以接受一个字符串来初始化name;
? 一个自定义的拷贝构造函数,以确保深拷贝(默认的拷贝构造函数由编译器提供,它是浅拷贝,也就是说,当从一个对象中复制全部属性的值到一个对象时,它只复制了指针,而不是指向的所有对象)。
? 一个自定义的 operator=
? 一个析构函数,负责清理动态分配的内存


把这些整合起来之后,Person类就会像下面这样:


class Person
{
   char* name;
public:
   Person(const char* str)
   {
      name = new char [strlen(str)+1];
      strcpy(name, str);
   }

   Person(const Person& p)
   {
      name = new char [strlen(p.name)+1];
   }

   Person& operator=(const Person& p)
   {
      if(this != &p)
      {
         delete [] name;

         name = new char [strlen(p.name)+1];
         strcpy(name, p.name);
      }

      return *this;
   }

   ~Person()
   {
      delete [] name;
   }
};


 还是std::string省事

 标准模板库(STL)提供了一个std::string类,其是std::basic_string的一个特化,它是一个容器类,可把字符串当作普通类型来使用,并支持比较、连接、遍历、STL算法、复制、赋值等等操作,这个类定义在头文件中。

 使用std::string的好处在于:

1、 易于分配、复制及连接。

std::string name = "marius";  // 由赋值进行初始化
name += " bancila";           // 连接
std::string copy = name;      // 复制


2、 可用length()或size()方法确定字符串的长度,这两个方法是一样的,第二个方法只是为了保持STL容器类的一致性。

std::string name = "marius";
std::cout << "length=" << name.length() << std::endl;
std::cout << "length=" << name.size()   << std::endl;


3、 检查是否为空值。

std::string name;
if(name.empty())
   std::cout << "empty string";


4、 支持比较。

if(name == "marius")
{
}

if(name.compare("marius") == 0)
{
}
 方法campre进行大小写敏感的比较,以确定两个字符串是否相等,或其中一个在词典顺序上小于另一个。它的返回值与strcmp()的返回值代表的意义一样:负值表示操作数小于参数字符串,而正值表示操作系统数大于它,0表示相等。另外,还有6个重载版本可允许比较字符串的某一部分:


if(name.compare(0, 3, "mar") == 0)
{
   std::cout << "match";
}


5、 重载操作符 << 和 >>,可从流中读写字符串。

std::string name;
std::cin  >> name;    // 从控制台中读name
std::cout << name;    // 向控制台写name


6、 易于访问字符串中的字符。

std::string name = "marius";
name[0] = 'M';
name[name.length()-1] = 'S';


7、 遍历所有字符,这可由C风格的索引或STL迭代子来完成(如果无需修改,应使用const_iterator)。

std::string name = "marius";

for(size_t i = 0; i < name.length(); ++i)
   std::cout << name[i];

for(std::string::const_iterator cit = name.begin(); cit != name.end(); ++cit)
   std::cout << *cit;

for(std::string::iterator it = name.begin();it != name.end(); ++it)
   *it = toupper(*it);


8、 删除字符串的某一部分。

std::string name = "marius bancila";
// 删除第6个元素之后的所有东西
name.erase(6, name.length() - 6);


9、 在指定位置插入字符串或字符。

std::string name = "marius";
// 在结尾插入
name.insert(name.length(), " bancila");
name.insert(name.length(), 3, '!');


10、在字符串结尾插入其他元素。

std::string name = "marius";
name.push_back('!');


11、两个字符串值的快速交换。

std::string firstname = "bancila";
std::string lastname = "marius";
firstname.swap(lastname);

std::cout << firstname << ' ' << lastname << std::endl;


12、使用c_str()方法只读访问其内部字符数组缓冲区,可在接受字符指针(是否const都行)作参数的函数中使用std::string对象。

void print(const char* name)
{
   std::cout << name << std::endl;
}

std::string name = "marius";
print(name.c_str());

void makeupper(char* array, int len)
{
   for(int i = 0; i < len; ++i)
      array[i] = toupper(array[i]);
}

std::string name = "marius";
makeupper(&name[0], name.length());


13、使用STL算法

std::string name = "marius";
// 使字符串全为大写
std::transform(name.begin(), name.end(), name.begin(),toupper);
std::string name = "marius";
// 升序排列字符串
std::sort(name.begin(), name.end());
std::string name = "marius";
// 反转字符串
std::reverse(name.begin(), name.end());
bool iswhitespace(char ch)
{
   return  ch == ' ' || ch == '/t' || ch == '/v' ||
           ch == '/r' || ch == '/n';
}

std::string name = " marius  ";
// 删除空白字符
std::string::iterator newend = std::remove_if(name.begin(), name.end(), iswhitespace);
name.erase(newend);


14、也可用头文件中的std::stringstream来构建字符串。

std::stringstream strbuilder;
strbuilder << "1 + 1 = " << 1+1;
std::string str = strbuilder.str();


 来回顾一下前面的Person类,如果用std::string替换了char*,那么剩下的工作只需编写一个构造函数就行了,其他的由编译器来完成,在本例中,复制字符串时使用了浅拷贝,这足够了,因为这个动作触发了std::string的operator=,它会正确地复制字符串。


class Person
{
   std::string name;
public:
   Person(const std::string& str)
   {
      name = str;
   }
};

Person p1("marius");
// works because std::string has a constructor that takes a const
// char*

Person p2("bancila");
p1 = p2;


 结论

 本文既不是std::string的文档,也不是其辅导书,只是恳求大家使用std::string。用标准模板库中的std::string来取代C风格数组可使代码看上去更简洁、更自然、更易于阅读及维护,也不必担心动态内存分配等问题,由此可忽略一些不必要的细节问题(如内存管理),而集中精力于编程的重要方面,试下吧。

阅读(1848) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~