string是C++标准库的一个重要的部分,主要用于字符串处理。该类提供了上百个成员函数,本文并不逐一实现,只是实现部分 function 的功能。
如下,_str 标识字符串的指针,_size标识的是字符串长度,_capacity表示当前对象的最大存储容量,npos是在erase函数(删除单个字符或者字符串)里使用的,和 string 类的标准用法一样。
private:char* _str;int _size; // 目前的长度,不包括 \0int _capacity; // 最大容量,不包括最后一个 \0static size_t npos;
如下,要使用初始化列表。同时,在这里需要注意几个点。
同时,_str 开辟 _capacity+1 长度的空间还有一个原因,就是为了方便析构,因为析构是使用delete[ ] 的,如果 _str = new char; 会导致 new 和 delete 不匹配。
string(const char* s = ""):_size(strlen(s)) {_capacity = _size == 0 ? 3 : _size + 1;_str = new char[_capacity+1];strcpy(_str, s);}
析构函数应该不需要过多解释,如下。
~string(){delete[] _str;_str = nullptr;_size = 0;_capacity = 0;}
这两个函数要使用 const 修饰成员函数,一方面,该函数不需要改变对象里的任何值;另一方面,如果静态成员函数内部 需要调用该函数,要保证可以被调用(静态成员函数内部 不可以 调用非静态的成员函数和成员变量)。
int size()const{return _size;}char* getstr()const{return _str;}
如下,strcpy 会自动复制 \0 ,所以不需要担心最后的 \0 问题。
string(const string& s):_size(s._size), _capacity(s._capacity){_str = new char[_capacity + 1];strcpy(s._str, _str);}
赋值重载的注意点和代码如下。
string operator=(const string& s){if (_str != s._str){//delete[] _str; // 这样写并不好,可能会new失败//_str = new char[s._capacity];//_size = s._size;//_capacity = s._capacity + 1;char* tmp = new char[s._capacity + 1];strcpy(tmp, s._str);_str = tmp;_size = s._size;_capacity = s._capacity + 1;}return *this;}
如下,迭代器的设计可以使用函数重载,分别是静态和非静态。反向迭代器设计较为复杂,这里先不做介绍。
typedef char* iterator;typedef const char* const_iterator;const_iterator begin()const{return _str;}const_iterator end()const{return _str + _size;}iterator begin(){return _str;}iterator end(){return _str + _size;}
与此同时,迭代器中的 begin 设计完成之后,就可以使用范围 for 。范围 for 这个语法糖,必须要在类里面实现 begin ,函数名不能有错,也不能出现大写。
for (auto ch : s2) {cout << ch << " ";}
如下,对于直接使用方括号取值,可以重载,因为涉及到能改变和不能改变所取的值。
同时,对于比较运算符的重载,可以直接复用。
但是也要用 const 修饰成员函数,可以看 >= 重载的函数体内部和注释。
char& operator[](size_t pos){assert(pos < _size);return _str[pos];}const char& operator[](size_t pos)const{assert(pos < _size);return _str[pos];}bool operator>(const string& s)const{return strcmp(_str, s._str) > 0;}bool operator==(const string& s)const{return strcmp(_str, s._str) == 0;}bool operator>=(const string& s)const{return (*this > s) || (s == *this); // 如果不设为const,这样会报错,因为 s 调用 == ,静态成员调用非静态成员函数}bool operator<(const string& s)const{return !(*this >= s);}bool operator<=(const string& s)const{return !(*this > s);}
首先,reserve 函数是将对象进行扩容,使其可以存储更多的数据,但是并不会更改原有的数据,所以其函数内部不涉及 _size 的修改。
pushback,尾插一个字符。
append,尾插字符串,先将一部分字符串后移,再插入。
当然了,我们更喜欢使用的是 += ,可以直接调用 pushback 和 append。
void reserve(int n) // 扩容,不改变数据{char* tmp = new char[n + 1];strcpy(tmp, _str);delete[] _str;_str = tmp;_capacity = n;}void pushback(char ch){if (_size + 1 > _capacity){reserve(_capacity*2);}_str[_size] = ch;_size++;_str[_size] = '\0';}void append(const char* str){int len = strlen(str);if (_size + len > _capacity){reserve(_size + len);}strcpy(_str + _size, str); // 如果使用strcat,这个函数需要自己去找 \0 ,比较浪费时间_size += len;}string& operator+=(const char ch){pushback(ch);return *this;}string& operator+=(const char* str){append(str);return *this;}
insert 函数重载,在任意位置插入单个字符或者字符串。
需要注意的是,insert是通过下标来访问和插入的,同时,存储下标的数据类型是 size_t ,无符号整形,该类型数据不会有负数,当取到理论上的 -1 时,实际上时它所能存储的最大正整数。如下图。
所以在 insert() 函数的第一个 while 循环语句上面,size_t end = _size +1 ; 这样子的话,最后end 的位置就是在下标为 1 的地方,不会变成 ffff (十六进制)而导致死循环。
那么为什么不直接用 int 类型的数据呢?因为参数 pos 是 size_t (STL标准里面也是这样),end 和 pos 比较,会把 end 当成 size_t 的类型和 pos 比,这里旨在模拟 STL 实现 string,所以要尽可能地贴合标准库。
erase 函数是在任意的位置删除任意长度的字符。
string& insert(size_t pos, const char ch){assert(pos <= _size);if (_size + 1 > _capacity){reserve(_capacity * 2);}size_t end = _size + 1;while (end > pos){_str[end] = _str[end - 1];--end;}_str[pos] = ch;_size++;return *this;}string& insert(size_t pos, const char* str){assert(pos <= _size);int len = strlen(str);if (_size + len > _capacity){reserve(_size + len);}size_t end = _size+len;while (end > pos + len - 1){_str[end] = _str[end - len];--end;}strncpy(_str + pos, str, len);_size += len;return *this;}string& erase(size_t pos, size_t len = npos){assert(pos <= _size);// 要删除的内容大于等于pos之后的长度if (len == npos || pos + len >= _size) // 要判断 len == npos ,否则如果 pos+len 溢出就麻烦了{_str[pos] = '\0';_size = pos;}else // 要删除的内容没有超过最后一个字符{strcpy(_str + pos, _str + pos + len);_size -= len;}return *this;}
在流插入的时候,不可以直接 in>>ch; 要当成一个字符一个字符输入,因为 cin 会把空格和换行当作是字符串之间的分割符,不会将其当作一个完整的字符串,所以要使用 istream 类里面的 get 函数,该函数可以拿到空格和换行,不会将其当作间隔处理 。
此外,如果输入字符串过长,每一次都 += ,可能会需要频繁扩容,空间消耗比较大,所以可以设计一个缓冲区
,存储满之后将缓冲区里面的数据放到 s 里面。当然,while 循环结束后也要判断缓冲区是否为空,因为可能最后一次没有将缓冲区填满,而导致没有将最后一段字符串放到 s 里面。
istream& operator>>(istream& in, string& s){s.clear(); // 要输入之前先清空char ch = in.get(); char buff[128]; // 缓冲区int i = 0;while (ch != ' ' && ch != '\n'){buff[i++] = ch;if (i == 127) // 满了,最后一个位置放 \0 ,然后将缓冲区的数据放到s里面{buff[127] = '\0';s += buff;i = 0;}ch = in.get(); }if (i) // 缓冲区还有数据没有存到s里面的情况{buff[i] = '\0';s += buff;}return in;}ostream& operator<<(ostream& out, const string& s){// 自己写了迭代器,就可以使用范围 for 了,可以不用友元函数for (auto ch : s){out << ch;}return out;}
如下,是 string 类的源代码,将它放到一个命名空间里面,为了防止和标准库里面的某些名字冲突。
#define _CRT_SECURE_NO_WARNINGS
#pragma once
#include
#include
#includenamespace simulate
{class string{public:typedef char* iterator;typedef const char* const_iterator;const_iterator begin()const{return _str;}const_iterator end()const{return _str + _size;}iterator begin(){return _str;}iterator end(){return _str + _size;}// string(const char* s = nullptr) 是不可以的,传参 '\0' 也不可以。因为cout对于char*类型的,是一直读到 \0 为止string(const char* s = ""):_size(strlen(s)) // 如果同时初始化_capacity,会导致按照申明的顺序初始化,顺序改动会造成随机值{_capacity = _size == 0 ? 3 : _size + 1;_str = new char[_capacity+1];strcpy(_str, s);}string(const string& s):_size(s._size), _capacity(s._capacity){_str = new char[_capacity + 1];strcpy(s._str, _str);}string operator=(const string& s){if (_str != s._str){char* tmp = new char[s._capacity + 1];strcpy(tmp, s._str);_str = tmp;_size = s._size;_capacity = s._capacity + 1;}return *this;}char* c_str()const{return _str;}char& operator[](size_t pos){assert(pos < _size);return _str[pos];}const char& operator[](size_t pos)const{assert(pos < _size);return _str[pos];}int size()const{return _size;}bool operator>(const string& s)const{return strcmp(_str, s._str) > 0;}bool operator==(const string& s)const{return strcmp(_str, s._str) == 0;}bool operator>=(const string& s)const{return (*this > s) || (s == *this); // 如果不设为const,这样会报错,因为 s 调用 == ,静态成员调用非静态成员函数}bool operator<(const string& s)const{return !(*this >= s);}bool operator<=(const string& s)const{return !(*this > s);}void resize(size_t n,char ch='\0'){// 删除数据,保留前n个if (n < _size){_size = n;_str[_size] = '\0';}else if (n > _size) // 不用考虑 n = _size 的情况,因为这种情况不需要改变任何值{if (n > _capacity){reserve(n);}size_t i = _size;while (i < n){_str[i] = ch;i++;}_size = n;_str[_size] = '\0';}}void reserve(size_t n) // 扩容,不改变数据{char* tmp = new char[n + 1];strcpy(tmp, _str);delete[] _str;_str = tmp;_capacity = n;}void pushback(char ch){if (_size + 1 > _capacity){reserve(_capacity*2);}_str[_size] = ch;_size++;_str[_size] = '\0';}void append(const char* str){int len = strlen(str);if (_size + len > _capacity){reserve(_size + len);}strcpy(_str + _size, str); // 如果使用strcat,这个函数需要自己去找 \0 ,比较浪费时间_size += len;}string& operator+=(const char ch){pushback(ch);return *this;}string& operator+=(const char* str){append(str);return *this;}string& insert(size_t pos, const char ch){assert(pos <= _size);if (_size + 1 > _capacity){reserve(_capacity * 2);}size_t end = _size + 1;while (end > pos){_str[end] = _str[end - 1];--end;}_str[pos] = ch;_size++;return *this;}string& insert(size_t pos, const char* str){assert(pos <= _size);int len = strlen(str);if (_size + len > _capacity){reserve(_size + len);}size_t end = _size+len;while (end > pos + len - 1){_str[end] = _str[end - len];--end;}strncpy(_str + pos, str, len);_size += len;return *this;}string& erase(size_t pos, size_t len = npos){assert(pos <= _size);// 要删除的内容大于等于pos之后的长度if (len == npos || pos + len >= _size) // 要判断 len == npos ,否则如果 pos+len 溢出就麻烦了{_str[pos] = '\0';_size = pos;}else // 要删除的内容没有超过最后一个字符{strcpy(_str + pos, _str + pos + len);_size -= len;}return *this;}void swap(string& s){std::swap(_str, s._str);std::swap(_size, s._size);std::swap(_capacity, s._capacity);}size_t find(const char ch,size_t pos=0){assert(pos <= _size);for (int i = pos; i < _size; i++){if (_str[ch] = i) return i;}return npos;}size_t find(const char* str, size_t pos = 0){assert(pos < _size);char* p = strstr(_str, str);if (p == nullptr){return npos;}return p - _str;}void clear(){_str[0] = '\0';_size = 0;}~string(){delete[] _str;_str = nullptr;_size = 0;_capacity = 0;}private:char* _str;int _size; // 目前的长度,不包括 \0int _capacity; // 最大容量,不包括最后一个 \0static const size_t npos; };const size_t string::npos = -1;istream& operator>>(istream& in, string& s){s.clear(); // 要输入之前先清空char ch = in.get(); char buff[128]; // 防止频繁扩容,缓冲区int i = 0;while (ch != ' ' && ch != '\n'){buff[i++] = ch;if (i == 127) // 满了,最后一个位置放 \0 ,然后将缓冲区的数据放到s里面{buff[127] = '\0';s += buff;i = 0;}ch = in.get(); }if (i) // 缓冲区还有数据没有存到s里面的情况{buff[i] = '\0';s += buff;}return in;}ostream& operator<<(ostream& out, const string& s){// 自己写了迭代器,就可以使用范围 for 了,可以不用友元函数for (auto ch : s){out << ch;}return out;}}