C 语言

关注公众号 jb51net

关闭
首页 > 软件编程 > C 语言 > C++ string使用和实现

C++ string字符串的使用和简单模拟实现

作者:萧瑟其中~

C语言中,字符串是以'\0'结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数和字符串是分离的,本文给大家介绍了C++ string字符串的使用和简单模拟实现,感兴趣的朋友可以参考下

前言

本文讲解string串的使用和一些简单的模拟实现,内容丰富,干货多多!

1. string简介

C语言中,字符串是以'\0'结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数和字符串是分离的。不符合面向对象程序设计的思想,而且底层空间需要用户自己管理,如果不细心,容易访问越界。

所以C++标准库以string类来表示字符串,更加简单,方便。

  1. 字符串是表示字符序列的对象。
  2. 标准string类通过类似于标准字节容器的接口提供了对此类对象的支持,但添加了专门设计用于操作单字节字符串的特性。
  3. string类是basic_string类模板的实例化,该模板使用char(即字节)作为其字符类型,具有默认的char_traits和allocator类型(有关模板的更多信息,请参阅basic_string)。
  4. 请注意,该类处理字节独立于所使用的编码:如果用于处理多字节或变长字符序列(如UTF-8),则该类的所有成员(如length或size)及其迭代器仍将以字节(而不是实际编码的字符)进行操作。

2. string的使用和简单模拟实现

2.1 string类的定义

string类是本贾尼C++之父实现的,但是初次实现难免有许多不足,如接口函数过多,接口函数重载过多,导致string类十分复杂。我们对string类进行简单的模拟实现,不过是实现一些常用的接口函数,主要是粗浅地了解其中的原理。

#define _CRT_SECURE_NO_WARNINGS 
#pragma once
#include <iostream>
#include <assert.h>
using namespace std;
 
namespace Rustle
{
	class string
	{
	public:
		typedef char* iterator;
		typedef const char* const_iterator;
 
		iterator begin();
		iterator end();
		const_iterator begin() const;
		const_iterator end() const;
 
        //构造函数
		//string();
		string(const char* str = "");
        //拷贝构造函数
		string(const string& s);
        //赋值拷贝函数
		//string& operator=(const string& s);
		string& operator=(string tmp);
        //析构函数
		~string();
 
		void swap(string& s);
		const char* c_str() const;
		size_t size() const;
 
		char& operator[](size_t pos);
		const char& operator[](size_t pos) const;
 
		void reserve(size_t n);
		void push_back(char ch);
		void append(const char* str);
 
		string& operator+=(char ch);
		string& operator+=(const char* str);
 
		void insert(size_t pos, char ch);
		void insert(size_t pos, const char* str);
		void erase(size_t pos, size_t len = npos);
 
		size_t find(char ch, size_t pos = 0);
		size_t find(const char* str, size_t pos = 0);
		string substr(size_t pos = 0, size_t len = npos);
 
		bool operator<(const string& s)const;
		bool operator>(const string& s)const;
		bool operator<=(const string& s)const;
		bool operator>=(const string& s)const;
		bool operator==(const string& s)const;
		bool operator!=(const string& s)const;
		void clear();
	private:
		char* _str = nullptr;//置空
		size_t _size = 0;
		size_t _capacity = 0;
 
		const static size_t npos;
    };
 
	istream& operator>>(istream& is, string& str);
	ostream& operator<<(ostream& os, const string& str);
}
	
 

2.2 string(),~string()和c_str()

namespace Greg
{
   //1.
    string::string(const char* str)
		:_str(new char[strlen(str) + 1])
        ,_size(strlen(str))
        ,_capacity(strlen(str))
	{
		assert(str);
		strcpy(_str, str);
	}
 
    //2.
    string::string(const char* str)
		:_size(strlen(str))
        ,_str(new char[_size + 1])
        ,_capacity(_size)
	{
		assert(str);
		strcpy(_str, str);
	}
 
	//全缺省构造函数
    string::string(const char* str)
		:_size(strlen(str))
	{
		assert(str);
 
		//初始化列表和函数内部初始化混合着用
		_str = new char[_size + 1];
		_capacity = _size;
		strcpy(_str, str);
	}
 
	string::~string()
	{
		delete[] _str;
		_str = nullptr;
		_size = _capacity = 0;
	}
 
	const char* string::c_str() const
	{
		return _str;
	}
}

写一个测试函数,也放在Rustle命名空间中,这样就string前面不用加域名限制符。

namespace Rustle
{
	void test_string1()
	{
		string s1("hello world");
		cout << s1.c_str() << endl;
    }
}

运行结果如下:

2.2 size,重载符号[ ],begin和end函数

    string::iterator string::begin()
	{
		return _str;
	}
 
	string::iterator string::end()
	{
		return _str + _size;
	}
 
	string::const_iterator string::begin() const
	{
		return _str;
	}
 
	string::const_iterator string::end() const
	{
		return _str+ _size;
	}
 
	size_t string::size() const
	{
		return _size;
	}
 
	char& string::operator[](size_t pos)
	{
		assert(pos < _size);
		return _str[pos];
	}
 
	const char& string::operator[](size_t pos) const
	{
		assert(pos < _size);
		return _str[pos];
	}
}

写一个测试函数,用下标访问,迭代器访问,还有范围for循环访问。范围for的底层就是需要识别有没有begin和end函数。

	void test_string1()
	{
		string s1("hello world");
		cout << s1.c_str() << endl;
 
		for (size_t i = 0; i < s1.size(); i++)
		{
			cout << s1[i] << " ";
		}
		cout << endl;
 
		for (auto e : s1)
		{
			cout << e << " ";
		}
		cout << endl;
 
		string::iterator it1 = s1.begin();
		while (it1 != s1.end())
		{
			cout << *it1 << " ";
			++it1;
		}
		cout << endl;
 
		const string s3("xxxxxx");
		string::const_iterator it2 = s3.begin();
		while (it2 != s3.end())
		{
			cout << *it2 << " ";
			++it2;
		}
		cout << endl;
	}

运行结果如下:

2.3 push_back,reserve,append,+=运算符重载

接口函数声明如下,其中+=运算符重载函数有两个重载,针对的是字符和字符串的。

		void reserve(size_t n);
		void push_back(char ch);
		void append(const char* str);
 
		string& operator+=(char ch);
		string& operator+=(const char* str);
	void string::reserve(size_t n)
	{
		if (n > _capacity)
		{   //给斜杠0预留一个位置
			char* tmp = new char[n + 1];
			strcpy(tmp, _str);
			delete[] _str;
 
			_str = tmp;
			_capacity = n;
		}
	}
 
	void string::push_back(char ch)
	{
		if (_size == _capacity)
		{
			size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;
			reserve(newcapacity);
		}
 
		_str[_size] = ch;
		_str[_size + 1] = '\0';//单独处理斜杠0
		++_size;
	}
 
	void string::append(const char* str)
	{
		size_t len = strlen(str);
		if (_size + len > _capacity)
		{
		    reserve(_size + len);
		}
 
		strcpy(_str + _size, str);
		_size += len;
	}
 
    //复用push_back和append函数
	string& string::operator+=(char ch)
	{
		push_back(ch);
		return *this;
	}
 
	string& string::operator+=(const char* str)
	{
		append(str);
		return *this;
	}

写个测试函数,测试刚刚是模拟实现的函数。

	void test_string2()
	{
		string s1("hello world");
		cout << s1.c_str() << endl;
 
		s1.push_back('x');
		cout << s1.c_str() << endl;
 
		s1.append("aaaaaa");
		cout << s1.c_str() << endl;
 
		s1 += 'y';
		cout << s1.c_str() << endl;
 
		s1 += "dfsdf";
		cout << s1.c_str() << endl;
 
	}

运行结果如下:

2.4 insert和erase函数

class string
{
public:
    void insert(size_t pos, char ch);
	void insert(size_t pos, const char* str);
	void erase(size_t pos, size_t len = npos);
 
private:
	const static size_t npos;
}
 
    const size_t string::npos = -1;
 
//1.
void string::insert(size_t pos, char ch)
{
	assert(pos <= _size);
	if (_size == _capacity)
	{
		size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;
		reserve(newcapacity);
	}
 
	//size_t无符号整数遇到大于等于有坑
	size_t end = _size + 1;
	while (end > pos)
	{
		_str[end] = _str[end - 1];
		--end;
	}
	_str[pos] = ch;
	++_size;
}
 
//2.
void string::insert(size_t pos, char ch)
{
	assert(pos <= _size);
	if (_size == _capacity)
	{
		size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;
		reserve(newcapacity);
	}
 
    int end = _size;
	while (end >= (int)pos)
	{
		_str[end + 1] = _str[end];
		--end;
	}
	_str[pos] = ch;
	++_size;
}
 
//1.
void string::insert(size_t pos, const char* str)
{
	assert(pos <= _size);
 
	size_t len = strlen(str);
	if (_size + len > _capacity)
	{
		reserve(_size + len);
	}
 
	size_t end = _size + len;
	while (end > pos + len - 1)//!(pos + len - 1)
	{
		_str[end] = _str[end - len];
		--end;
	}
	memcpy(_str + pos, str, len);
	_size += len;
}
 
//2.
void string::insert(size_t pos, const char* str)
{
	assert(pos <= _size);
 
	size_t len = strlen(str);
	if (_size + len > _capacity)
	{
		reserve(_size + len);
	}
 
	int end = _size;
	while (end >= (int)pos)
	{
	    _str[end + len] = _str[end];
		--end;
	}
	memcpy(_str + pos, str, len);
	_size += len;
}
 
void string::erase(size_t pos, size_t len)
{
	assert(pos < _size);
 
	if (pos + len >= _size)
	{
		_str[pos] = '\0';
		_size = pos;
	}
	else
	{
		strcpy(_str + pos, _str + pos + len);
		_size -= len;
	}
}

写个测试函数。测试一下模拟实现的函数。

	void test_string3()
	{
		string s1("hello world");
		cout << s1.c_str() << endl;
 
		s1.insert(0, 'x');
		cout << s1.c_str() << endl;
 
		string s2("helloworld");
		s2.insert(5, "xxxx");
		cout << s2.c_str() << endl;
 
		s2.erase(5, 4);
		cout << s2.c_str() << endl;
	}

运行结果如下:

2.5 find和substr函数

函数原型如下,find函数是查找某个字符或者字符串的位置,查找到返回该字符的下标位置或者该字符串第一个字符的位置。如果没有找到返回-1,是一个极大的数。substr函数是从pos位置开始,取下原字符串的子串,返回一个string类的对象。

    size_t find(char ch, size_t pos = 0);
	size_t find(const char* str, size_t pos = 0);
	string substr(size_t pos = 0, size_t len = npos);
	size_t string::find(char ch, size_t pos)
	{
		for (size_t i = 0; i < _size; i++)
		{
			if (_str[i] == ch)
				return i;
		}
		return npos;
	}
 
	size_t string::find(const char* str, size_t pos)
	{
		const char* end = strstr(_str, str);
 
		return end - _str;
	}
 
	string string::substr(size_t pos, size_t len)
	{
		//子串长度大于从原字符串给定位置开始到结束的长度,直接拷贝返回
		if (len > _size - pos)
		{
			string sub(_str + pos);
			return sub;
		}
		else
		{
			string sub;
			sub.reserve(len);
			for (size_t i = 0; i < len; i++)
			{
				sub += _str[pos + i];
			}
 
			return sub;
		}
	}

写一个测试用例,用于分割网址。

	void test_string4()
	{
		string s1("helloworld");
		cout << s1.find('o') << endl;
		cout << s1.find("orl") << endl;
		
		string url("https://legacy.cplusplus.com/reference");
		size_t pos1 = url.find(":");
		string url1 = url.substr(0, pos1);
		cout << url1 << endl;
 
		size_t pos2 = url.find('/', pos1 + 3);
		string url2 = url.substr(pos1 + 3, pos2 - (pos1 + 3));
		cout << url2 << endl;
 
		string url3 = url.substr(pos2 + 1);
		cout << url3 << endl;
 
	}

运行结果如下:

2.6 比较运算符的重载

	bool operator<(const string& s)const;
	bool operator>(const string& s)const;
    bool operator<=(const string& s)const;
	bool operator>=(const string& s)const;
	bool operator==(const string& s)const;
	bool operator!=(const string& s)const;

比较运算符,是比较字符的ASCii码值,可以写完<和==的逻辑,然后其他进行复用。

	bool string::operator<(const string& s)const
	{
		return strcmp(_str, s._str) < 0;
	}
 
	bool string::operator>(const string& s)const
	{
		return !(*this < s) && !(*this == s);
	}
 
	bool string::operator<=(const string& s)const
	{
		return *this < s || *this == s;
	}
 
	bool string::operator>=(const string& s)const
	{
		return *this < s || *this == s;
	}
 
	bool string::operator==(const string& s)const
	{
		return strcmp(_str, s._str) == 0;
	}
 
	bool string::operator!=(const string& s)const
	{
		return !(*this == s);
	}

2.7 cout<<和cin>>运算符重载

重载流插入<<和流提取>>这两个操作符,是为了方便打印和输入。并且这是放在全局的函数。

	istream& operator>>(istream& is, string& str);
	ostream& operator<<(ostream& os, const string& str);
	ostream& operator<<(ostream& os, const string& str)
	{
		for (size_t i = 0; i < str.size(); i++)
		{
			os << str[i];
		}
 
		return os;
	}
 
    void string::clear()
	{
		_str[0] = '\0';
		_size = 0;
	}
 
    istream& operator>>(istream& is, string& str)
	{
		//空格和换行表示多个值的分割
		//is >> ch; //scanf("%c", &ch);
 
		str.clear();
		int i = 0;
		char buff[128];
		char ch = is.get();
 
		while (ch != ' ' && ch != '\n')
		{
			buff[i++] = ch;
			//0~126的位置放字符了,留一个位置给斜杠0
			//减少频繁扩容
			if (i == 127)
			{
				buff[i] = '\0';
				str += buff;
				i = 0;
			}
 
			ch = is.get();
		}
 
		if (i != 0)
		{
			buff[i] = '\0';
			str += buff;
		}
 
		return is;
	}

写个测试函数。

	void test_string7()
	{
		//string s1("hello world");
		string s1;
		cout << s1 << endl;
 
		cin >> s1;
		cout << s1 << endl;
	}

 运行结果如下:

总结

以上就是C++ string字符串的使用和简单模拟实现的详细内容,更多关于C++ string使用和实现的资料请关注脚本之家其它相关文章!

您可能感兴趣的文章:
阅读全文