vector 是我們學習的第一個真正的 STL 容器,它接口的使用方式和 string 有一點點的不同,但大部分都是一樣的,所以這里我們就只演示其中一些接口的使用,大家如果有疑惑的地方直接在 cplusplus 是上面查看對應的文檔即可。
成都創新互聯專業為企業提供巴馬網站建設、巴馬做網站、巴馬網站設計、巴馬網站制作等企業網站建設、網頁設計與制作、巴馬企業網站模板建站服務,10年巴馬做網站經驗,不只是建網站,更提供有價值的思路和整體網絡服務。1、構造函數vector 提供了四種構造方式 – 無參構造、n 個 val 構造、迭代器區間構造以及拷貝構造:
其中構造函數的最后一個參數 alloc 是空間配置器,它和內存池有關,作用是提高空間分配的效率;我們日常使用時不用管這個參數,使用它的缺省值即可,但是可能有極少數的人想要用自己實現的空間配置器來代替 STL 庫提供的,所以留出了這一個參數的位置。
需要注意的是,迭代器區間構造是一個函數模板,即我們可以用其他類來構造 vector 對象:
同時,上面還有一個非常重要的細節:
2、擴容機制在 n 個 val 的構造中,val 的缺省值是 T 的匿名對象,該對象使用 T 的默認構造來初始化,而不是以 0 作為缺省值,這是因為 T 不僅僅可能是內置類型,也可能是自定義類型,比如 string、list、vector;
當 T 為自定義類型時,0 就不一定能夠對 val 進行初始化,所以我們需要使用 T 的匿名對象來調用默認構造完成初始化工作;當 T 為內置類型時,我們仍然可以以這種方式進行初始化,因為 內置類型也具有構造函數,你沒聽錯,內置類型也是有構造函數的,大家可以理解為,為了解決上面這種情況,編譯器對內置類型進行了特殊處理;
利用匿名對象調用默然構造函數來作為缺省值的方法在下面 resize、insert 等接口中也有體現。
vector 的擴容機制和 string 的擴容機制是一樣的,因為它們都是動態增長的數組:VS 下大概是 1.5 被擴容,Linux g++ 下是標準的二倍擴容,測試用例如下:
void TestVectorExpand() {size_t sz;
vectorv;
sz = v.capacity();
cout<< "making v grow:\n";
for (int i = 0; i< 100; ++i) {v.push_back(i);
if (sz != v.capacity()) { sz = v.capacity();
cout<< "capacity changed: "<< sz<< '\n';
}
}
}
3、三種遍歷方式和 string 一樣,vector 也支持三種遍歷方式 – 下標加[]遍歷、迭代器遍歷、范圍for遍歷:
需要注意的是,vector 和 string 之所以支持 下標 + [] 的方式遍歷,是因為它們底層都是數組,而數組支持隨機訪問,但是像我們后面要學習的 list set map 等容器,它們的底層不是數組,不支持隨機訪問,就只能通過迭代器和范圍 for 的方式進行遍歷了;不過,范圍 for 只是一個外殼,它在使用時也是被替換成迭代器,所以其實迭代器遍歷才是最通用的遍歷方式。
4、容量操作vector 有如下容量相關的接口:
其中,最重要的兩個函數是 reserve 和 resize,reserve 只用于擴容,它不改變 size 的大小;而 resize 是擴容加初始化,既會改變 capacity,也會改變 size;
注意:reserve 和 resize,包括后面的 clear 函數都不會縮容,因為縮容需要開辟新空間、拷貝數據、釋放舊空間,而對于自定義類型又有可能存在深拷貝問題,時間開銷極大;vector 中唯一可能縮容的函數就只有 shrink_to_fit,對于它來說,如果 capacity 大于 size,它會進行縮容,讓二者相等。
5、元素訪問vector 提供了如下接口來進行元素訪問:
其中,operator 和 at 都是返回 pos 下標位置元素的引用,且它們內部都會對 pos 的合法性進行檢查;不同的是,operator[] 中如果檢查到 pos 非法,那么它會直接終止程序,報斷言錯誤,而 at 則是拋異常;
注:release 模式下檢查不出斷言錯誤。
6、修改 – 迭代器失效vector 提供了如下接口來進行修改操作:
assign && push_back && pop_back
assign 函數用來替換 vector 對象中的數據,支持 n 個 val 替換,以及迭代器區間替換,push_back 尾插、pop_back 尾插,這些接口的使用和 string 一模一樣,這里就不再過多闡釋;
insert && erase
和 string 不同,為了提高規范性,STL 中的容器都統一使用 iterator 作為 pos 的類型,并且插入/刪除后會返回 pos:
所以,以后我們如果要在中間插入或刪除元素的話,必須配合算法庫里面的 find 函數來使用:
同時,在 VS 下,insert 和 erase 之后會導致 pos 迭代器失效,如果需要再次使用,需要更新 pos,如下:
不過,在 Linux 下不會出現這個問題:
造成這個問題的根本原因是 VS 使用的 PJ 版本對 iterator 進行了封裝,在每次 inset 和 erase 之后對迭代器進行了特殊處理,而 g++ 使用的 SGI 版本中的 iterator 是原生指針,具體細節在后文 vector 的模擬實現中我們再討論;
但是為了代碼的可移植性,我們 統一認為 insert 和 erase 之后迭代器會失效,所以,如果要再次使用迭代器,我們必須對其進行更新;我們以移除 vector 中的所有偶數為例:
swap
和 vector 一樣,由于算法庫 swap 函數存在深拷貝的問題,vector 自己提供了一個不需要深拷貝的 swap 函數,用來交換兩個 vector 對象:
同時,為了避免我們不使用成員函數的 swap,vector 還將算法庫中的 swap 進行了重載,然后該重載函數的內部又去調用成員函數 swap:
對于編程來說,學習初期進步最快的方式就是閱讀別人優秀的代碼,理解其中的邏輯和細節后自己獨立的去實現幾次,學習 STL 也是如此;我們可以適當的去閱讀 STL 的源碼,當然我們并不是要逐行的進行閱讀,因為這樣太耗費時間,況且其中很多 C++ 的語法我們也還沒學。
當前階段,我們閱讀 STL 源碼是為了學習 STL 庫的核心框架,然后根據這個框架自己模擬實現一個簡易的 vector (只實現核心接口);閱讀源碼與模擬實現能夠讓我們更好的了解底層,對 STL 做到 能用,并且 明理。
我們在 【STL簡介 – string 的使用及其模擬實現】 中對 STL 做了一些基本的介紹,知道了 STL 由原始版本主要發展出了 PJ、RW 和 SGI 版本,其中,微軟的 VS 系列使用的就是 PJ 版,但是由于其命名風格的原因,我們閱讀源碼時一般選擇 SGI 版,而且 Linux 下 gcc/g++ 也是使用的 SGI 版本,再加上侯捷老師有一本非常著名的書 《STL源碼剖析》也是使用的 SGI 版本,所以以后閱讀和模擬實現 STL 時我都使用這個版本。
《STL源碼剖析》電子版和 《stl30》源碼我都放在下面了,需要的可以自取:
STL源碼剖析:https://www.aliyundrive.com/s/Nc4mpLC43kj
stl30:https://www.aliyundrive.com/s/pnwMuB9uwEN
vector 的部分源碼如下:
//vector.h
#ifndef __SGI_STL_VECTOR_H
#define __SGI_STL_VECTOR_H
#include
#include
#include#ifdef __STL_USE_NAMESPACES
using __STD::vector;
//stl_vector.h
templateclass vector {public:
typedef T value_type;
typedef value_type* pointer;
typedef const value_type* const_pointer;
typedef value_type* iterator;
typedef const value_type* const_iterator;
typedef value_type& reference;
typedef const value_type& const_reference;
typedef size_t size_type;
typedef ptrdiff_t difference_type;
//成員函數
protected:
typedef simple_allocdata_allocator;
iterator start;
iterator finish;
iterator end_of_storage;
}
可以看到,vector.h 僅僅是將幾個頭文件包含在一起,vector 的主要實現都在 stl_vector.h 里面。
2、核心框架我們可以根據上面的 vector 源碼來得出 vector 的核心框架:
namespace thj {templateclass vector {public:
typedef T* iterator;
typedef const T* const_iterator;
public:
//成員函數
private:
T* _start;
T* _finish;
T* _end_of_storage;
};
}
可以看到,vector 的底層和 string 一樣,都是一個指針指向一塊動態開辟的數組,但是二者不同的是,string 是用 _size 和 _capacity 兩個 size_t 的成員函數來維護這塊空間,而 vector 是用 _finish 和 _end_of_storage 兩個指針來維護這塊空間;雖然 vector 使用指針看起來難了一些,但本質上其實是一樣的 – _size = _finish - _start, _capacity = _end_of_storage - _start;
3、構造函數錯誤調用問題在我們模擬實現了構造函數中的迭代器區間構造和 n 個 val 構造后,我們會發現一個奇怪的問題,我們使用 n 個 val 來構造其他類型的對象都沒問題,唯獨構造 int 類型的對象時會編譯出錯,如下:
//迭代器區間構造
templatevector(InputIterator first, InputIterator last)
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{while (first != last)
{push_back(*first);
++first;
}
}
//n個val構造
vector(size_t n, const T& val = T())
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{reserve(n);
for (size_t i = 0; i< n; i++)
push_back(val);
}
這是由于編譯器在進行模板實例化以及函數參數匹配時會調用最匹配的一個函數,當我們將 T 實例化為 int 之后,由于兩個參數都是 int,所以對于迭代器構造函數來說,它會直接將 InputIterator 實例化為 int;
但對于 n 個 val 的構造來說,它不僅需要將 T 實例化為 int,還需要將第一個參數隱式轉換為 size_t;所以編譯器默認會調用迭代器構造,同時由于迭代器構造內部會對 first 進行解引用,所以這里報錯 “非法的間接尋址”;
解決方法有很多種,比如將第一個參數強轉為 int,又或者是將 n 個 val 構造的第一個參數定義為 int,我們這里和 STL 源碼保持一致 – 提供第一個參數為 int 的 n 個 val 構造的重載函數:
//n個val構造
vector(size_t n, const T& val = T())
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{reserve(n);
for (size_t i = 0; i< n; i++)
push_back(val);
}
//n個val構造 -- 重載
vector(int n, const T& val = T())
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{reserve(n);
for (int i = 0; i< n; i++)
push_back(val);
}
4、insert 和 erase 迭代器失效問題我們模擬實現的 insert 和 erase 函數如下:
//任意位置插入
iterator insert(iterator pos, const T& x)
{assert(pos >= _start);
assert(pos<= _finish);
//擴容導致 pos 迭代器失效
if (size() == capacity())
{size_t oldPos = pos - _start; //記錄pos,避免擴容后pos變為野指針
size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
reserve(newCapacity);
pos = _start + oldPos; //擴容之后更新pos
}
iterator end = _finish - 1;
while (end >= pos)
{*(end + 1) = *end;
--end;
}
*pos = x;
++_finish;
return pos;
}
//任意位置刪除 -- erase 之后也認為 pos 迭代器失效
iterator erase(iterator pos)
{assert(pos >= _start);
assert(pos< _finish);
iterator begin = pos;
while (begin< _finish - 1)
{*begin = *(begin + 1);
++begin;
}
--_finish;
return pos;
}
我們在 vector 的使用中就提到 VS 下 insert 和 erase 后迭代器會失效,再次訪問編譯器會直接報錯,這是因為 PJ 版本下 iterator 不是原生指針,如下:
可以看到,VS 中的迭代器是一個類,當我們進行 insert 或者 erase 操作之后,iterator 中的某個函數可能會將 pos 置為空或者其他操作,導致再次訪問 pos 報錯,除非我們每次使用后都更新 pos:
而 Linux 下的 g++ 卻不會出現這樣的問題,因為 g++ 使用的是 SGI 版本,該版本的源碼我們在上面也已經見過了,其迭代器是一個原生指針,同時它內部 insert 和 erase 接口的實現也和我們模擬的類似,可以看到,我們并沒有在函數內部改變 pos (改變也沒用,因為這是形參),所以 insert、erase 之后 pos 可以繼續使用;
但是這里也存在一個問題,insert 和 erase 之后 pos 的意義變了 – 我們插入元素后 pos 不再指向原來的元素,而是指向我們新插入的元素;同樣,erase 之后 pos 也不再指向原來的元素,而是指向該元素的后一個元素;特別是當 erase 尾部的數據后,pos 就等于 _finish 了;
那么對于不了解底層的人就極易寫出下面這樣的代碼 – 刪除 vector 中的所有偶數:
可以看到,第一個由于刪除元素后 pos 不再指向原位置,而是指向下一個位置,所以 erase 之后會導致一個元素被跳過,導致部分偶數沒有被刪除,但好在末尾是奇數,所以程序能夠正常運行;
但是第二個就沒那么好運了,由于最后一個元素是偶數,所以 erase 之后 pos 直接指向了 _finish 的下一個位置,循環終止條件失效,發生越界。
綜上,為了保證程序的跨平臺性,我們統一認為 insert 和 erase 之后迭代器失效,必須更新后才能再次使用。
5、reserve 函數的淺拷貝問題除了上面這兩個問題之外,我們的 vector 還存在一個問題 – reserve 函數 深層次的淺拷貝問題,模擬實現的 reserve 函數如下:
void reserve(size_t n)
{if (n >capacity()) //reserve 函數不縮容
{T* tmp = new T[n];
memcpy(tmp, _start, sizeof(T) * size());
size_t oldSize = _finish - _start; //記錄原來的size,避免擴容不能確定_finish
delete[] _start;
_start = tmp;
_finish = _start + oldSize;
_end_of_storage = _start + n;
}
}
很多同學看到這段代碼的時候可能會認為它沒問題,的確,對于內置類型來說它確實是進行了深拷貝,但是對于需要進行深拷貝的自定義類型來說它就有問題了,如下:
程序報錯的原因如圖:當 v 中的元素達到4個再進行插入時,push_back 內部就會調用 reserve 函數進行擴容,而擴容時我們雖然對存放 v1 v2 的空間進行了深拷貝,但是空間里面的內容我們是使用 memcpy 按字節拷貝過來的,這就導致原來的 v 里面的 string 元素和現在 v 里面的元素指向的是同一塊空間。
當我們拷貝完畢之后使用 delete[] 釋放原空間,而 delete[] 釋放空間時對于自定義類型會調用其析構函數,而 v 內部的 string 對象又會去調用自己的析構函數,所以 delete[] 完畢后原來的 v 以及 v 中各個元素指向的空間都被釋放了,此時現在的 v 里面的每個元素全部指向已經釋放的空間。
從第一張圖中我們也可以看到,最后一次 push_back 之后 v 里面的元素全部變紅了;最終,當程序結束自動調用析構函數時,就會去析構剛才已經被釋放掉的 v 中的各個 string 對象指向的空間,導致同一塊空間被析構兩次,程序出錯。
所以,在 reserve 內部,我們不能使用 memcpy 直接按字節拷貝原空間中的各個元素,因為這些元素可能也指向一塊動態開辟的空間,而應該調用每個元素的拷貝構造進行拷貝,如圖:
具體代碼實現如下:
//擴容
void reserve(size_t n)
{if (n >capacity()) //reserve 函數不縮容
{T* tmp = new T[n];
//memcpy(tmp, _start, sizeof(T) * size()); //error
//memcpy有自定義類型的淺拷貝問題,需要對每個元素使用拷貝構造進行深拷貝
for (int i = 0; i< size(); i++)
tmp[i] = _start[i]; //拷貝構造
size_t oldSize = _finish - _start; //記錄原來的size,避免擴容不能確定_finish
delete[] _start;
_start = tmp;
_finish = _start + oldSize;
_end_of_storage = _start + n;
}
注意:有的同學看到這里使用的是賦值運算符就認為這里調用的賦值重載,其實不是的,因為這里完成的是初始化工作,編譯器會自動轉換為調用拷貝構造函數。
6、模擬 vector 整體代碼在了解了 vector 的核心框架以及解決了上面這幾個疑難點之后,剩下的東西就變得很簡單了,所以我這里直接給出結果,大家可以根據自己實現的對照一下,如有錯誤,也歡迎大家指正:
//vector.h
#pragma once
#include#include
#include#include
namespace thj {//防止命名沖突
templateclass vector {public:
typedef T* iterator;
typedef const T* const_iterator;
public:
//-------------------------------------constructor---------------------------------------//
//無參構造
vector()
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{}
//迭代器區間構造
templatevector(InputIterator first, InputIterator last)
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{ while (first != last)
{ push_back(*first);
++first;
}
}
//n個val構造
vector(size_t n, const T& val = T())
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{ reserve(n);
for (size_t i = 0; i< n; i++)
push_back(val);
}
//n個val構造 -- 重載
vector(int n, const T& val = T())
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{ reserve(n);
for (int i = 0; i< n; i++)
push_back(val);
}
//拷貝構造 -- 寫法1
//vector(const vector& v)
//{// T* tmp = new T[v.capacity()];
// memcpy(tmp, v._start, sizeof(T) * v.capacity());
// _start = tmp;
// _finish = _start + v.size();
// _end_of_storage = _start + v.capacity();
//}
//拷貝構造 -- 寫法2
//vector(const vector& v)
// : _start(nullptr)
// , _finish(nullptr)
// , _end_of_storage(nullptr)
//{// reserve(v.capacity());
// for (size_t i = 0; i< v.size(); i++)
// push_back(v[i]);
//}
//拷貝構造 -- 現代寫法
vector(const vector& v)
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{ vectortmp(v.begin(), v.end()); //復用構造函數和swap函數
swap(tmp);
}
//析構函數
~vector() { delete[] _start;
_start = _finish = _end_of_storage = nullptr;
}
//賦值重載
vector& operator=(vectorv) //復用拷貝構造,存在自我賦值的問題,但不影響程序正確性
{ swap(v);
return *this;
}
//----------------------------------iterator---------------------------------------//
iterator begin()
{ return _start;
}
iterator end()
{ return _finish;
}
const_iterator begin() const
{ return _start;
}
const_iterator end() const
{ return _finish;
}
//-------------------------------------capacity----------------------------------------//
size_t size() const
{ return _finish - _start;
}
size_t capacity() const
{ return _end_of_storage - _start;
}
bool empty() const
{ return _start == _finish;
}
//擴容
void reserve(size_t n)
{ if (n >capacity()) //reserve 函數不縮容
{ T* tmp = new T[n];
//memcpy(tmp, _start, sizeof(T) * size()); //error
//memcpy有自定義類型的淺拷貝問題,需要對每個元素使用拷貝構造進行深拷貝
for (int i = 0; i< size(); i++)
tmp[i] = _start[i]; //拷貝構造
size_t oldSize = _finish - _start; //記錄原來的size,避免擴容不能確定_finish
delete[] _start;
_start = tmp;
_finish = _start + oldSize;
_end_of_storage = _start + n;
}
}
//擴容并初始化
void resize(size_t n, T x = T())
{ if (n >capacity()) //resize 不縮容
{ reserve(n);
}
if (n >size())
{ while (_finish< _start + n)
{*_finish = x;
++_finish;
}
}
if (n< size())
{ _finish = _start + n;
}
}
//----------------------------------------element access---------------------------------//
T& operator[](size_t pos)
{ assert(pos< size()); //檢查越界
return _start[pos];
}
const T& operator[](size_t pos) const
{ assert(pos< size());
return _start[pos];
}
//----------------------------------------modifys-----------------------------------------//
//尾插
void push_back(const T& n)
{ if (size() == capacity())
{ size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
reserve(newCapacity);
}
*_finish = n;
++_finish;
}
//尾刪
void pop_back()
{ assert(!empty());
--_finish;
}
//任意位置插入 -- 插入后認為迭代器失效
iterator insert(iterator pos, const T& x)
{ assert(pos >= _start);
assert(pos<= _finish);
//擴容會導致迭代器失效
if (size() == capacity())
{ size_t oldPos = pos - _start; //記錄pos,避免擴容后pos變為野指針
size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
reserve(newCapacity);
pos = _start + oldPos; //擴容之后更新pos
}
iterator end = _finish - 1;
while (end >= pos)
{ *(end + 1) = *end;
--end;
}
*pos = x;
++_finish;
return pos;
}
//任意位置刪除 -- erase 之后也認為 pos 迭代器失效
iterator erase(iterator pos)
{ assert(pos >= _start);
assert(pos< _finish);
iterator begin = pos;
while (begin< _finish - 1)
{ *begin = *(begin + 1);
++begin;
}
--_finish;
return pos;
}
//交換兩個對象
void swap(vector& v)
{ std::swap(_start, v._start); //復用算法庫的swap函數
std::swap(_finish, v._finish);
std::swap(_end_of_storage, v._end_of_storage);
}
void clear()
{ _finish = _start;
}
private:
T* _start;
T* _finish;
T* _end_of_storage;
};
}
你是否還在尋找穩定的海外服務器提供商?創新互聯www.cdcxhl.cn海外機房具備T級流量清洗系統配攻擊溯源,準確流量調度確保服務器高可用性,企業級服務器適合批量采購,新人活動首月15元起,快前往官網查看詳情吧
分享標題:【C++】vector的使用及其模擬實現-創新互聯
URL地址:http://vcdvsql.cn/article6/dshiog.html
成都網站建設公司_創新互聯,為您提供虛擬主機、網站排名、靜態網站、品牌網站制作、自適應網站、網站設計
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯