# 1 基类需要定义虚析构函数

根据开发场景,继承类有两种情况:

  • 继承类是别人写的,那么继承类可能会有析构函数,如果调用以下代码,那么继承类的析构函数不会被调用:

    BaseClass* = new InheritedClass;
    delete BaseClass;
  • 继承类是自己写的,开发者可能会觉得继承类不需要析构函数,因此可以不给基类加虚析构函数。但随着需求的变化,可能继承类添加了析构函数。如果开发者没同时给基类加虚析构函数,那么就会出问题。

最佳实践:基类应该总是定义虚析构函数,不管当前需析构函数是否是有用的。

注:

  • 如果该基类不需要多态析构(比如基类没有虚函数,或者基类本意不希望显式分配任何对象等),那么该基类的析构函数应该是 protected 且不是 virtual 的。

    不过有一个特殊情况,如果在使用子类时,用到了 unique_ptr,比如:

    std::unique_ptr<BaseClass> b = std::make_unique<InheritedClass>();

    因为 std::unique_ptr 强制需要'std::unique_ptr<BaseClass>' 里的 BaseClass 提供 public 的析构函数,因此以上语句会编译出错。具体原因可查看这个答案。针对 unique_ptr 的这个限制,我尝试寻找过解决方法,比如这个答案,其中有一个是在基类添加 friend std::unique_ptr<BaseClass>。但正如 Peter 所说,std::unique_ptr<BaseClass> 的用法只会调用基类的虚构函数 (因为 BaseClass 的析构函数是 non-virtual)。因此,针对这种特殊情况,我们可以采用 protected 的虚析构函数 + friend std::default_delete<BaseClass>。(virtual 的原因是 std::unique_ptr 使用 deleter 时,能找到对应的子类析构函数,不过在 shared_ptr 中就不存在这种情况)。

    关于何时不需要析构函数是 virtual 的,可参考这个讨论中,‘sep’和‘andy’的回答。

  • 因为编译器默认会给类添加 public 且 nonvirtual 的析构函数,所以我们应该总显式定义析构函数

# 2 使用 delete 关键字删除特定类型

因为某些特殊原因,可能某个类的一个成员变量是 void*,但该变量是指向一个类实例的,那么在使用 delete 时,需要指明这个成员变量的类型,否则 delete 不能正确调用类实例对应的析构函数,造成内存泄漏等问题:

class B {
    ...
};
class A {
public:
    A(){
        m_pointer = new B;
    }
    
    ~A(){
        //delete m_pointer;  --> wrong delete
        delete (B*)m_pointer;
    }
    
    void* m_pointer;
};

# 3 shared_ptr 的参数是一个数组时,显示定义对应的释放操作

因为 shared_ptr 最终会使用 delete 关键字释放内容,所以如果内容是 new 分配的一个数组,那么程序将会出现问题。为避免这个问题,可以给 shared_ptr 具体的释放方法:

std::shared_ptr<WCHAR>(new WCHAR[nLen * sizeof(WCHAR)]{ 0 }, std::default_delete<WCHAR[]>());
// 释放方法:std::default_delete<WCHAR []>()
// 释放方法也可以写成一个 lambda

在讨论中, sysml 也给出了 c++17 的解决方法:

std::shared_ptr<WCHAR[]>(new WCHAR[nLen * sizeof(WCHAR)]{ 0 });

这样使得代码看起来更加简洁。

# 4 类的构造函数初始化所有成员变量

因为 release 版本不会自动初始化类的成员变量,所以应对所有成员变量赋默认值。

注:STL 的类会初始化(因为编译器生成的默认构造函数会初始化这些成员变量)

# 释放后的指针应该赋值为 NULL 或 nullptr

__try{
    PVOID p = VirtualAlloc(..., size, ...);
}
__finally{
    if (p != NULL){
        VirtualFree(p, ...);
        p = NULL;  // --> set p as NULL
    }
}
if (p != NULL){
    //...
}

# 5 如果类有复制构造函数或复制赋值运算符的其中一个,那必须补齐另外一个

根据 c++ 的 Law of The Big Three 规则(暂不考虑 move 语义),我们知道如果定义了以下其中一个,那么另外两个会被编译器隐式定义:

  • 析构函数
  • 复制构造函数
  • 复制赋值运算符

因此,如果一个类有复制构造函数,并且没有重载复制赋值运算符,那么会出现隐患,这个类也是危险的类:

/* wrong definition*/ 
class A{
public:
    A(){a = 1; b = new int;}
    ~A(){
        delete b;
    }
    
    A(const A& instance){
        this->a = instance.a;
        this->b = new int;
    }
    
    int a;
    int* b;
};
A a;    // a.b points to addr1
A b(a); // b.b points to addr2
b = a;  // b.b points to addr1 --> error

因为复制构造函数和重载的复制赋值运算符必须成对存在,对于 move 语义的两个方法也是一样:

class A{
public:
    A(){a = 1; b = new int;}
    ~A(){
        delete b;
    }
    
    A(const A& instance){
        Copy(instance);
    }
    A& operator=(const A& instance){
        Copy(instance);
        return *this;
    }
    
    // move semantics
    A(A&& instance){...}
    A& operator=(A&& instance){...}
    
private:
    void Copy(const A& instance){
        this->a = instance.a;
        this->b = new int;
    }
    
public:
    int a;
    int* b;
};

# 6 包含运算符的宏要用括号括起来

#define MEM_BUFFER_NUMBER 2
#define MEM_BUFFER_SIZE (sizeof(PVOID) * MEM_BUFFER_NUMBER)

# 7 引用变量需要加 &,即使是 auto

// A& GetA();
auto& A = GetA();
// 不是 auto A = GetA ();

# 8 智能指针的合理使用

智能指针在 C++ 中有几个,比如 shared_ptr,unique_ptr,auto_ptr 等,每一个都有各自的用途和其存在意义,因此开发中需要跟进实际场景,使用合适的智能指针。

根据我实际开发的场景,总结建议如下:

  • 避免所有场景都使用 shared_ptr。shared_ptr 是功能最丰富的智能指针,大部分资源的自动分配与释放都可以用 shared_ptr 解决。但如果所有场景都使用 shared_ptr,会存在如下弊端:

    • 掩盖设计:如果资源的主体是该资源唯一的拥有者,那么使用 shared_ptr 会掩盖这个背景,比如:

      class A {
      public:
          A(){m_a = new std::string("aaa");}
          ~A(){delete m_a;}
      private:
          std::string* m_a;
      }
      // 因为要管理 m_a 的分配和释放,改进后的 A 如下:
      class A {
      public:
      	A(){m_a = std::make_unique<std::string>("aaa");}    
      private:
          std::unique_ptr<std::string> m_a;
      }
      // 通过使用 unique_ptr,可以看出类 A 的实例 a 是唯一拥有 m_a 的主体,且实例 a 管理 m_a 的生命周期。
      // 如果这里使用的是 shared_ptr,那么当我们看类 A 的声明时,我们不知道 m_a 有这一层含义。

      注:

      掩盖设计只是一个小点,影响更大的是随后的开发。因为掩盖设计会影响开发者对这部分代码的理解,使得这部分代码的设计在之后的开发中越来越模糊。而这带来的最明显的后果就是降低可维护性(这里的设计可以理解成某一个设计模式,或者一个设计场景)。

      相反,如果使用 unique_ptr,那么 unique_ptr 的限制会让开发者清楚资源的拥有者,提示开发者代码的设计目标(比如资源的唯一拥有者应该是谁,资源该如何分享,该返回原指针还是资源的引用),且能保证资源的生命周期。

    • 影响软件的性能:shared_ptr 在资源的释放时机上比 unique_ptr 更晚。shared_ptr 使得资源的拥有者是多个,只有最后一个拥有者释放该资源后,资源才会被释放。

    注:何时选择哪种智能指针请参考这个回答

  • 给资源使用 unique_ptr 时,如果调用方 (caller) 想获取该资源,但不能控制其生命周期,那么返回的类型如下:

    • 如果该资源肯定存在,即不为 nullptr,那么返回资源的引用

    • 如果该资源可能为 nullptr,那么返回指向资源的指针

      // 接着 class A 的例子
      class A{
      //...
      // Return m_a
      public:
          //m_a 肯定存在的情况
          std::string& GetA() {return *m_a.get();}
          //m_a 可能为 nullptr 的情况
          std::string* GetA() {return m_a.get();}
      }

# 9 windows 平台字符集的处理

需要传输到网络的数据中,字符串应该均用 utf-8 编码。因为 windows 使用的是默认 windows ANSI 编码,所以字符串在传输中应该转为 utf-8 编码。

Windows 平台在处理字符时,默认使用的代码页 (code page) 是 CP_ACP,不是 CP_UTF8。即 windows 平台默认的字符串可能与其他机器不兼容,其他机器解析会乱码,比如字符串包含中文时。

下面是 MSDN 的描述:

Note The ANSI code pages can be different on different computers, or can be changed for a single computer, leading to data corruption. For the most consistent results, applications should use Unicode, such as UTF-8 or UTF-16, instead of a specific code page, unless legacy standards or data formats prevent the use of Unicode. If using Unicode is not possible, applications should tag the data stream with the appropriate encoding name when protocols allow it. HTML and XML files allow tagging, but text files do not.

另外,如果 windows 的系统语言是英语,那么 windows 本地的 windows ANSI 编码 (CP_ACP) 是不支持中文之类的。因此在这种情况下,需要先使用 unicode 字符集,然后再编码成 utf-8。

Windows 提供了 MultiByteToWideChar WideCharToMultiByte 这两个 winapi 用于多字节字符和 unicode 字符的转换。由于 unicode 只是一种字符的表示方式(用两个 code point 表示一个字符),并不存在编码,因此在使用上述的两个 winapi 需要注意:

  • WideCharToMultiByte 的 CodePage 参数表示将 unicode 字符串转换成哪种编码格式的多字节字符。
  • MultiByteToWideChar 的 CodePage 参数表示将哪种编码格式的多字节字符转换成 unicode 字符。如果这里提供的 codePage 错误,那么转换会成功,但结果是错误的。另外,如果多字节字符包含中文,但不是 utf-8 编码,比如是 windows ANSI 编码,那么编译的程序在中文系统是表示正确的,但是在英文系统就会乱码,因为英文系统的 windows ANSI 本地编码识别不了这些中文字符。

编程实践:

  • 在工程开始的最初,就只使用 unicode。只在显式需要的时候,再转换成 utf-8 编码的多字节字符(比如使用 json 时)。
  • 可以使用一套代码,既支持多字节也支持 unicode,在这两种字符集切换时保持 windows ANSI 的编码。只在显式需要的时候,再转换成 utf-8 编码的多字节字符。

# 10 __try 和 c++ 最好不要混用

开发中,遇到__try 需要使用类的情况,如果该类没有析构函数的时候,可以正常编译;

但如果该类有析构函数,就会编译失败,例子如下:

class CLA {
public:
	CLA():a(3) {}
	~CLA() { }
	void ss() { a = 4; }
public:
	int a;
};
int main() {
__try {
	//sstring c("aaaa");
	CLA c;
}
__finally {
	printf("1111");
}
return 0;
}

并报错:

error C2712: Cannot use __try in functions that require object unwinding

在之前的开发中,我以为是报 c++ 异常(即使用了 try 关键字)时,才会出现这个情况。因此我尝试在 CLA 的析构函数加上 noexcept,但仍然报同样的错误。

再思考下报错信息里的 require object unwinding ,这里我最初理解的是使用 try 的情况下,会做 unwinding。但根据目前的情况,应理解成如果一个类有析构函数,那么这个类的实例就需要 unwinding,即使这个析构函数从开发者的视角是不会抛异常的。

总结:在使用__try 的函数里,尽量不要使用类。

# 11 向前声明使用智能指针

先来看一段代码:

// B.h
class A;
class B {
// method declarations
private:
    std::unique_ptr<A> ptr;
// variable declarations
};
//--------------------------------
// B.cpp
#include "A.h"
// B class implementation
//--------------------------------
// main.cpp
#include "B.h"
int main() {
    B b;
    // call B's methods.
    
    return 0;
}

编译这份代码时,会报错 use of undefined type 'A' ,即没有找到 A 类的实现,所以报错了。

不过我们已经向前声明了,为什么会出现这个问题呢?

原因是使用 std::unique_ptr 时,unique_ptr 会在合适的场所调用 A 的析构函数,以下是 std::unique_ptr 的声明:

template<
    class T,
    class Deleter = std::default_delete<T>
> class unique_ptr;

根据上面的例子,按理说 B.h 不会调用 A 类的析构函数,因为我们只是声明。

接下来看一下 C++ reference documentation 中关于 std::unique_ptr 的一段描述:

std::unique_ptr may be constructed for an incomplete type T , such as to facilitate the use as a handle in the Pimpl idiom. If the default deleter is used, T must be complete at the point in code where the deleter is invoked, which happens in the destructor, move assignment operator, and reset member function of std::unique_ptr . (Conversely, std::shared_ptr can’t be constructed from a raw pointer to incomplete type, but can be destroyed where T is incomplete).

回想一下,上面的代码没有提供 B 类的析构函数,因此编译器会自动生成一个。

自动生成的析构函数会调用 A 类的析构函数,也就需要 A 类的实现了。

所以解决方法如下:

// B.h
class A;
class B {
// method declarations
public:
    ~B();
private:
    std::unique_ptr<A> ptr;
// variable declarations
};
//--------------------------------
// B.cpp
#include "A.h"
// B class implementation
B::~B(){ }

# 12 C++ nlohmann::json 获取引用类型

json a = "aa";
	const char* c = nullptr;
	{
        std::string& b = a.get<std::string>();
		c = b.c_str();
	}
	std::cout << c << "\n";

观察上面这段代码,b 获取类型为 string json 的引用,然后再获取 b 的字符串指针给变量 c。

看似没有问题,可是输出的 c 的内容是错的。再看下对应的汇编:

	const char* c = nullptr;
007BB88E  mov         dword ptr [c],0  
	{
        std::string& b = a.get<std::string>();
007BB895  lea         eax,[ebp-60h]  
007BB898  push        eax  
007BB899  lea         ecx,[a]  
007BB89C  call        nlohmann::basic_json<std::map,std::vector,std::basic_string<char,std::char_traits<char>,std::allocator<char> >,bool,__int64,unsigned __int64,double,std::allocator,nlohmann::adl_serializer,std::vector<unsigned char,std::allocator<unsigned char> > >::get<std::basic_string<char,std::char_traits<char>,std::allocator<char> >,std::basic_string<char,std::char_traits<char>,std::allocator<char> >,0> (0713D4Fh)   << 分配类实例
007BB8A1  lea         ecx,[ebp-60h]  
007BB8A4  mov         dword ptr [ebp-3Ch],ecx  
		c = b.c_str();
007BB8A7  mov         ecx,dword ptr [ebp-3Ch]  
007BB8AA  call        std::basic_string<char,std::char_traits<char>,std::allocator<char> >::c_str (071A299h)  
007BB8AF  mov         dword ptr [c],eax  
	}
007BB8B2  lea         ecx,[ebp-60h]  
007BB8B5  call        std::basic_string<char,std::char_traits<char>,std::allocator<char> >::~basic_string<char,std::char_traits<char>,std::allocator<char> > (0714466h)   << 释放类实例
	std::cout << c << "\n";

从汇编可以看出,a.get<std::string>() 返回的是一个 std::string 的类实例,并不是引用,因此当给 c 赋值的代码块执行完后,返回的 std::string 类实例就被释放了。

由此可得出 nlohmann::json 的 get 方法只能返回临时变量,如果要获取引用,需要使用 get_ref 方法,如下:

json a = "aa";
	const char* c = nullptr;
	{
        std::string& b = a.get_ref<std::string&>();
		c = b.c_str();
	}
	std::cout << c << "\n";