编程我只用CPP 发布的文章

排序算法之计数排序

作者: 编程我只用CPP
时间: 2019-04-27
分类: 数据结构和算法
评论

一、计数排序

其基本思想为：假设n个输入的元素中的每一个都是在0到k之间的一个整数，对于每一个输入元素x，确定小于x的元素个数，直接把x放在它输出的数组中的位置上。例如有17个元素小于x，则x就应该在数组的第18个位置上。当有几个元素相同时，这一方案就要略作修改，不能都放在同一个位置上。

计数排序需要提供两个辅助数组用来计数，一个用来保存已经排好序的元素，一个用来保存每个元素在数组中出现的次数。计数排序是不稳定的排序算法，时间复杂度(n)，空间复杂度是O(n + k)，其中k是排序数组元素的范围。

例如以下数组A：

在通过计数后，得到的辅助数组C为：

对于元素1而言，它前面有两个0，因此排序后它的位置在第三个，即下标为2的位置上，但是它的数量为0，就不应该给他排序。而元素2是有的，它的位置应该是0的数量和1的数量（如果有元素1的话）之和的后面一位，在这里是第3位，下标为2。这里类似斐波那契数列：每个元素都等于前面两个的和。

因此，有必要对辅助数组C做处理，设置其所在的位置为前面所有元素数量之和，这样就不用每次都重新计算前面的数量了（参考斐波那契数列计算）：

要注意的是，对于2这个元素来说，它出现了两次，如果不做特殊处理，它们处的位置都是第四个位置。要想办法把两个2分别放到自己合适的位置上去。可以采取的办法是从后往前排序，每排完一个数字，当前数字的值减一。

图例：

第一步，A的最后一个元素是3，得到C[3]的值为7，把3先放到第7个位置，并把C[3]的值减一：

第二步，现在A的最后一个元素（未排序的）是0，得到C[0]为2，放到第二个位置，C[0]减一：

第三步，重复以上步骤，直到A中所有的元素都排序完毕：

此时，整个数组就是有序的了。

二、计数排序的代码实现

// 数据可能出现的最大值
const unsigned int max_val = 100;
void count_sort(int data[], const unsigned int n) {
    // 计数数组
    int cnt[max_val] = {0};
    // 生成辅助数组
    int *tmp = new int[n];
    unsigned int i;

    // 初始化计数数组
    for (i = 0; i < n; i++) {
        cnt[data[i]]++;
    }

    // 累加所有的数量
    for (i = 1; i < max_val; i++) {
        cnt[i] += cnt[i - 1];
    }

    // 计数排序
    for (i = n - 1; i >= 0 && i < n; i--) {
        tmp[cnt[data[i]] - 1] = data[i];
        cnt[data[i]]--;
    }

    // 拷贝辅助数组到排序数组
    for (i = 0; i < n; i++) {
        data[i] = tmp[i];
    }
}

排序算法三：堆排序

作者: 编程我只用CPP
时间: 2019-04-27
分类: 数据结构和算法
评论

一、堆排序原理

通过最大堆的性质可以知道：一个堆中最大的元素总是在堆顶的，即数组下标0的位置。基于这一点，我们可以每次都把堆中的最大值提取出来，放到当前数组的后面。然后重新构建最大堆，重复这个过程，以此来完成一个数组的排序。

例如，一个已知的最大堆为：

堆排序-1

把最大的元素16提取出来，放到最后。然后重新建堆，此时堆中最大的元素为15，更新后的堆为：

堆排序-2

再把15提取出来，重新建堆，得到：

最大堆-3

如此往复，直到最后堆中的元素只有一个，就完成了整个数组的排序。

二、代码实现

堆排序的关键点在于构造堆，如何构造堆可参考数据结构之堆。基于模板的最大堆化函数实现：

template <typename T>
static void max_heapify(T *data, size_t len, size_t idx) {
    size_t largest, lchild, rchild;

    lchild = LCHILD(idx);
    rchild = RCHILD(idx);

    if (lchild < len && data[lchild] > data[idx])
        largest = lchild;
    else
        largest = idx;

    if (rchild < len && data[rchild] > data[largest])
        largest = rchild;

    if (idx != largest) {
        my_swap(data[idx], data[largest]);
        max_heapify(data, len, largest);
    }
}

实现堆排序，堆排序的关键点在于从后往前排：

template <typename T>
static void heap_sort(T *data, size_t len) {
    size_t i, mid;
    mid = len / 2;

    // 建堆
    for (i = mid - 1; i >= 0 && i < len; i--) {
        max_heapify(data, len, i);
    }

    // 堆排序，从后往前
    for (i = len - 1; i >= 1; i--) {
        my_swap(data[i], data[0]);
        max_heapify(data, --len, 0);
    }
}

时间复杂度

堆排序的时间主要消耗再建堆上面，每次拿掉一个元素之后，都重新执行最大堆化。

每次构造最大堆的时间复杂度为O(log(n))，因此堆排序的总时间复杂度为n(log(n))，n代表元素个数。

数据结构之堆

作者: 编程我只用CPP
时间: 2019-04-27
分类: 数据结构和算法
评论

一、堆

堆是一种数据结构，通常通常所说的堆即二叉堆。二叉堆是一个数组，可以被看成一个完全二叉树，如下图所示：

他在数组中的表现形式为：

通过数组很容易得到每个父节点和其子节点的关系，假设数组的起始下标为0，那么有：

PARENT(i) = (i - 1) / 2  --> 如下标1和2的数组元素，其父节点是下标0的元素。
LEFT_CHILD(i) = (i * 2) + 1   
RIGHT_CHILD(i) = (i * 2) + 2  -->如下标为0的数组元素，其左右子节点的下标分别是1和2。

因此可以直接在程序中定义：

#define PARENT(i) ((i - 1) >> 1)
#define LEFT_CHILD(i) (((i) << 1) + 1)
#define RIGHT_CHILD(i) (((i) << 1 ) + 2)

二、最大堆和最小堆

堆有最大堆和最小堆之分，在最大堆中，除了根节点以外的所有节点i都要满足：A[PARENT[i]] >= A[i]，所有的子节点的值不会超过其父节点的值。因此，在最大堆中，最大的元素存放在根节点中。

而最小堆和最大堆相反，除了根节点以外的所有节点i都要满足：A[PARENT[i]] <= A[i]，所有子节点的值都大于等于其根节点的值。因此，最小堆中根节点的元素是最小的。

在堆排序算法中，使用的是最大堆，最小堆通常用于构造优先级队列。

以最大堆为例，其包含的操作为：

MAX_HEAPIFY：用来维护一个最大堆。
BUILD_MAX_HEAP：从一堆无序的数组中构造出一个最大堆。
HEAPSORT：执行一次堆排序过程。

三、最大堆

3.1 维护最大堆

把一个堆构造成最大堆的流程：

从A[i], A[LEFT[i]], A[RIGHT[i]]中选出最小的，保存其下标largest
如果largest不等于i，交换A[i]和A[largest]

以下图为例，当前堆中4处于一个非正确的位置：

首先把4和其儿子中最大的14交换，得到以下堆：

交换后4依旧不是最小的元素，继续交换4和8：

4当前已经是叶子节点了，此时对4的最大堆化操作就完成了。并且此时的堆也就是一个最大堆。

不难看出：对一个高度为h的树来说，这个操作的时间复杂度为O(h)。

对应的c代码：

static void _max_heapify(int *data, const uint len, const uint i) {
    unsigned int lchild, rchild;
    unsigned int largest;

    lchild = LEFT_CHILD(i);
    rchild = RIGHT_CHILD(i);

    // 得到父子节点中最小的元素
    if (lchild < len && data[i] < data[lchild])
        largest = lchild;
    else
        largest = i;

    if (rchild < len && data[largest] < data[rchild])
        largest = rchild;

    // 交换最小的元素
    if (i != largest) {
        swap_int(&data[i], &data[largest]);
        _max_heapify(data, len, largest);
    }
}

3.2 建堆

建堆的过程实际上是执行多次MAX_HEAPIFY，我们只需对2/n以内的元素都执行MAX_HEAPIFY操作即可完成一个最大堆的构建。

因为[n/2, n)之间的元素都是叶子节点，所以无需对它们进行转换操作。

要注意的是建堆必须从下往上，否则可能出现堆只是局部有效，对全局而言并非有效：

以上图为例，如果从上到下建堆，在调整完4的位置之后，14被放在了树根。而实际上被放在树根的应该是16，因为接下来就不会调整14了，它的位置就永远不对，这个堆也就不是一个符合要求的堆。

代码：

static void _build_max_heap(int *data, const uint len) {
    int i;
    for (i = (len / 2) - 1; i >= 0; i--) {
        _max_heapify(data, len, i);
    }
}

四、堆排序

参考：排序算法之堆排序

随机输出100以内的不重复数字-Fisher-Yates shuffle洗牌算法

作者: 编程我只用CPP
时间: 2019-04-24
分类: 数据结构和算法
评论

题目要求：随机输出100以内的不重复数字

解法一：暴力求解

最简单也最容易想到的解法：

创建含有100个元素的数组data[100]，全部置零
生成100以内的随机数r
如果data[r]等于0，设置data[r]=1
如果data[r]等于1，重复第二步

此算法的时间复杂度为O(n^2)，越到后面，碰撞的机会也越来越大，最坏的情况下，时间复杂度远不止O(n^2)。

解法二：Fisher-Yates shuffle洗牌算法

算法的逻辑为：

创建一个长度为n的数组（假设下标从1开始），每个元素的值都置为其下标
设max=n，从n开始到1逐步递减
生成[1, max]之间的随机数r，把data[r]和data[max]交换，max减一
重复第三步，直到max小于1

2.1 过程图解

假设要生生十个随机数，创建十个元素的数组，初时时的状态为：

+--+--+--+--+--+--+--+--+--+--+
| 1| 2| 3| 4| 5| 6| 7| 8| 9|10|
+--+--+--+--+--+--+--+--+--+--+
                             ^
                            max

逐步生成随机数的过程：

max = 10, r = 3
        +--------------------+
        v                    v
+--+--+--+--+--+--+--+--+--+--+
| 1| 2|10| 4| 5| 6| 7| 8| 9| 3|
+--+--+--+--+--+--+--+--+--+--+

max = 9, r = 7
                    +-----+
                    v     v
+--+--+--+--+--+--+--+--+--+--+
| 1| 2|10| 4| 5| 6| 9| 8| 7: 3|
+--+--+--+--+--+--+--+--+--+--+

max = 8, r = 1
  +--------------------+
  v                    v
+--+--+--+--+--+--+--+--+--+--+
| 8| 2|10| 4| 5| 6| 9| 1: 7| 3|
+--+--+--+--+--+--+--+--+--+--+

max = 7, r = 5
              +-----+
              v     v
+--+--+--+--+--+--+--+--+--+--+
| 8| 2|10| 4| 9| 6| 5: 1| 7| 3|
+--+--+--+--+--+--+--+--+--+--+

...

2.2 代码实现

void shuffle(int *data, int n) {
    int i, r;
    for (i = 0; i < n; i++) {
        data[i] = i;
    }
    for (i = n; i > 0; i--) {
        r = rand() % n;
        swap(&data[r], &data[i - 1]); // 交换
    }
}

单测案例：

TEST(SHUFFLE_TEST, FEATURE_TEST) {
    int i, data[TEST_NODE_COUNT], verify[TEST_NODE_COUNT];
    shuffle(data, TEST_NODE_COUNT);
    memset(verify, 0, sizeof(int) * TEST_NODE_COUNT);
    for (i = 0; i < TEST_NODE_COUNT; i++) {
        verify[data[i]] ++;
    }
    for (i = 0; i < TEST_NODE_COUNT; i++) {
        ASSERT_EQ(verify[i], 1) << verify[i];
    }
}

int main(int argc, char **argv) {
    srand(time(NULL));

    testing::InitGoogleTest(&argc, argv);

    RUN_ALL_TESTS();
    return 0;
}

vs中避免extern "C"缩进

作者: 编程我只用CPP
时间: 2019-04-24
分类: Windows
评论

在visual studio中，使用extern "C"语句会导致后面的整个代码块都被缩进：

对强迫症患者来说这里看起来很不舒服，而且使用这个语句也只是为了使C兼容CPP，本身写的就是C而已，并不希望这里有缩进。

解决方案：

#ifndef __BST_TREE_H__
#define __BST_TREE_H__

#ifdef __cplusplus
extern "C" {
#endif
// 添加下面三行
#if 0
}
#endif

struct bst_tree_node_st {
};

#if 0
{
#endif
#ifdef __cplusplus
}
#endif

#endi

STL中的set和map存结构体的问题

作者: 编程我只用CPP
时间: 2019-04-21
分类: 编程语言
评论

STL中的map和set默认时不支持存结构体的，如果要添加结构体的支持，必须手动重载<运算符。

原因：map和set底层都是通过红黑树实现的，红黑树搜索树的一种，插入数据时要比较大小，所以结构体必须重载小于号

示例：

#include <iostream>
#include <string>
#include <set>

using namespace std;

typedef struct stu_st {
    string name;
    int age;
}stu_t;

int main() {
    set<stu_t> stu_infos;

    stu_t a, b;
    a.name = "xiaoming";
    a.age = 20;

    b.name = "xiaohua";
    b.age = 21;

    stu_infos.insert(a);
    stu_infos.insert(b);

    cout << stu_infos.size() << endl;

    return 0;
}

以上代码在vs下编译报错：

问题很明确，没有重载<符号，添加上以下代码即可：

bool operator<(const stu_t& a, const stu_t& b) {
    return a.name < b.name;
}

进程中堆和栈的区别

作者: 编程我只用CPP
时间: 2019-04-21
分类: 编程语言
评论

一、申请方式

栈是系统自动申请，自动释放。
堆需要手动申请，手动释放。

二、增长方向

栈是从高地址向地地址增长
堆从地地址到高地址增长

三、存储位置

栈的内存空间在用户空间的最顶端，3G以下
堆位于全局静态区，在栈的下面

四、大小限制

栈可分配的内存大小较小
堆中可分配的内存较大

五、申请效率

栈内存申请较快，不会产生碎片
堆内存申请较慢，会产生碎片

C++面向对象编程常见面试题

作者: 编程我只用CPP
时间: 2019-04-21
分类: 编程语言
评论

面向对象的原则是什么？

封装、继承和多态

C++的空类默认产生哪些类成员函数？

默认构造函数、析构函数、复制构造函数和赋值函数

为什么拷贝构造函数只能传递引用

以传值方式调用函数时，会拷贝临时变量，此时又会调用拷贝构造函数来构造临时变量，从而出现无限循环。

哪一种成员变量可以在所有该类的实例之间共享？

静态成员变量

C++中class和struct的区别
如何在类中使用常量成员变量？

使用const修饰的成员变量，必须在初始化列表中初始化。

把析构函数定义成virtual的意义在哪？

当析构函数被定义成virtual的以后，销毁父类对象时，会先执行子类的析构函数，销毁掉子类对象。

为什么构造函数不能被定义成virtual的？

虚函数内部是通过虚函数表来实现的，在执行时能通过vptr指针指向正确的子类对象函数。而在创建对象时，必须要知道创建对象的准确类型，因此构造函数不能为虚。

析构函数可以时内联函数吗？

可以

C++中static关键字的作用

作者: 编程我只用CPP
时间: 2019-04-21
分类: 编程语言
评论

static关键字的作用：

修饰局部变量：使得该变量在函数运行完后不会被释放，一直存在于整个程序的运行周期。
限制函数或者变量的作用域：在某一模块内声明的static变量或者函数无法被其他模块使用，例如使用static修饰的全局变量其他模块不能使用，static修饰的函数其他模块也不能使用。
作为类成员函数或者变量：被static修饰过的成员变量或函数生存在整个程序周期中，所有的类共享同一个静态成员。使用前必须在类外部手动定义该变量，并且被static修饰过后无法访问类里面的this指针

八大排序算法

作者: 编程我只用CPP
时间: 2019-04-21
分类: 数据结构和算法
评论

一、基本排序算法

二、高级排序算法

三、各排序算法的比较

各排序算法总结

排序算法	平均时间复杂度	最好情况时间复杂度	最坏情况时间复杂度	空间复杂度	是否稳定	适用场景
插入排序	O($n^2$)	O(n)，当序列已经有序时	O($n^2$)，序列逆序时。	O(1)	是	数组大部分有序
选择排序	O($n^2$)	O($n^2$)	O($n^2$)	O(1)	否	数据量较小的情况
冒泡排序	O($n^2$)	O($n^2$)	O($n^2$)	O(1)	是	数据量较小的情况
希尔排序	O(n^(1.3~2))	O(n^(1.3~2))	O(n^(1.3~2))	O(1)	否	增量序列的选取会影响排序时间，希尔排序没有快速排序算法快，中等大小规模表现良好，对规模非常大的数据排序不是最优选择，但是比O($n^2$)复杂度的算法快。
快速排序	O(nlogn)	O(nlogn)	哨兵选择为边界值时，O($n^2$)	O(nlogn)	否	不适合元素较小的数组排序
堆排序	O(nlogn)	O(nlogn)	O(nlogn)	O(n)	否	需要大量的移动操作，且要额外的空间保存已排序数组
计数排序	O(n)	O(n)	O(n)	O(n*2)	否	假设数组元素都在0-k的范围内，并且需要两个辅助数组，如果数据分布不均匀，出现一个特别大的数据会导致额外的空间增加。
归并排序	O(nlogn)	O(nlogn)	O(nlogn)	O(n)	是	合并时需要额外的内存空间
基数排序	O (nlog(r)m)，其中r为所采取的基数，而m为堆数	O (nlog(r)m)	O (nlog(r)m)	O(r*m)	是	需要额外的m个队列的辅助空间