比std::qsort还快的快速排序（1千万整数1.7秒）——（快速排序栈溢出与递归优化）

2023-05-16

前几天发现老外的开源项目中事件队列中用的就是std::qsort排序，后续插入时候使用了堆方式。

快速排序实际应用中是比堆排序要快的，这主要是因为硬件层次会对数据执行高速缓存，

数据使用一二三级高速缓存比访问内存块很多，

所以堆排序实际上是比较慢的。

面试一般是考快速排序，

我没有事也默写了一个，并且和std::qsort与std::sort比较了一下，

代码的核心就是递归：

每个递归：

1）拿左边第一个元素作为标杆，小于的放它左侧，大于的放右侧，最后找到标杆合适的位置；

2）处理左侧；

2）处理右侧；

备注，递归深度与先后没有关系，与标杆是否平衡有关系；教科书算法没有考这些：

// 快速排序
static int GetMark(int *v, int i, int  j)
{
	int temp = v[i];
	while (i < j)
	{
		while (temp <= v[j] && i < j)
			j--;
		v[i] = v[j];
		while (temp >= v[i] && i < j)
			i++;
		v[j] = v[i];

	}
	v[i] = temp;
	return i;
}

void quickSort(int * v, int begin, int end)
{
	if (begin >= end)
		return;
	int index = GetMark(v, begin, end);
	quickSort(v, begin, index - 1);
	quickSort(v, index + 1, end);

}

这个写法是比较标准的教科书写法，下面写个计时器：

//使用高性能计时器实现的 GetTickCount 函数
double GetTickCountA()
{
	__int64 Freq = 0;
	__int64 Count = 0;

	if (QueryPerformanceFrequency((LARGE_INTEGER*)&Freq) 
		&& Freq > 0
		&& QueryPerformanceCounter((LARGE_INTEGER*)&Count))

	{
		//乘以1000，把秒化为毫秒
		return (double)Count / (double)Freq * 1000.0;
	}
	return 0.0;
}

我们用一组随机数测试一下：

// 配套的比较函数
int cmpInt(const void * a, const void * b)
{
	return *(int *)a - *(int *)b;
}

void testSort()
{
	int n = 100000;
	int * v = new int[n];

	static default_random_engine engine;
	static uniform_int_distribution<int> uniform(0, 750);
	for (int i = 0; i < n; i++)
	{
		v[i] = uniform(engine);

		//cout << v[i] << "\t";
	}
	cout << endl;

	double tms1 = GetTickCountA();
	InsertSort(v, n);
	//quickSort(v, 0, n - 1);
	//std::qsort(v, n, sizeof(int), cmpInt);
	//std::sort(v, v + n-1);

	double tms2 = GetTickCountA();
	cout << tms2 - tms1 << endl;


	/*for (int i = 0; i < n; i++)
	{
		cout << v[i] << "\t";
	}*/
	cout << "ok" << endl;
}

测试100万一下的数，其实还算好的，很快就算完了，

但是加到1000万时候，栈就崩了，vc默认的栈大小是1M，可以使用参数加载

linux设置环境变量可以加大，但是这不是解决问题的终极办法。

当随机的数类似二叉树时候，递归深度是log2(n)，但是如果分左右时候比较极端，直接考1侧分开，则深度可能达到N；

我打算看看有没有使用循环来代替的方法，但是好像应该没有；

实际上可以自己用堆上建立一个栈对象模拟递归，但是我更想知道人家怎么做到的。

1000万数据使用std::qsort时候很快，2秒多就结束了，人家没有崩溃，

std::sort非常慢，比自己写的还要慢，所以还是不要用了；

直接插入排序更慢，也不要用了；

所以很想看看qsort怎么实现的，于是我使用everything工具进行搜索，找到了微软的qsort.cpp文件，

它核心思想有3个：

1）短于8个元素，改用选择排序；

2）因为有相等的部分，找标杆时候，使用2个标杆，分为三个部分：小于，等于，大于；这样就不再继续处理等于部分了；

3）使用自定义栈来避免递归。

歌词大意是这样的：

1）当分组下降到某个临界值时候，使用短距离排序；（注释里写的插入排序，但是看代码应该是选择排序）

临界值设置为8，注释所经过了测试，发现这个数值比较合适。

#define CUTOFF 8

2）这样递归堆栈的理论的深度应该是： 1 + log2(num) - log(CUTOFF) , 即log2(num) - 2，

num= 2^32,或者2^64

那么 32-bit系统上不超过30 的栈对象， 64-bit 系统需要62个；当然这是理论上的，所以源码定义了一个值：

#define STKSIZ (8 * sizeof(void*) - 2)
// 64位机器寻址范围是2^64, 这里就是字节数*8bits, 得到最大log2(2^64)

3）于是在程序的开始自己定义了2个栈

char* lostk[STKSIZ];   // 低标志的栈大小
char* histk[STKSIZ];   // 高标志的栈大小
int stkptr = 0;        // 栈顶

4）定义栈之后，就可以开始准备手动递归了，定义一个标志，用于goto

recurse:

手动递归开始：

计算当前排序范围的距离，

5）如果长度小于8 ，则使用短距离排序，

否则：

6）使用第1个，最后1个元素，中间元素，三者进行比较，按顺序排列3个元素；

这样就用三个数定义了2个区间，lo----------mid------------hi，

比如：250----------460------------730

注释这样说：

首先我们要选择一个分区项(partition)。算法的高效性要求我们找到一个近似数组中间值的项，但我们要保证能够很快找到它。

我们选择数组的第一项、中间项和最后一项的中间值，来避免最坏情况下的低效率。

测试表明，选择三个数的中间值，比单纯选择数组的中间项的效率要高。

7）将数组分为3个部分：比分区值小，等于分区值，大于分区值；所以加了2个标记位：

char* loguy = lo;  // lo + guy
char* higuy = hi;

那么：lo --------小于分区值------------loguy ------------等于分区值------------higuy -----------------大于分区值------------------hi

方法是：

循环：满足 (higuy < loguy)

a) loguy从左向右，如果A[loguy] <= A[mid] 移动;直到 A[loguy] > A[mid] ，（其中loguy可能越过mid）,

b) higuy从右向左，如果A[higuy] >A[mid] 则向左移动;直到 A[higuy] <= A[mid]，（其中higuy一直在mid右侧）,

c) if (higuy < loguy) break; 不需要交换了，停止！！！

d）交换A[loguy] 和 A[higuy]，则 loguy左侧 <= A[mid]， higuy右侧 > A[mid]

lo -------------loguy ------------mid------------higuy -------大于-------------hi

lo---------小于等于------------mid------------大于-----------------------------hi

e）因为我们要求：higuy一直在mid右侧，

所以如果，higuy==mid，则令mid = loguy，

这样算法进入状态：loguy在mid右侧向右移动，higuy准备向左移动，

lo ----小于等于旧Amid---------[mid] --loguy===================higuy -------大于旧Amid-------------hi,

比如：

lo ----小于等于旧Amid---------500 --489,458,501===================600-------大于旧Amid-------------hi,

下面循环中，[mid] 不再移动，相当于两侧向中间移动，保证大的交换到右侧，小于等于的在左侧；

结束循环！

8）如果a[higuy] == A[mid] ，则继续左移，也就是找到相等的部分

lo ----------- higuy--------------[mid] ----------loguy------------------hi,

9）将一部分压栈，另一部分直接处理！

10）如果栈顶到负数，则结束。

简化后代码如下：

1）交换与交换排序

// 交换
void swapint(int &a, int &b)
{
	int temp = a;
	a = b;
	b = temp;
}


// 选择交换排序
void shortSort(int *v, int begin, int end)
{
	int index;  // 最大值的索引
	while (begin < end)
	{
		index = begin;   // 左侧不动，每个循环将最大的交换到最后，不稳定
		for (int i=index+1; i<=end; i++)  
		{
			if (v[i] > v[index])
			{
				index = i;
			}
		}
		if (index < end)
			swapint(v[index], v[end]);
		end--;
	}
}

2）寻找标记，分为三段：

//#define IS_PRINT_MARK2
inline void DEBUG_PRINT_MARK2(const char *str,int *v, int begin, int end, int mark1, int mark2, int mid)
{
#ifdef IS_PRINT_MARK2

	// 调试输出
	cout << str << endl;
	for (int i = begin; i <= end; i++)
	{
		if (i == mid)
		{
			cout << "[" << v[i] << "]" << "  ";
		}
		else if (i == mark2)
		{
			cout << "(" << v[i] << ")" << "  ";
		}
		else if (i == mark1)
		{
			cout << "{" << v[i] << "}" << "  ";
		}
		else if ((i+1 == mid) || (i+1 == mark2) || (i+1 == mark1) 
			 || (i - 1 == mid) || (i - 1 == mark2) || (i - 1 == mark1))
		{
			cout << v[i] << " ";
		}
		else
			cout << v[i] << "  ";
	}
	cout << endl;
#endif
}
// 分三个部分；返回mid
// 分为三段， 执行后，begin------mark2  等于部分不用处理  mark1---- - end
// 传统算法是将第1个元素作为标准，分左右，
// 这里是先选3个，第1，最后，中间，比较一下取中间作为标杆，之后执行分界
inline int Get2Mark(int *v, int& mark1, int &mark2, int begin, int end)
{
	// 这里不少于8个元素
	int count = end - begin + 1;
	int mid = begin + count / 2;
	// 冒泡法，排序3个数字
	if (v[begin] > v[mid])
		swapint(v[begin], v[mid]);

	if (v[begin] > v[end])
		swapint(v[begin], v[end]);

	if (v[mid] > v[end])
		swapint(v[mid], v[end]);

	mark1 = begin;   // 处理过了，跳过
	mark2 = end;
	DEBUG_PRINT_MARK2("准备开始：", v, begin, end, mark1, mark2, mid);

	while (true)
	{
		// 这里是分阶段的，所有要判断左右关系
		// 首先是: begin------mark1------mid------mark2-----end
		// 之后是: begin------mid------mark1------mark2-----end
		// 最后是: begin------mark2------mid------mark1-----end

		// 找到大于的 微软这么做的，但是似乎有逻辑问题，不知道为啥，
		//if (mark1 < mid)     // 1) 阶段
		//{
		//	do { mark1++; } 
		//	while (mark1 < mid && v[mark1] <= v[mid]);
		//		
		//}
		//else                // 2) 阶段
		//{   
			while (mark1 <= end && v[mark1] <= v[mid])
				mark1++;
		//}

		// 向左找到小于等于的；这里可能会越过mid，越过mark1
		while (mark2 > mid && v[mark2] > v[mid])
			mark2--;
			

		if (mark2 < mark1)   // 证明不需要交换了，这里从2阶段结束
			break;

		// 如同传统算法一样，交换一下，左边小于或者等于，右边大于
		DEBUG_PRINT_MARK2("交换前：", v, begin, end, mark1, mark2, mid);
		swapint(v[mark1], v[mark2]);
		DEBUG_PRINT_MARK2("交换后：", v, begin, end, mark1, mark2, mid);
		//cout << endl;

		// 之前1）阶段，mark1 < mid，这里不会出现mark1 == mid，直到mark2左移到mid,
		// 进入2) 阶段，begin------mid---[mark1]------[mark2]-----end
		// 此时，mid和mark1之间都是小于等于mid, 大于的都放到右侧，
		// 也就是在【mark1】 和【mark2】 位置上交换【mid】为标杆的数字，与传统算法近似但不同，
		if (mid == mark2)
			mid = mark1;
	}

	// 循环结束时候，mark2位置的数字应该是小于等于v[mid]
	// 满足：
	// 1) mark1左侧都是 <=  v[mid]; mid 也在mark1左侧；
	// 2) mark2右侧都是 >=  v[mid];
	// 3) mark2-----mark1
	// 一般来说：mark2 == mark1 - 1     
	// 如图：-[mid:10]--9--8--10--[mark2][mark1]--11--12--11--
	// 或者：v[end] == v[mid]，mark2 == end - 1, mark1 == end + 1, 
	// 如图  -[mid:10]--9--8--10--[mark2][end:10]|[mark1]   j
	// 所以要移动一次mark2
	mark2++;
	do 
	{
		mark2--;
	} while (mark2 >= begin && v[mark2] == v[mid]);
	// 连续移动后，mark2----mark1之间如果有数据，则与v[mid]相等；
	// 也可能没有；

	//cout << mid << "," << mark2 << "," << mark1 << endl;
	DEBUG_PRINT_MARK2("结束：", v, begin, end, mark1, mark2, mid);
	

	return mid;
		
}

// 检测分界是否错误；
BOOL checkMark2(int *v, int begin, int end, int mark1, int mark2, int mid)
{
	// 小于等于部分
	for (int i=begin; i<mark2; i++)
	{
		if (v[i] > v[mid])
			return  FALSE;
	}
	// 都是大于
	for (int j=mark1; j<=end; j++)
	{
		if (v[j] <= v[mid])
			return  FALSE;
	}

	return TRUE;
}
// 测试分界效果
int  testmark2()
{
	int n = 1000;
	int *v = new int[n];

	static default_random_engine engine;
	static uniform_int_distribution<int> uniform(0, 750);
	for (int i = 0; i < n; i++)
	{
		v[i] = uniform(engine);

	//	cout << v[i] << ", ";
	}
	cout << endl;

	int mark1, mark2;
	int mid = Get2Mark(v, mark1, mark2, 0, n-1);

	int ret = checkMark2(v, 0, n - 1, mark1, mark2, mid);

	if (ret == FALSE)
	{ 
	for (int i = 0; i < n; i++)
	{
		if (i == mid)
		{
			cout << "[" << v[i] << "]" << "  ";
		}
		else if (i == mark2)
		{
			cout << "(" << v[i] << ")" << "  ";
		}
		else if (i == mark1)
		{
			cout << "{" << v[i] << "}" << "  ";
		}
		else if ((i + 1 == mid) || (i + 1 == mark2) || (i + 1 == mark1)
			|| (i - 1 == mid) || (i - 1 == mark2) || (i - 1 == mark1))
		{
			cout << v[i] << " ";
		}
		else
			cout << v[i] << "  ";
	}
	cout << endl;
	cout << endl;
	}

	delete[]v;
	return ret;

	
}

这段代码和微软的流程有改动，因为测试发现微软的代码有点逻辑问题，但是没有想通，直接改了，如果有发现错误的，请告知！！

分界单独测试结果：生成30个随机数,查看与[mid], (mark2), {mark1}位置：

结果还算满意：

6, 3, 10, 9, 4, 7, 0, 6, 5, 4, 2, 3, 3, 8, 0, 5, 2, 3, 2, 7, 6, 5, 7, 8, 6, 3, 1, 7, 1, 6,

准备开始：
{5}  3 10  9  4  7  0  6  5  4  2  3  3  8  0 [6]  2 3  2  7  6  5  7  8  6  3  1  7  1 (6)

交换前：
5  3 {10}  9 4  7  0  6  5  4  2  3  3  8  0 [6]  2 3  2  7  6  5  7  8  6  3  1  7  1 (6)
交换后：
5  3 {6}  9 4  7  0  6  5  4  2  3  3  8  0 [6]  2 3  2  7  6  5  7  8  6  3  1  7  1 (10)

交换前：
5  3  6 {9}  4 7  0  6  5  4  2  3  3  8  0 [6]  2 3  2  7  6  5  7  8  6  3  1  7 (1)  10
交换后：
5  3  6 {1}  4 7  0  6  5  4  2  3  3  8  0 [6]  2 3  2  7  6  5  7  8  6  3  1  7 (9)  10

交换前：
5  3  6  1  4 {7}  0 6  5  4  2  3  3  8  0 [6]  2 3  2  7  6  5  7  8  6  3 (1)  7 9  10
交换后：
5  3  6  1  4 {1}  0 6  5  4  2  3  3  8  0 [6]  2 3  2  7  6  5  7  8  6  3 (7)  7 9  10

交换前：
5  3  6  1  4  1  0  6  5  4  2  3  3 {8}  0 [6]  2 3  2  7  6  5  7  8  6 (3)  7 7  9  10
交换后：
5  3  6  1  4  1  0  6  5  4  2  3  3 {3}  0 [6]  2 3  2  7  6  5  7  8  6 (8)  7 7  9  10

交换前：
5  3  6  1  4  1  0  6  5  4  2  3  3  3  0 [6]  2 3  2 {7}  6 5  7  8 (6)  8 7  7  9  10
交换后：
5  3  6  1  4  1  0  6  5  4  2  3  3  3  0 [6]  2 3  2 {6}  6 5  7  8 (7)  8 7  7  9  10

结束：
5  3  6  1  4  1  0  6  5  4  2  3  3  3  0 [6]  2 3  2  6  6 (5)  {7}  8 7  8  7  7  9  10

最后一个关键的函数：

// 按照微软的qsort.cpp简化处理

void ms_qsort(int * v, int begin, int end)
{
	const int CUTOFF = 8;    // 临界值
	const int STKSIZ = 100;  // 堆栈100个；
	int *lowStack = new int[STKSIZ];
	int *higStack = new int[STKSIZ];
	int  top = 0; // 栈顶，栈顶为空

	int mark1;    // 用于分段的游标
	int mark2;
	int mid;

// goto 手动递归
recurse:
	
	int count = end - begin + 1;  // 计算个数
	if (count <= 8)
	{
		shortSort(v, begin, end);   // 优化；
	}
	else   
	{
		// 第一阶段，分段；
		// 如果分段后分成3部分，就压栈一部分，剩下的递归，直到都是小于7的小部分，小部分执行后会退栈
		mark1 = begin;
		mark2 = end;
		// 分为三段， 执行后，begin------mark2  等于部分不用处理  mark1-----end
		mid = Get2Mark(v, mark1, mark2, begin, end);  

		// 为了缩短栈深度，先做短的部分，长的部分先压栈，
		// 这里能缩短，主要是8以下直接算不用压栈；传统算法标准递归不需要，没有用
		// 如果左侧长
		if (mark2-begin >= end-mark1)
		{
			if (begin < mark2)   // 左侧部分先不处理，压栈，回头再说
			{
				// Save the big recursion for later:
				lowStack[top] = begin;
				higStack[top] = mark2;
				++top;
			}

			if (mark1 < end)    // 设置边界，直接处理后面的部分
			{
				begin = mark1;
				goto recurse;
			}
		}
		else  // 如果右侧长
		{
			if (mark1 < end)    // 右侧延展
			{
				lowStack[top] = mark1;
				higStack[top] = end;
				++top;
			}

			if (begin < mark2)   // 左侧直接处理
			{
				end = mark2;
				goto recurse;
			}	
		}
	}// end of else

	--top;  //  退栈
	if (top >= 0)
	{
		// Pop sub-array from the stack:
		begin = lowStack[top];
		end = higStack[top];
		goto recurse;
	}
	else
	{
		delete[] lowStack;
		delete[] higStack;
		return;
	}
}

性能测试：

数据 \ 算法	std::qsort	简化版	栈最大深度
100万 int	322毫秒	210毫秒	6
1000万int	2.4秒	1.7秒	7

有兴趣大家可以测试一下。测试代码如下：

void testSort()
{
	int n = 1000000;
	int * v = new int[n];

	static default_random_engine engine;
	static uniform_int_distribution<int> uniform(0, 750);
	for (int i = 0; i < n; i++)
	{
		v[i] = uniform(engine);

		//cout << v[i] << "  ";
	}
	cout << endl;

	double tms1 = GetTickCountA();
	//InsertSort(v, n);
	//quickSort(v, 0, n - 1);
	
	//std::sort(v, v + n-1);
	//shortSort(v, 0, n - 1);

	//int mark1, mark2;
	//int mid = Get2Mark(v, mark1, mark2, 0, n-1);

	//ms_qsort(v, 0, n - 1);

	std::qsort(v, n, sizeof(int), cmpInt);
	double tms2 = GetTickCountA();
	
	cout << "-----------------------------------------------------------" <<endl;
	//for (int i = 0; i < n; i++)
	{
		//cout << v[i] << "  ";
	}
	cout << endl;


	cout << tms2 - tms1 << "    ";
	cout << "ok" << endl;

	delete[]v;
}

总结：

简化后之所以比std::qsort快，是因为比较部分都是直接比较，没有调用函数开销。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

比std::qsort还快的快速排序（1千万整数1.7秒）——（快速排序栈溢出与递归优化）的相关文章

文件名日文乱码处理

文件名出现日文乱码的话可以用如下命令解决 xff1a convmv r t utf 8 notest path to dir 另外 xff0c 压缩的 zip 解压时使用如下命令 xff1a unzip Ocp932 path to zip
can 总线介绍

CAN xff0c 全称为 CONtroller Area Network xff0c 即控制器局域网 xff0c 是国际上应用最广泛的现场总线之一最初 xff0c CAN被设计作为汽车环境中的微控制器通讯 xff0c 在车载各电子控制装
python 的 do ~ while 语法

本文摘至 http ama ch hatenablog com entry 20080425 1209110237 Python不支持do while语法 while xff08 无限循环 xff09 和break组合起来替换 do whi
802.11协议帧格式、Wi-Fi连接交互过程、无线破解入门研究

本文转载至 xff1a http www cnblogs com littlehann p 3700357 html 目录 1 802 11标准简介 2 802 11协议格式 3 Wi Fi认证过程 4 802 11标准中的数据安全加密协议
Make 命令教程

转载至 xff1a http www ruanyifeng com blog 2015 02 make html 作者 xff1a 阮一峰日期 xff1a 2015年2月20日代码变成可执行文件 xff0c 叫做编译 xff08 com
Python中用于计算对数的log()方法

本文转载至 xff1a http www jb51 net article 66130 htm 这篇文章主要介绍了Python中用于计算对数的log 方法是Python入门基础中的必会的方法需要的朋友可以参考下 log 方法返回x的自然
RT-Thread创始人熊谱翔: 我和Linux、嵌入式实时操作系统RT-Thread

本文转载至 xff1a http www rt thread org dynamic 78 html 接触 Linux 说起 Linux应该从我在校园时期说起我是在山城重庆邮电学院念的书 xff0c 1998年时宿舍伙伴一起凑的钱买的电
到底什么是Unikernel？

本文转载至 xff1a http dockone io article 855 utm source 61 tuicool amp utm medium 61 referral 编者的话本文介绍了一种新的应用虚拟化技术 xff0c 它让应
xauth: “timeout in locking authority file /home/<user>/.Xauthority”?

本文转载至 xff1a http unix stackexchange com questions 215558 why am i getting this message from xauth timeout in locking aut
小技巧：检查你本地及公共 IP 地址

本文转载至 xff1a https linux cn article 8207 1 html utm source 61 rss amp utm medium 61 rss 你本地的 IP 地址 xff1a 192 168 1 100 上面
Inside Real-Time Linux

本文转载于 xff1a https www linux com news event elce 2017 2 inside real time linux Real time Linux has come a long way in the
[小技巧] vim中使用cscope时不区别大小写

cscope 有 C 这么一个选项 C Ignore letter case when searching vim 里使用 cscope 不区别大小写可以使用下面一个技巧 xff1a set csprg 61 usr bin ra csco
PWM占空比和电机转速有什么线性关系

可以看电机拖动一书 xff0c 里面讲了电机的建模由于PWM波频率很高 xff0c 一般认为接在电机两端的电压平均值有如下关系 xff1a 假如占空比为a xff0c 驱动板供电电压为U xff0c 则电机两端电压Ud 61 a U 对于
SIFT特征点提取及描述论文算法详解

SIFT特征点提取及描述论文算法详解 1 尺度空间极值检测 Scale space extrema detection 1 1 尺度空间和极值1 2 DoG和LoG的关系1 3 构建高斯尺度差分空间Tips 2 极值点定位 Keypoint
国科大计算机视觉20-21考题

国科大计算机视觉20 21考题 SIFT检测及描述流程 xff08 20分 xff09 相机成像模型 xff08 16分 xff09 两视图的稀疏重建 xff08 16分 xff09 LM算法流程 xff08 16分 xff09 PCA的思
Ubuntu18.04关闭内核自动更新安装之前版本

Ubuntu18 04关闭内核自动更新安装之前版本回退的原因 xff0c 上一周安装了Ubuntu18 04双系统 xff0c 主机型号是外星人 Asura R6 xff0c 安装完毕后可以正常进入Ubuntu xff0c 但是关机的时候
Windows10配置MongoDB

Windows10安装MongoDB并配置 1 安装2 安装完成后启动服务器2 1 一次性启动2 2 设置为服务 xff0c 开机自启动 3 添加环境变量 xff0c 方便在cmd任何目录中直接启动参考链接 xff1a https www
Ubuntu18.04编译ORB-SLAM3及遇到的一些问题

测试环境 xff1a 系统 xff1a Ubuntu18 04Eigen 3 3 4 查看Eigen3版本的方法Pangolin 0 6OpenCV 3 4 14ROS Melodic 一安装依赖 ORB SLAM的各项依赖里OpenCV
Python multiprocessing多进程编程，进程间通信，psutil监控进程状态并通过电子邮件告警

python多进程编程进程监测一 mutiprocessng多进程编程和通信二进程监测分析三 Python邮件发送功能四完整代码运行结果 xff1a 服务器上的web后端经常需要同时运行多个进程 xff0c 各个进程之间需要交换数
Supervisor服务器进程监测

服务器上的应用程序有时候会莫名其妙地挂掉 xff0c 如果我们经常去登录服务器看是不是程序挂了 xff0c 挂了再拉起 xff0c 那样是非常耗时和麻烦的事情后来我们通过使用 supervisor 去守护启动 xff0c 实现方法如下一

随机推荐

Ubuntu18.04手动安装NVIDIA驱动

Ubuntu18 04手动安装NVIDIA驱动 1 下载驱动查看系统推荐的驱动版本 xff0c 官网下载对应的run文件 NVIDIA驱动下载的高级搜索 xff1a https www nvidia cn Download Find as
ORB-SLAM2 编译记录

ORB SLAM2编译记录由于之前已经编译过ORB SLAM3 xff0c 大部分库都已经配置好了 xff0c 这次主要只了处理两个错误 1 error usleep is not declared in this scope xxx x
视觉SLAM十四讲 Ubuntu20.04 Pangolin 环境配置

视觉SLAM十四讲 Ubuntu20 04 Pangolin 环境配置一 github下载源代码选择0 5版本的 xff0c 要不然版本装高了编译ORB SLAM2会遇到问题二报错及处理 error AV PIX FMT XVMC
Trilateration三边测量定位算法

http www justinablog com archives 1066 基本原理 Trilateration xff08 三边测量 xff09 是一种常用的定位算法 xff1a 已知三点位置 x1 y1 x2 y2 x3 y3 已知未
编译VINS_Mono报错： Project ‘cv_bridge‘ specifies ‘/usr/include/opencv‘ as an include dir, which is not f

编译VINS Mono报错 xff1a CMake Error at opt ros melodic share cv bridge cmake cv bridgeConfig cmake 113 Project cv bridge spe
《视觉SLAM十四讲》中SE(3)指数映射和左雅克比矩阵的推导

高博的书上给出了 S O 3 SO 3 S O 3 的指数映射推导 xff0c 但对于
Python sum()函数

Python里的sum函数语法例子1 列表中的元素为数字 xff1a 2 列表中的元素为字符串 xff1a 3 列表中元素为列表语法 sum iterable start 参数1 iterable xff0c 一个可迭代对象 xff0c
Ubuntu20.04安装tensorflow2.8.0+CUDA11.4

Ubuntu20 04安装tensorflow2 8 0 43 CUDA11 4 1 创建虚拟环境2 安装tensorflow3 安装CUDA4 安装cuDNN4 1 手动安装4 2 deb安装包安装 5 测试需要事先安装好Anacond
关于/etc/ld.so.conf.d/和环境变量设置

关于 etc ld so conf 和环境变量LD LIBRARY PATH 1 动态可执行程序和静态可执行程序2 动态链接库的搜索2 1 查询程序依赖的动态链接库2 2 动态装入器 xff08 dynamic loader xff09 2
Pytorch检查CUDA和cudnn是否可用及其版本

Pytorch检查CUDA和cudnn版本检查CUDA检查cudnn 命令行终端启动python 检查CUDA span class token operator gt gt span span class token operator
Ubuntu 18.04 ROS Melodic中调用支持Python3的cv_bridge

Ubuntu 18 04 ROS Melodic中调用支持Python3的cv bridge 0 背景1 编译自己的cv bridge功能包 Python 3 7 11 2 更新当前shell的环境变量3 附录Why use source
VIm自动生成python的文件头

VIm自动生成python的文件头我实现的效果如图所示 xff1a 思路是在vimrc配置文件中写相关的函数 xff0c 代码在下面贴出按 wq保存退出以后 xff0c 会自动更新上次修改时间 34 新建py文件时插入文件头 autoc
使用Dokcer配置Tensorflow-1.15环境并使用VSCode开发

使用Dokcer配置Tensorflow 1 15环境目前学术界大部分深度学习的开源代码都是基于Pytorch的 xff0c 但还有少部分工作或者以前的工作是基于Tensorflow 1 x的 xff0c 由于tensorflow的版本和
使用VNC可视化Docker容器

使用VNC可视化Docker容器 0 前言环境 xff1a 1 容器端配置1 1 启动Docker容器1 2 安装x111 3 安装桌面环境1 4 安装tightvncserver 2 配置VNC Server2 1 首先停止刚刚新建的虚拟
STM32 串口ISP下载方式解读

xfeff xfeff http blog sina com cn s blog b09739ab0102v4rm html Flash Loader Demonstrator 下载工具的安装 1 xff0e 硬件的连接和设置串口ISP
with异常处理

class A 39 39 39 此类的对象可以用 xff57 xff49 xff54 xff48 语句进行管理 39 39 39 def enter self print 34 已经进入with语句 34 return self def
telegram android 源码分析（一）自动设置代理

比如自动设置mtproxy代理 xff0c 冗长的代码我们怎么去找 xff1f 1 xff09 首先我们发现点代理链接能弹对话框 xff0c 们可以在strings xml中搜索得到 xff1a lt string name 61 34 U
NS3 的 ipv4-static-routing-test-suite 源码分析

下面进行源码注释 xff1a End to end tests for Ipv4 static routing include 34 ns3 boolean h 34 include 34 ns3 config h 34 include 3
c语言向上取整计算方法

用整数N 除以 M xff0c 要求向上取整数 1 xff09 int n 61 N 43 M 1 M xff1b 简化后就是 xff1a 2 xff09 int n 61 N 1 M 43 1 xff1b 最笨的办法 3 int n 61
比std::qsort还快的快速排序（1千万整数1.7秒）——（快速排序栈溢出与递归优化）

前几天发现老外的开源项目中事件队列中用的就是std qsort排序 xff0c 后续插入时候使用了堆方式快速排序实际应用中是比堆排序要快的 xff0c 这主要是因为硬件层次会对数据执行高速缓存 xff0c 数据使用一二三级高速缓存比访问内

比std::qsort还快的快速排序（1千万整数1.7秒）——（快速排序栈溢出与递归优化）

比std::qsort还快的快速排序（1千万整数1.7秒）——（快速排序栈溢出与递归优化） 的相关文章

随机推荐

热门标签

比std::qsort还快的快速排序（1千万整数1.7秒）——（快速排序栈溢出与递归优化）的相关文章