0

    万字详解我今年经历的腾讯Linux C++ 笔试/面试题及答案

    2023.05.15 | admin | 248次围观

    10、虚拟内存的概念与介绍

    11、单链表的反转算法

    12、红黑树以及其查找复杂度

    13、KPM字符串匹配

    14、TCP超时等待、重传以及流量控制

    15、数据库引擎

    16、数据库索引

    1、C和C++的特点与区别?

    答:(1)C语言特点:

    1.作为一种面向过程的结构化语言,易于调试和维护;

    2.表现能力和处理能力极强,可以直接访问内存的物理地址;

    3.C语言实现了对硬件的编程操作,也适合于应用软件的开发;

    4.C语言还具有效率高,可移植性强等特点。

    (2)C++语言特点:

    1.在C语言的基础上进行扩充和完善,使C++兼容了C语言的面向过程特点,又成为了一种面向对象的程序设计语言;

    2.可以使用抽象数据类型进行基于对象的编程;

    3.可以使用多继承、多态进行面向对象的编程;

    4.可以担负起以模版为特征的泛型化编程。

    C++与C语言的本质差别:在于C++是面向对象的,而C语言是面向过程的。或者说C++是在C语言的基础上增加了面向对象程序设

    计的新内容,是对C语言的一次更重要的改革,使得C++成为软件开发的重要工具。

    2、C++的多态

    答:C++的多态性用一句话概括:在基类的函数前加上virtual关键字,在派生类中重写该函数,运行时将会根据对象的实际类型来

    调用相应的函数。如果对象类型是派生类,就调用派生类的函数;如果对象类型是基类,就调用基类的函数。

    1):用virtual关键字申明的函数叫做虚函数,虚函数肯定是类的成员函数;

    2):存在虚函数的类都有一个一维的虚函数表叫做虚表,类的对象有一个指向虚表开始的虚指针。虚表是和类对应的,虚表指针是

    和对象对应的;

    3):多态性是一个接口多种实现,是面向对象的核心,分为类的多态性和函数的多态性。;

    4):多态用虚函数来实现,结合动态绑定.;

    5):纯虚函数是虚函数再加上 = 0;

    6):抽象类是指包括至少一个纯虚函数的类;

    纯虚函数:virtual void fun()=0;即抽象类,必须在子类实现这个函数,即先有名称,没有内容,在派生类实现内容。

    3、虚函数实现

    答:简单地说,每一个含有虚函数(无论是其本身的,还是继承而来的)的类都至少有一个与之对应的虚函数表,其中存放着该类

    所有的虚函数对应的函数指针。例:

    其中:

    B的虚函数表中存放着B::foo和B::bar两个函数指针。

    D的虚函数表中存放的既有继承自B的虚函数B::foo,又有重写(override)了基类虚函数B::bar的D::bar,还有新增的虚函数D::quz。

    虚函数表构造过程:

    从编译器的角度来说,B的虚函数表很好构造,D的虚函数表构造过程相对复杂。下面给出了构造D的虚函数表的一种方式(仅供参考):

    虚函数调用过程

    以下面的程序为例:

    4、C和C++内存分配问题

    答:(1)C语言编程中的内存基本构成

    C的内存基本上分为4部分:静态存储区、堆区、栈区以及常量区。他们的功能不同,对他们使用方式也就不同。

    1.栈 ——由编译器自动分配释放;

    2.堆 ——一般由程序员分配释放,若程序员不释放,程序结束时可能由OS回收;

    3.全局区(静态区)——全局变量和静态变量的存储是放在一块的,初始化的全局变量和静态变量在一块区域,未初始化的全局变量

    和未初始化的静态变量在相邻的另一块区域(C++中已经不再这样划分),程序结束释放;

    4.另外还有一个专门放常量的地方,程序结束释放;

    (a)函数体中定义的变量通常是在栈上;

    (b)用malloc, calloc, realloc等分配内存的函数分配得到的就是在堆上;

    (c)在所有函数体外定义的是全局量;

    (d)加了static修饰符后不管在哪里都存放在全局区(静态区);

    (e)在所有函数体外定义的static变量表示在该文件中有效,不能extern到别的文件用;

    (f)在函数体内定义的static表示只在该函数体内有效;

    (g)另外,函数中的"adgfdf"这样的字符串存放在常量区。

    (2)C++编程中的内存基本构造

    在C++中内存分成5个区,分别是堆、栈、全局/静态存储区、常量存储区和代码区;

    1、栈,就是那些由编译器在需要的时候分配,在不需要的时候自动清楚的变量的存储区,里面的变量通常是局部变量、函数参数等。

    2、堆,就是那些由new分配的内存块,他们的释放编译器不去管,由我们的应用程序去控制,一般一个new就要对应一个delete。如

    果程序员没有释放掉,那么在程序结束后,操作系统会自动回收。

    3、全局/静态存储区,全局变量和静态变量被分配到同一块内存中,在以前的C语言中,全局变量又分为初始化的和未初始化的,在

    C++里面没有这个区分了,他们共同占用同一块内存区。

    4、常量存储区,这是一块比较特殊的存储区,他们里面存放的是常量,不允许修改(当然,你要通过非正当手段也可以修改)。

    5、代码区 (.text段),存放代码(如函数),不允许修改(类似常量存储区),但可以执行(不同于常量存储区)。

    内存模型组成部分:自由存储区,动态区、静态区;

    根据c/c++对象生命周期不同,c/c++的内存模型有三种不同的内存区域,即:自由存储区,动态区、静态区。

    自由存储区:局部非静态变量的存储区域,即平常所说的栈;

    动态区:用new ,malloc分配的内存,即平常所说的堆;

    静态区:全局变量,静态变量,字符串常量存在的位置;

    注:代码虽然占内存,但不属于c/c++内存模型的一部分;

    一个正在运行着的C编译程序占用的内存分为5个部分:代码区、初始化数据区、未初始化数据区、堆区 和栈区;

    (1)代码区(text segment):代码区指令根据程序设计流程依次执行,对于顺序指令,则只会执行一次(每个进程),如果反复,则需要使用跳转指令,如果进行递归,则需要借助栈来实现。注意:代码区的指令中包括操作码和要操作的对象(或对象地址引用)。如果是立即数(即具体的数值,如5),将直接包含在代码中;

    js网页自动跳转代码_js按钮跳转代码_js里面文字自动出现然后跳转到下一句的代码

    (2)全局初始化数据区/静态数据区(Data Segment):只初始化一次。

    (3)未初始化数据区(BSS):在运行时改变其值。

    (4)栈区(stack):由编译器自动分配释放,存放函数的参数值、局部变量的值等,其操作方式类似于数据结构中的栈。

    (5)堆区(heap):用于动态内存分配。

    为什么分成这么多个区域?

    主要基于以下考虑:

    #代码是根据流程依次执行的,一般只需要访问一次,而数据一般都需要访问多次,因此单独开辟空间以方便访问和节约空间。

    #未初始化数据区在运行时放入栈区中,生命周期短。

    #全局数据和静态数据有可能在整个程序执行过程中都需要访问,因此单独存储管理。

    #堆区由用户自由分配,以便管理。

    5、协程

    答:定义:协程是一种用户态的轻量级线程。

    协程拥有自己的寄存器上下文和栈。协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈。因此:协程能保留上一次调用时的状态(即所有局部状态的一个特定组合),每次过程重入时,就相当于进入上一次调用的状态,换种说法:进入上一次离开时所处逻辑流的位置;

    线程是抢占式,而协程是协作式;

    协程的优点:

    跨平台

    跨体系架构

    无需线程上下文切换的开销

    无需原子操作锁定及同步的开销

    方便切换控制流,简化编程模型

    高并发+高扩展性+低成本:一个CPU支持上万的协程都不是问题。所以很适合用于高并发处理。

    协程的缺点:

    无法利用多核资源:协程的本质是个单线程,它不能同时将 单个CPU 的多个核用上,协程需要和进程配合才能运行在多CPU;

    进行阻塞(Blocking)操作(如IO时)会阻塞掉整个程序:这一点和事件驱动一样,可以使用异步IO操作来解决。

    6、CGI的了解

    答:CGI:通用网关接口(Common Gateway Interface)是一个Web服务器主机提供信息服务的标准接口。通过CGI接口,Web服务

    器就能够获取客户端提交的信息,转交给服务器端的CGI程序进行处理,最后返回结果给客户端。

    CGI通信系统的组成是两部分:一部分是html页面,就是在用户端浏览器上显示的页面。另一部分则是运行在服务器上的Cgi程序。

    7、进程间通信方式和线程间通信方式

    答:(1)进程间通信方式:

    # 管道( pipe ):管道是一种半双工的通信方式,数据只能单向流动,而且只能在具有亲缘关系的进程间使用。进程的亲缘关系通常是指父子进程关系。

    # 信号量( semophore ) :信号量是一个计数器,可以用来控制多个进程对共享资源的访问。它常作为一种锁机制,防止某进程正在访问共享资源时,其他进程也访问该资源。因此,主要作为进程间以及同一进程内不同线程之间的同步手段。

    # 消息队列( message queue ) :消息队列是由消息的链表,存放在内核中并由消息队列标识符标识。消息队列克服了信号传递信息少、管道只能承载无格式字节流以及缓冲区大小受限等缺点。

    # 共享内存( shared memory ) :共享内存就是映射一段能被其他进程所访问的内存,这段共享内存由一个进程创建,但多个进程都可以访问。共享内存是最快的 IPC 方式,它是针对其他进程间通信方式运行效率低而专门设计的。它往往与其他通信机制,如信号两,配合使用,来实现进程间的同步和通信。

    # 套接字( socket ) :套解口也是一种进程间通信机制,与其他通信机制不同的是,它可用于不同及其间的进程通信。

    (2)线程间通信方式:

    #全局变量;

    #Messages消息机制;

    #CEvent对象(MFC中的一种线程通信对象,通过其触发状态的改变实现同步与通信)。

    8、TCP握手与释放

    答:(1)握手

    #第一次握手:主机A发送握手信号syn=1和seq=x(随机产生的序列号)的数据包到服务器,主机B由SYN=1知道,A要求建立联机;

    #第二次握手:主机B收到请求后要确认联机信息,向A发送syn=1,ack=x(x是主机A的Seq)+1,以及随机产生的确认端序列号

    seq=y的包;

    #第三次握手:主机A收到后检查ack是否正确(ack=x+1),即第一次发送的seq+1,若正确,主机A会再发送ack=y+1,以及随机序

    列号seq=z,主机B收到后确认ack值则连接建立成功;

    #完成三次握手,主机A与主机B开始传送数据。

    注:上述步骤中,第二和第三次确认包中都还包含一个标志位未予以说明,该标志位为1表示正常应答;

    具体可见图片:

    为什么需要“三次握手”?

    “三次握手”的目的是“为了防止已失效的连接请求报文段突然又传送到了服务端,因而产生错误”。具体例如:client发出的第一个连接请求报文段并没有丢失,而是在某个网络结点长时间的滞留了,以致延误到连接释放以后的某个时间才到达server。本来这是一个早已失效的报文段。但server收到此失效的连接请求报文段后,就误认为是client再次发出的一个新的连接请求。于是就向client发出确认报文段,同意建立连接。假设不采用“三次握手”,那么只要server发出确认,新的连接就建立了。由于现在client并没有发出建立连接的请求,因此不会理睬server的确认,也不会向server发送数据。但server却以为新的运输连接已经建立,并一直等待client发来数据。这样,server的很多资源就白白浪费掉了。采用“三次握手”的办法可以防止上述现象发生。例如刚才那种情况,client不会向server的确认发出确认。server由于收不到确认,就知道client并没有要求建立连接。主要目的防止server端一直等待,浪费资源。

    (2)挥手

    由于TCP连接是全双工的,因此每个方向都必须单独进行关闭。这原则是当一方完成它的数据发送任务后就能发送一个FIN来终止这个方向的连接。收到一个 FIN只意味着这一方向上没有数据流动,一个TCP连接在收到一个FIN后仍能发送数据。首先进行关闭的一方将执行主动关闭,而另一方执行被动关闭。

    (1) TCP客户端发送一个FIN,用来关闭客户到服务器的数据传送(报文段4);

    (2) 服务器收到这个FIN,发回一个ACK,确认序号为收到的序号加1(报文段5)。和SYN一样,一个FIN将占用一个序号;

    (3) 服务器关闭客户端的连接后,再发送一个FIN给客户端(报文段6);

    (4) 客户段收到服务端的FIN后,发回ACK报文确认,并将确认序号设置为收到序号加1(报文段7);

    注意:TCP连接的任何一方都可以发起挥手操作,上述步骤只是两种之一;

    具体过程见图:

    为什么是“四次挥手”?

    因为当收到对方的FIN报文通知时,它仅仅表示对方没有数据发送给你了;但未必你所有的数据都全部发送给对方了,所以你可能还需要发送一些数据给对方,再发送FIN报文给对方来表示你同意现在可以关闭连接了,故这里的ACK报文和FIN报文多数情况下都是分开发送的,也就造成了4次挥手。

    握手,挥手过程中各状态介绍:

    (1)3次握手过程状态:

    #LISTEN: 这个也是非常容易理解的一个状态,表示服务器端的某个SOCKET处于监听状态,可以接受连接了。

    #SYN_SENT: 当客户端SOCKET执行CONNECT连接时js里面文字自动出现然后跳转到下一句的代码,它首先发送SYN报文,因此也随即它会进入到了SYN_SENT状态,并等待服务端的发送三次握手中的第2个报文。SYN_SENT状态表示客户端已发送SYN报文。(发送端)

    #SYN_RCVD: 这个状态与SYN_SENT遥想呼应这个状态表示接受到了SYN报文,在正常情况下,这个状态是服务器端的SOCKET在建立TCP连接时的三次握手会话过程中的一个中间状态,很短暂,基本上用netstat你是很难看到这种状态的,除非你特意写了一个客户端测试程序,故意将三次TCP握手过程中最后一个ACK报文不予发送。因此这种状态时,当收到客户端的ACK报文后,它会进入到ESTABLISHED状态。(服务器端)

    #ESTABLISHED:这个容易理解了,表示连接已经建立了。

    (2)4次挥手过程状态:

    #FIN_WAIT_1: 这个状态要好好解释一下,其实FIN_WAIT_1和FIN_WAIT_2状态的真正含义都是表示等待对方的FIN报文。而这两种状态的区别是:FIN_WAIT_1状态实际上是当SOCKET在ESTABLISHED状态时,它想主动关闭连接,向对方发送了FIN报文,此时该SOCKET即进入到FIN_WAIT_1状态。而当对方回应ACK报文后,则进入到FIN_WAIT_2状态,当然在实际的正常情况下,无论对方何种情况下,都应该马上回应ACK报文,所以FIN_WAIT_1状态一般是比较难见到的,而FIN_WAIT_2状态还有时常常可以用netstat看到。(主动方)

    #FIN_WAIT_2:上面已经详细解释了这种状态js里面文字自动出现然后跳转到下一句的代码,实际上FIN_WAIT_2状态下的SOCKET,表示半连接,也即有一方要求close连接,但另外还告诉对方,我暂时还有点数据需要传送给你(ACK信息),稍后再关闭连接。(主动方)

    #TIME_WAIT: 表示收到了对方的FIN报文,并发送出了ACK报文,就等2MSL后即可回到CLOSED可用状态了。如果FIN_WAIT_1状态下,收到了对方同时带FIN标志和ACK标志的报文时,可以直接进入到TIME_WAIT状态,而无须经过FIN_WAIT_2状态。(主动方)

    #CLOSING(比较少见): 这种状态比较特殊,实际情况中应该是很少见,属于一种比较罕见的例外状态。正常情况下,当你发送FIN报文后,按理来说是应该先收到(或同时收到)对方的ACK报文,再收到对方的FIN报文。但是CLOSING状态表示你发送FIN报文后,并没有收到对方的ACK报文,反而却也收到了对方的FIN报文。什么情况下会出现此种情况呢?其实细想一下,也不难得出结论:那就是如果双方几乎在同时close一个SOCKET的话,那么就出现了双方同时发送FIN报文的情况,也即会出现CLOSING状态,表示双方都正在关闭SOCKET连接。

    #CLOSE_WAIT: 这种状态的含义其实是表示在等待关闭。怎么理解呢?当对方close一个SOCKET后发送FIN报文给自己,你系统毫无疑问地会回应一个ACK报文给对方,此时则进入到CLOSE_WAIT状态。接下来呢,实际上你真正需要考虑的事情是察看你是否还有数据发送给对方,如果没有的话,那么你也就可以close这个SOCKET,发送FIN报文给对方,也即关闭连接。所以你在CLOSE_WAIT状态下,需要完成的事情是等待你去关闭连接。(被动方)

    #LAST_ACK: 这个状态还是比较容易好理解的,它是被动关闭一方在发送FIN报文后,最后等待对方的ACK报文。当收到ACK报文后,也即可以进入到CLOSED可用状态了。(被动方)

    版权声明

    本文仅代表作者观点。
    本文系作者授权发表,未经许可,不得转载。

    发表评论