正规集(ab|c)(1|2|3)可以识别的字符种类有( )个，下列( )可被匹配

免费智能真题库 > 历年试卷 > 软件设计师 > 2024年上半年软件设计师上午试卷综合知识

第10题

知识点：词法分析

章/节：计算机软件知识

正规集(ab|c)(1|2|3),可以识别的字符种类有( )个，下列( )可被匹配

A. ab2

B. abc

C. a2

D. 123

相关试题：计算机软件知识

更多>

第48题 2013年上半年

66%

以下关于语言L={aⁿbⁿ|n>=1}的叙述中，正确的是（48）。

第62题 2019年上半年

49%

已知矩阵Am*n和Bn*p相乘的时间复杂度为O(mnp)。矩阵相乘满足结合律，如三个矩阵A、B、C相乘的顺序可以是(A*B)*C也可以是A*(B*C)。..

第63题 2020年下半年

44%

对数组A=(2,8,7,1,3,5,6,4)用快速排序算法的划分方法进行一趟划分后得到的数组A为（62）(非递减排序，以最后一个元素为基准元素..


知识点讲解
· 词法分析

词法分析

1）正规表达式和正规集

对于字母表∑，其上的正规表达式（也称正则表达式，简称正规式）及其表示的正规集可以递归定义如下。

（1）ε是一个正规式，它表示集合L(ε)={ε}。

（2）若a是∑上的字符，则a是一个正规式，它所表示的正规集为{a}。

（3）若正规式r和s分别表示正规集L(r)和L(s)，则

①r|s是正规式，表示集合L(r)∪L(s)。

②r.s是正规式，表示集合L(r)L(s)。

③r*是正规式，表示集合(L(r))^*。

④(r)是正规式，表示集合L(r)。

仅由有限次地使用上述3个步骤定义的表达式才是∑上的正规式，其中运算符"|"".""*"分别称为"或""连接"和"闭包"。若两个正规式表示的正规集相同，则认为两者等价。

2）有限自动机

有限自动机是一种识别装置的抽象概念，它能够正确地识别正规集。

（1）确定的有限自动机。

一个确定的有限自动机（DFA）是个五元组：（S，∑，f，s₀，Z），其中：

①S是一个有限集，其每个元素称为一个状态。

②∑是一个有限字母表，其每个元素称为一个输入字符。

③f是从S×∑→S上的单值部分映像。

④s₀∈S是唯一的一个开始状态。

⑤Z是非空的终止状态集合。

一个DFA可以用两种直观的方式表示，即状态转换图和状态转换矩阵。状态转换图简称为转换图，它是一个有向图。DFA中的每个状态对应转换图中的一个节点，DFA中的每个转换函数对应图中的一条有向弧，若转换函数为f(A,a)=Q，则该有向弧从节点A出发，进入节点Q，字符a是弧上的标记。状态转换矩阵可以用一个二维数组M表示，矩阵元素的行下标表示状态，列下标表示输入字符，M[A,a]的值是当前状态为A、输入为a时应转换到的下一状态。在转换矩阵中，一般以第一行的行下标所对应的状态作为初态，而终态则需要特别指出。

（2）不确定的有限自动机。

一个不确定的有限自动机（NFA）也是一个五元组，它与确定的有限自动机的区别如下。

①f是从S×∑→2^S上的映像。对于S中的一个给定状态及输入符号，返回一个状态的集合。

②有向弧上的标记可以是ε。

显然，DFA是NFA的特例。

实际上，对于每个NFAM，都存在一个DFAN，且L(M)=L(N)。

对于任何两个有限自动机M₁和M₂，如果L(M₁)=L(M₂)，则称M₁和M₂是等价的。

3）NFA到DFA的转换

设NFAN=(S,∑,f,s₀，Z)，与之等价的DFAM=(S',∑,f',q₀,Z')，用子集法将非确定的有限自动机确定化的算法步骤如下。

（1）求出DFAM的初态q₀，此时S'仅含初态q₀，并且没有标记。

（2）对于S'中尚未标记的状态q_i={s_i₁,s_i₂,…,s_im}和s_ij∈(j=1,2,…,m)进行下述处理。

①标记q_i。

②对于每个a∈∑，令T=f(s_i₁,s_i₂,…,s_im,a)，q_j=ε_CLOSURE(T)。

③若q_i尚不在S'中，则将q_j作为一个未加标记的新状态添加到S'，并把状态转换函数f'(q_i,a)=q_j添加到DFAM。

（3）重复步骤（2），直到S'中不再有未标记的状态时为止。

（4）令Z'={q|q∈S'且q∩Z≠?}。

注：若I是NFAN的状态集合的一个子集，其中ε_CLOSURE(I)的定义如下。

①状态集I的ε_CLOSURE(I)是一个状态集。

②状态集I的所有状态属于ε_CLOSURE(I)。

③若s在I中，那么从s出发经过任意条ε弧到达的状态s'都属于ε_CLOSURE(I)。

从NFA转换得到的DFA不一定是最简化的，可以通过等价变换将DFA进行最小化处理。

4）正规式与有限自动机之间的转换

（1）对于∑上的NFAM，可以构造一个∑上的正规式R，使得L(R)=L(M)。

构造过程分以下两步进行。

①在M的状态转换图中加两个节点x和y。

②按下图所示的方法逐步消去M中的除x和y的所有节点。

状态转换图（消去中间节点）

（2）对于∑上的每一个正规式R，可以构造一个∑上的NFAM，使得L(M)=L(R)。

（3）构造过程分两步进行。

①对于正规式R，可用如下图所示的拓广状态图表示。

拓广状态图

②通过对正规式R进行分裂并加入新的节点，逐步把图转变成每条弧上的标记是∑上的一个字符或ε，转换规则如下图所示。

状态转换图（加入新节点）

5）词法分析器的构造

词法分析器的构造过程如下。

（1）用正规式描述语言中的单词构成规则。

（2）为每个正规式构造一个NFA，用于识别正规式所表示的正规集。

（3）将构造出的NFA转换成等价的DFA。

（4）对DFA进行最小化处理，使其最简。

（5）根据DFA构造词法分析器。

题号导航 2024年上半年软件设计师上午试卷综合知识

本试卷我的完整做题情况



	第10题在手机中做本题