编译原理-文献订阅-三峡大学图书馆

斯坦福大学计算机科学系的编译原理课程分析

张素琴

来源国家哲学社会科学学术...

详细信息

基于编译原理技术的反汇编实现

王勇

吉林大学

来源详细信息

关键词： 编译原理反汇编技术 80x86指令系统代码分离

摘要： 引言在计算机应用日益普及的今天，我们所面临的对诸如软件的生存期、硬件的二次开发、对系统的理解分析等方面的问题也越来越多。现在的软件的规模、结构也变得庞大而复杂。其生存期也更长了。从头开始建大系统的数量急剧减少，很多遗产被逐步利用起来。再生工程以少的开销、短的时间、低的风险把旧系统改造为一个新的形式,使系统在操作、系统能力、功能、性能、可维护性和可支持性上得到提高。软件再生工程中的逆向工程是指对现有系统进行分析,以最大的努力去建立比代码抽象层次更高的表达形式。如从目标代码分析求出源代码,由源代码求详细设计与总体设计,由总体设计求软件需求分析。反汇编技术是实现从目标代码到源代码翻译的较好的途径。编译技术在反汇编中的应用编译系统主要的应用是将高级语言书写的程序翻译成等价的机器语言程序或汇编语言程序。在逻辑上由分析和综合两大部分组成。分析部分主要包括词法分析、语法分析和语义分析；综合部分主要包括存储分配、代码优化和代码生成，有时还包括生成中间代码。编译程序的分类主要包括诊断型、优化型、可重定目标型、交叉型和增量型。由于微处理器指令的执行过程严格受指令计数器指针PC的控制。程序存储器空间中(即目标代码中)的单元是否为指令由该单元是否被PC访问,或PC是否访问该单元的前面某个单元并且其代码长度区间是否包含此单元。该原则为区分代码与数据提供了充分必要的判断依据。通过对PC值的跟踪记录,将PC访问的程序存储器单元(目标代码)置代码标志而不被PC访问的单元置数据标志可以实现程序存储器中代码与数据的分离。因此为了对目标代码进行数据与代码的分离,必须遍历PC的所有可能的流向及路径。传统的方法中采用了链表数据结构对PC值进行跟踪记录,它的遍历算法复杂、编程实现困难,且链表搜索时间和分支判断数量呈指数增长。在大的反汇编程序设计时这种链表数据结构不再适合。通过对目标代码结构的分析和指令控制模型的建立,我们发现用栈或队列的数据结构比链表数据结构优越:程序设计逻辑清晰、遍历算法易于实现。为了分离指令和数据,反汇编程序与汇编程序及软件仿真程序不同,它对转移指令和调用指令作同样的处理,因为转移指令的两分支必然都是代码,所以在遍历转移指令的两分支之一后应返回到另一分支并遍历该分支。CPU的指令解释中转移指令和调用指令对PC的操作基本一致,但存在下条指令地址压栈与不压栈的区别。对于分离代码与数据的反汇编程序,转移指令的另一分支方向地址也必须压栈。反汇编的方法由于计算机的主要工作是进行数据处理，故80x86指令系统中的多数指令对应于操作码。对于不同的操作数有不同的方法来存取它们；特别是存放在存储单元的操作数，可以采用多种不同的方式来寻找地址以便进行数据存取。 80x86指令系统的编码格式非常紧凑并且灵活，通常第一字节位操作码，用以规定操作的类型，第二字节规定操作数的寻址方式。典型的单操作数指令结构如下：操作码 reg 操作数在16位寄存器内操作码w Mod 次操作码 r/m 操作数在寄存器或存储器典型的双操作数指令结构如下图：操作码dw ModRegR/m 典型的双操作数指令其中：reg---寄存器寻址代码。 Mod---寻址方式代码，配合r/m一起使用。 Mod=11,寄存器寻址 Mod≠11,存储器寻址 r/m---寄存器或存储器寻址方式（与mod字段组合使用） d位---指示操作数的传送方向，用于双操作数指令： d=0时，reg字段为源操作数，r/m和mod字段为目的操作数 d=1时，r/m和mod字段为源操作数，reg字段为目的操作数 w位---字操作标志位： w=0时，字节操作标志 w=1时，字操作标志为了便于分析，我们定义一个子语言。该子语言是基于80x86系统的一个子集。我们将子语言的汇编助记符分为两个域：操作码域和操作数域。指令系统包括数据传输类指令、算术运算类指令、逻辑运算类值指令、转移指令、堆栈操作指令。寻址方式包括

基于UG的ISO13584零件库几何编程接口实现

赵芳

大连铁道学院

来源详细信息

关键词： ISO 13584 零件库编译原理几何编程接口

摘要： 随着CIM(计算机集成制造)的迅猛发展，企业集成从信息集成走向过程集成，国际标准ISO 13584能够满足企业内部及企业之间标准件库的信息交换与共享的需要，提供一种能传递零件库数据的、独立于零件库数据系统的任何应用程序的中性机制。其中的第31部分为几何编程接口，该接口使零件库中描述零件族的参数化程序具有可移植性。为了方便高效地利用零件库信息，满足资源共享的要求，需要开发不同CAD应用系统之间的数据转换接口。本论文就是针对这一问题，研究并开发了基于UG平台的几何编程转换接口。基于UG的几何编程接口软件系统是在Windows2000的微机操作平台上，以UG为开发平台，以C语言为开发工具，在Vc++6.0环境下运行。其主要功能是：读入一个零件几何图形程序文件，应用编译程序的原理和方法将其转换为UG的二次开发语言GRIP参数化子程序，该程序可以在GRIP高级开发环境GRADE中进行编译，用主程序调用执行，即可在UG CAD环境下运行生成零件三维模型。零件几何图形程序是一个文本文件，是符合FORTRAN语法体系结构的参数化中性子程序，是采用ISO 13584-31标准的附录A的接口函数描述的标准零件。几何编程接口软件系统开发关键部分主要是符合ISO 13584-31接口标准的零件几何图形程序的编写和转换程序的编写两部分。本文从ISO 13584标准描述零件的机制及实体构造原理出发，详细介绍了零件几何图形程序的编写过程以及C语言编写转换软件过程中的关键技术，并据此完成了标准件垫圈、螺母、螺栓等几个实例。

二维条形码编译码原理与应用研究

戴扬

南京航空航天大学

来源详细信息

关键词： 二维条码 PDF417 滤波-还原投影 RS纠错码 BM算法

摘要： 本文简要介绍了二维条形码的特点和编码规则，详细阐述用计算机实现其编码的原理和方法，采用具体实例介绍设计步骤，并给出可同时实现中英文编码的程序设计方法。另外，二维条形码具有一维条码不具备的纠错功能。本文简要介绍了Reed-Solomon纠错码(RS码)原理，重点分析研究它在PDF417二维条形码中的应用方法，并详尽地推导了在迦罗华域GF(929)域内RS码的编译码方法。同时提出一种适用于PDF417纠错编码和译码的查表方法，可以简单确定任意码字在GF(929)内所对应的本原元的幂次。运用该方法可以快速而准确地计算出纠错码生成多项式的系数列以及差错伴随式。显著提高纠错效率。在译码方面本文探讨了一种采用CCD整图读取条码图像的方法，用计算机进行图像分析，特征提取，完成译码的实现方法。还给出了一种基于PDF417二维条码结构特性的算法，该方法设计滤波器滤除噪声部分，再采用点搜索法进一步去除不符合条码边界特点的孤立的点和容易与边界混淆的竖直划痕，最后对条码图像进行复原。实验证明可以有效去除滤波对有效条码边缘的影响，同时保证图像可靠恢复。对于恢复后的条码图像采用改进的边缘检测投影方法译码，降低了对条码纠错等级的要求，大大提高了译码的效率和准确率。

编译原理

何炎祥

来源三峡大学图书馆图书详细信息

编译程序设计原理

杜淑敏王永宁

来源三峡大学图书馆图书详细信息

编译原理习题解答与考试指导

姚文琳徐建良魏爱敏

来源三峡大学图书馆图书详细信息

LDPC码的编译码原理及编码设计

王鹏

西安电子科技大学

来源详细信息

关键词： 低密度校验码删除信道图模型度分布序列围长高斯信道快速编码

摘要： 低密度校验码以其低复杂度的迭代译码算法和可逼近信道容量限而成为目前最佳的编码技术之一，越来越受到众多编码研究学者的关注。本文在对低密度校验码现有理论的研究基础上，系统地分析了低密度校验码在删除信道下的纠错性能和度序列设计、低密度校验码的围长设计和快速编码设计等编码设计问题，获得了一些研究成果，主要概括为： 1．系统地阐述了低密度校验码基于图模型的编译码思想，介绍了密度进化理论，对影响低密度校验码纠错性能的两个主要因素——度序列设计和围长设计进行了深入分析;2．阐述了应用于删除信道下的纠删码基本原理，介绍了两类标准的RS码类纠删码，重点分析了具有线性时间编码和恢复算法的渐近好码—级联型低密度纠删码，分析了正则度分布的阈值，对正则低密度校验码在删除信道下的纠错性能进行了仿真，从理论上证明了基于(d，2d)-正则度序列的低密度纠删码都不是渐近最优码(d≥3)，同时还分析了非正则低密度校验码的度序列设计，基于右边正则序列提出了一种改进型右边正则序列，证明了此序列为渐近拟最优的，对基于几类现有典型度分布序列的级联型低密度纠删码进行了模拟仿真及性能分析;3．研究了现有的具有较大围长的低密度校验码设计方法，提出了一种新的构造具有较大围长的正则低密度校验码方法并对其在高斯信道下的纠错性能进行了仿真，提出了渐进边增长算法的改进算法，使采用改进后的算法构造的低密度校验码能够严格满足给定的度序列分布;4．对低密度校验码的快速编码问题进行了深入研究，指出了旋风码和重复累积码能够达到线性编码的原因及其与可快速编码的低密度校验码之间的关系，提出了两种可线性编码的低密度校验码的构造方法并对其在高斯信道下的纠错性能进行了仿真。

基于WWW的编译原理课件设计

张永梅李华玲梁志剑

华北工学院计算机科学与技术系山西太原030051

来源