形式语言的形式语言学

如题所述

第1个回答  2016-05-28

也称代数语言学,它研究一般的抽象符号系统,运用形式模型对语言(包括人工语言和自然语言)进行理论上的分析和描写.
形式文法:是一种格式,用来说明什么句子在该语言中是合法的,并指明把词组合成短语和句子的规则.
描述语言有三种途径:1,穷举2,文法 3,自动机 其中文法是指的产生过程,而自动机是指的识别过程.一种语言,如果存在对它的识别过程,就一定存在对它的产生过程,反之亦然.
现行的形式语法系统是Chomsky于1959年为了描述自然语言而提出的一种理论模型
如何严格的定义形式化的语言
形式文法:一个形式文法G由四个部分组成,可记作G={VN, VT, S , P },其中:
VN:称为文法G的非终结符号字母表,VN不出现在G所表示的语言集合的句子中;
VT:称为文法G的终结符号字母表,G所表示的语言的句子由VT中的元素组成,VN ∩VT = ;S :代表句子符号,S∈VN .
P :代表一组式子组成的集合,P 中的式子具有如下形式:α->β
产生式需要满足下面的条件:1)α可以是VN 和VT 上的任意字符串,但其中必须至少包含一个非终结符,并且不能是空字符;2)β可以是VN 和VT 上的任意字符串,也可以是空字符;3)P 中至少有一个产生式中的α得由S 来充当;
形式语言的特点
1,高度的抽象化(采用形式化的手段-专用符号,数学公式-来描述语言的结构关系,这种结构关系是抽象的)2,是一套演绎系统(形式语言本身的目的就是要用有限的规则来推导语言中无限的句子,提出形式语言的哲学基础也是想用演绎的方法来研究自然语言)3,具有算法的特点.(比如说句法分析中采用不同的算法来构造句子的句法推导树)
乔姆斯基把文法分成4种类型,即0型,1型,2型,和3型。0型文法也称短语文法,0型文法的能力相当于图灵机(Turing),或者说任何0型语言都是递归可枚举的。1型文法也称上下文有关法,其能力相当于线性界限自动机。2型文法也称上下文无关法,其能力相当于非确定的下推自动机。3型文法也称右线性文法,由于这种文法等价于正规式,所以也称正规文法。从文法描述语言的能力来说,0型文法最强,3型文法最弱。

相似回答