人工智能

自然语言理解

发布时间:2022-06-24

自然语言是指人类语言集团的本族语,如汉语、英语等,它是相对于人造语言而言的,如C语言、JAVA语言等计算机语言。语言是思维的载体,是人际交流的工具,人类历史上以语言文字形式记载和流传的知识占到知识总量的80%以上。就计算机应用而言,有85%左右的应用都是用于语言文字的信息处理。在信息化社会中,语言信息处理的技术水平和每年所处理的信息总量已成为衡量一个国家现代化水平的重要标志之一。

自然语言理解作为语言信息处理技术的一个高层次的重要研究方向,一直是人工智能领域的核心课题,也是困难问题之一,由于自然语言的多义性、上下文有关性、模糊性、非系统性和环境密切相关性、涉及的知识面广等原因,使得很多系统不得不采取回避的方法;另外,由于理解并非一个绝对的概念,它与所应用的目标相关,如是用于回答问题、执行命令,还是用于机器翻译。因此,关于自然语言理解,至今尚无一致的、各方可以接受的定义。从微观上讲,自然语言理解是指从自然语言到机器内部的一个映射;从宏观上看,自然语言是指机器能够执行人类所期望的某些语言功能。这些功能包括:

回答问题:计算机能正确地回答用自然语言输入的有关问题;

文摘生成:机器能产生输入文本的摘要;

释义:机器能用不同的词语和句型来复述输入的自然语言信息;

翻译:机器能把一种语言翻译成另外一种语言。

自然语言有两种基本的形式:口语和书面语。书面语比口语结构性要强,并且噪声也比较小。口语信息包括很多语义上不完整的子句,如果听众关于演讲主题的主观知识不是很了解的话,听众有时可能无法理解这些口语信息。书面语理解包括词法、语法和语义分析,而口语理解还需要加上语音分析。本章我们只涉及书面语的理解问题,不考虑口语的分析。

如果计算机能够理解、处理自然语言,人-机之间的信息交流能够以人们所熟悉的本族语言来进行,将是计算机技术的一项重大突破。另一方面,由于创造和使用自然语言是人类高度智能的表现,因此对自然语言处理的研究也有助于揭开人类高度智能的奥秘,深化对语言能力和思维本质的认识。自然语言理解这个研究方向在应用和理论两个方面都具有重大的意义。


参考文献

-史忠植.  高级人工智能(第二版).  科学出版社,  2006.

-史忠植,王文杰. 人工智能. 国防工业出版社, 2007. 请看第一章部分内容: 1  2  3  4  5  6  7  8  9

-George E Luger著.  史忠植, 张银奎, 赵志崑等译. 人工智能-复杂问题求解的结构和策略(第五版)机械工业出版社,2005..

-Russell S., Peter Norvig著. 姜哲,金奕江,张敏 等译. 人工智能——一种现代方法(第二版)北京:人民邮电出版社, 2004



附件下载: