资源预览内容
第1页 / 共64页
第2页 / 共64页
第3页 / 共64页
第4页 / 共64页
第5页 / 共64页
第6页 / 共64页
第7页 / 共64页
第8页 / 共64页
第9页 / 共64页
第10页 / 共64页
亲,该文档总共64页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
关毅 guanyihit.edu.cn,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,第一章 自然语言处理概论,1、开场白 2、自然语言处理概论 3、学习方法,主要内容,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,欢迎大家加入可能是世界上人数最多的自然语言处理团队!,1、开场白,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,哈尔滨工业大学计算机学院的自然语言处理团队,起源 80年代初 王开铸教授,俄汉机器翻译 李生教授,汉英机器翻译,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,哈尔滨工业大学计算机学院的自然语言处理团队(续),主要研究室 语言技术研究中心 社会计算与信息检索研究中心 智能接口与人机交互研究中心 ,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,个人简介,关毅 1992年开始进入自然语言处理领域 主要工程项目 微软拼音输入法 BOPOMOFO汉字输入系统 Weniwen搜索引擎 主要科学贡献 关于相似的研究-提出系统相似度测度理论 现为哈工大计算机学院语言技术研究中心教授,博士生导师,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,课程概貌,研究生专业必修课:自然语言处理 学时:32学时+16学时 授课方式:课堂讲授+课后上机练习 考察方式:闭卷考试 实验课,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,几个时间段,二十多年 崛起于80年代初的统计自然语言处理技术,已经成为自然语言处理的主流技术 本课程重点介绍统计语言处理技术,特别是基于统计的汉语词法分析技术,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,几个时间段(续),六十多年 自然语言处理技术起源于人们对机器翻译技术的研究,从1946年算起至今,已有60多年的历史了 “目前一些试用过的用户表示,改进后的翻译服务在质量方面令人惊讶。对于那些从未使用机器翻译的用户来说,他们完全可以通过翻译后的文本理解原文的意思,一些细微的错误并不会引起太大的麻烦。” -Franz Josef Och,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,几个时间段(续),还需要多少年才能实现计算机与人类无障碍地沟通? 1968年的美国影片2001太空奥德赛 机器人HAL和Dave进行了如下对话: Dave Bownman: Open the pod bay doors, HAL. (Dave Bownman:HAL, 请你打开太空舱的分离门。) HAL: Im sorry Dave, I am afraid I cant do that. (HAL:对不起,Dave,我恐怕不能这样做。),研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,几个时间段(续),自然语言处理是一个“AI complete”问题 自然语言与(分子)生物学有着深刻的渊源 生物学中有着至少500年也解决不完的有趣问题 Donald E. Knuth,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,自然语言处理中的歧义问题,在自然语言处理的各个阶段广泛大量地存在着形形色色的歧义问题,这是自然语言与人工语言的根本差别之一,也是自然语言处理的难点所在,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,自然语言处理中的歧义问题(续),词法分析歧义 分词 严守一把手机关了 严守/ 一把手/ 机关/ 了 严守一/ 把/ 手机/ 关/ 了 词性标注 我/pro 计划/v 考/v 研/n 我/pro 完成/v 了/aux 计划/n 命名实体识别 秦兵坑杀赵军40万于长平,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,自然语言处理中的歧义问题(续),语法分析歧义 咬死了猎人的狗 那只狼咬死了猎人的狗 咬死了猎人的狗失踪了,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,自然语言处理中的歧义问题(续),语义分析歧义 At last, a computer that understands you like your mother. 1985 McDonnell-Douglas ad 含义1:计算机会象你的母亲那样很好地理解你(的语言) 含义2:计算机理解你喜欢你的母亲 含义3:计算机会象很好地理解你的母亲那样理解你,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,自然语言处理中的歧义问题(续),语用分析歧义 “你真坏”至少有如下三种理解: 当人们对干了坏事的成年人说时,是一种严厉的斥责 当妈妈对淘气的儿子说时,实际表达的是对儿子的一种疼爱 当恋爱中的女孩对男友说这句话时,则是女孩在男友面前撒娇的一种表现 ,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,自然语言处理中的歧义问题(续),自然语言处理应用中的歧义问题 音字转换例 ji qi fan yi ji qi ying yong ji qi le ren men ji qi nong hou de xing qu,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,几点感性认识,有点繁琐枯燥 “从繁体词库到简体词库” 要求同学们一丝不苟的认真精神 充满乐趣 “机器翻译及其应用激起了人们极其浓厚的兴趣” 要求同学们有愚公移山,坚持到底的精神,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,几点感性认识(续),团队合作 “128个字节的偏移量” 要求同学们善于协作,有团队精神 独创精神 “一只美丽的小花猫” 要求同学们勇于创新,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,本人印象深刻的至理名言,取法其上,仅得其中;取法其中,仅得其下;取法其众,得其上。 -中国古代思想家 Every important idea is simple -列夫.托尔斯泰,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,本人印象深刻的至理名言,The grand aim of all science is to cover the greatest number of empirical facts by logical deduction from the smallest number of hypotheses or axioms -爱因斯坦,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,两件宝贝,Mindjet MindManager Endnote/Mendeley/NoteExpress,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心 哈工大-阿里巴巴联合实验室,教材,Christopher Manning and Hinrich Schutze: Foundations of Statistical Language Processing, MIT press, 1999(有中译本,译者 苑春法 等) 自然语言处理综论 Daniel Jurafsky &James H. Martin著 冯志伟 孙乐 译 王晓龙、关毅 计算机自然语言处理 清华大学出版社 2005年,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014. HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,2、自然语言处理概论,什么是自然语言处理,定义1:自然语言处理可以定义为研究在人与人交际中以及在人与计算机交际中的语言问题的一门学科。自然语言处理要研制表示语言能力(linguistic competence)和语言应用(linguistic performance)的模型,建立计算框架来实现这样的语言模型,提出相应的方法来不断地完善这样的语言模型,根据这样的语言模型设计各种实用系统,并探讨这些实用系统的评测技术。 -Bill Manaris, 1999,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014. HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,解题,本学科的主题与背景:“自然语言处理可以定义为研究在人与人交际中以及在人与计算机交际中的语言问题的一门学科。” 人人交际中的语言问题 例如语言不通的问题,促进了机器翻译这一语言处理中最重要的应用之一的发展 人机交际中的语言问题 例如语言文字的输入输出问题,促进了智能化人机接口技术的研究,研究生专业必修课 自然语言处理 , 2
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号