资源预览内容
第1页 / 共150页
第2页 / 共150页
第3页 / 共150页
第4页 / 共150页
第5页 / 共150页
第6页 / 共150页
第7页 / 共150页
第8页 / 共150页
第9页 / 共150页
第10页 / 共150页
亲,该文档总共150页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
人工智能和认知物理学人工智能和认知物理学Artificial Intelligence and Cognitive PhysicsArtificial Intelligence and Cognitive Physics李德毅ziqinziqinziqinziqinpublic2.public2.public2.public2.btabtabtabta.net.net.net.net.cncncncn2002年11月25日1认知科学认知科学研究人类如何获取知识和使用知识研究人类如何获取知识和使用知识数据挖掘数据挖掘让机器模拟人的智能从数据中发现知识让机器模拟人的智能从数据中发现知识2目录目录q 人工智能50年发展回顾q 20世纪物理学的成就q 不确定性认知的原子模型q 数据场和势函数q 认知场中的知识发现3一、人工智能一、人工智能5050年发展回顾年发展回顾l人工智能的兴起l智能的判定标准l人工智能研究的不同切入点l人工智能研究的目标4人工智能自诞生之日起就引起人们无限美丽的想象和憧憬;已经成为学科交叉发展中的一盏明灯,光芒四射;但其理论起伏跌宕,也存在争议和误解。5人工智能的兴起人工智能的兴起l l数学家和逻辑学家;数学家和逻辑学家;l l认知学家和心理学家;认知学家和心理学家;l l神经生理学家;神经生理学家;l l计算机科学家计算机科学家 1956 1956年著名的年著名的“达特茅斯达特茅斯( (Dartmouth)Dartmouth)会议会议”标志人工智能学科的诞生,它从一开标志人工智能学科的诞生,它从一开始就是交叉学科的产物。与会者有:始就是交叉学科的产物。与会者有: 6人工智能的兴起人工智能的兴起 达特茅斯会议上,明斯基(达特茅斯会议上,明斯基(Marvin Minsky)的神经网络模拟器、麦卡锡的神经网络模拟器、麦卡锡(John Mccarthy)的搜索法、以及西的搜索法、以及西蒙(蒙(Herbert Simon)和纽厄尔(和纽厄尔(Allen Newell)的的“逻辑理论家逻辑理论家”是会议的是会议的3个个亮点。分别讨论如何穿过迷宫,如何搜亮点。分别讨论如何穿过迷宫,如何搜索推理和如何证明数学定理。这是初期索推理和如何证明数学定理。这是初期人们期待的人工智能。人们期待的人工智能。7人工智能的经典著作人工智能的经典著作l l由费根鲍姆主编的由费根鲍姆主编的Computers and Thought被认为是世界上第一本人工被认为是世界上第一本人工智能的经典专著,含智能的经典专著,含21篇著名论文,篇著名论文,1963年出版。年出版。l l80年代出版的年代出版的1-4卷卷The Handbook of Artificial Intelligence是人工智能的杠是人工智能的杠鼎之作。鼎之作。8人工智能研究的杰出人物人工智能研究的杰出人物 20 20世纪世纪4040位图灵奖获得者中有位图灵奖获得者中有6 6名人名人工智能学者,可见人工智能学科影响之工智能学者,可见人工智能学科影响之深远。深远。 19691969年:马文年:马文明斯基明斯基 1971 1971年:约翰年:约翰麦卡锡麦卡锡 1975 1975年:赫伯特年:赫伯特西蒙和艾伦西蒙和艾伦纽厄尔纽厄尔 19941994年年:爱爱德德华华费费根根鲍鲍姆姆和和劳劳伊伊雷雷迪迪9智能的判定标准智能的判定标准l l图灵图灵(Turing)测试:测试: 如果机器在与人隔离的房间回答人如果机器在与人隔离的房间回答人提出的问题,且人无法判断回答问题的提出的问题,且人无法判断回答问题的是机器还是人时,则应该认为机器已经是机器还是人时,则应该认为机器已经具备人的智能。具备人的智能。10猴子摘香蕉猴子摘香蕉11梵塔游戏梵塔游戏 初始柱初始柱替换柱替换柱目的柱目的柱12计算机下棋计算机下棋:l l1997年年IBM“深蓝深蓝”计算机以计算机以2胜胜3平平1负负的战绩战胜国际象棋冠军卡斯帕罗夫的战绩战胜国际象棋冠军卡斯帕罗夫,“深蓝深蓝”计算速度为计算速度为200万万棋步棋步/秒,采用秒,采用启发式搜索方法启发式搜索方法;l l在与下棋领域具有类似性质和类似复杂在与下棋领域具有类似性质和类似复杂性问题上,计算机具备有智能。性问题上,计算机具备有智能。13计算机下棋计算机下棋:l l卡斯帕罗夫自卡斯帕罗夫自1990年称霸国际象棋棋坛年称霸国际象棋棋坛,2000年举行的国际世界象棋冠军比赛中年举行的国际世界象棋冠军比赛中,克拉莫尼克以克拉莫尼克以8:6领先卡斯帕罗夫。领先卡斯帕罗夫。“深深蓝蓝”计算机能否打败克拉莫尼克?也就计算机能否打败克拉莫尼克?也就是说,是说,“深蓝深蓝”计算机的智能能否计算机的智能能否“与与时俱进时俱进”?14追求智能的三步曲追求智能的三步曲1) 啊!真了不起!2) 啊!是这样的啊!3) 啊!这也算智能吗?4) 又回到第一步。 15人工智能研究的对象人工智能研究的对象l l不确定不确定l l非线性非线性l l不完全不完全l l变结构变结构l l多变量多变量l l分布式分布式16人工智能的应用人工智能的应用l l人工智能的实际应用越来越普遍。智能人工智能的实际应用越来越普遍。智能机器人、智能控制、智能网络、智能手机器人、智能控制、智能网络、智能手机、智能数据库、智能管理、智能小区、机、智能数据库、智能管理、智能小区、智能交通、甚至智能经济等等不绝于耳,智能交通、甚至智能经济等等不绝于耳,知识就是力量。知识就是力量。17人工智能研究的切入点人工智能研究的切入点l先后出现了先后出现了3个主流学派:个主流学派:符号主义方法-逻辑学派联结主义方法-仿生学派行为主义方法-控制论学派 18符号主义学派符号主义学派( (西蒙和纽厄尔为代表西蒙和纽厄尔为代表) )l l物理符号系统假说(物理符号系统假说(物理符号系统假说(物理符号系统假说(physical symbol system physical symbol system hypothesishypothesis)。)。)。)。由一组称为符号的实体组成系统,由一组称为符号的实体组成系统,由一组称为符号的实体组成系统,由一组称为符号的实体组成系统,这些符号可作为组份出现在另一符号实体中。任这些符号可作为组份出现在另一符号实体中。任这些符号可作为组份出现在另一符号实体中。任这些符号可作为组份出现在另一符号实体中。任何时候系统内部均有一组符号结构,以及作用在何时候系统内部均有一组符号结构,以及作用在何时候系统内部均有一组符号结构,以及作用在何时候系统内部均有一组符号结构,以及作用在这些符号结构上生成其他符号结构的一组过程。这些符号结构上生成其他符号结构的一组过程。这些符号结构上生成其他符号结构的一组过程。这些符号结构上生成其他符号结构的一组过程。任一物理符号系统如果是有智能的,则必能执行任一物理符号系统如果是有智能的,则必能执行任一物理符号系统如果是有智能的,则必能执行任一物理符号系统如果是有智能的,则必能执行对符号的输入、输出、存储、复制、条件转移和对符号的输入、输出、存储、复制、条件转移和对符号的输入、输出、存储、复制、条件转移和对符号的输入、输出、存储、复制、条件转移和建立符号结构这样建立符号结构这样建立符号结构这样建立符号结构这样6 6种操作。反之,能执行这种操作。反之,能执行这种操作。反之,能执行这种操作。反之,能执行这6 6种种种种操作的任何系统,也就一定能够表现出智能。操作的任何系统,也就一定能够表现出智能。操作的任何系统,也就一定能够表现出智能。操作的任何系统,也就一定能够表现出智能。19符号主义学派符号主义学派l l认知基元是符号,智能行为通过符号操作来实认知基元是符号,智能行为通过符号操作来实认知基元是符号,智能行为通过符号操作来实认知基元是符号,智能行为通过符号操作来实现现现现, ,以美国科学家以美国科学家以美国科学家以美国科学家RobinsonRobinson提出的归结原理为提出的归结原理为提出的归结原理为提出的归结原理为基础,以基础,以基础,以基础,以LispLisp和和和和PrologProlog语言为代表;语言为代表;语言为代表;语言为代表;l l着重问题求解中启发式搜索和推理过程,在逻着重问题求解中启发式搜索和推理过程,在逻着重问题求解中启发式搜索和推理过程,在逻着重问题求解中启发式搜索和推理过程,在逻辑思维的模拟方面取得成功,如自动定理证明辑思维的模拟方面取得成功,如自动定理证明辑思维的模拟方面取得成功,如自动定理证明辑思维的模拟方面取得成功,如自动定理证明和专家系统;和专家系统;和专家系统;和专家系统;l l归结原理不可能成为所有数学分支的证明基础,归结原理不可能成为所有数学分支的证明基础,归结原理不可能成为所有数学分支的证明基础,归结原理不可能成为所有数学分支的证明基础,问题求解和逻辑推理的本质仅仅是演译。问题求解和逻辑推理的本质仅仅是演译。问题求解和逻辑推理的本质仅仅是演译。问题求解和逻辑推理的本质仅仅是演译。20联结主义学派联结主义学派( (J.J.J.J.HopfieldHopfield为代表为代表) )l l人的思维基元是神经元,把智能理解为人的思维基元是神经元,把智能理解为相互联结的神经元竞争与协作的结果相互联结的神经元竞争与协作的结果,以以人工神经网络为代表人工神经网络为代表,其中其中,反向传播网反向传播网络模型(络模型(BP)和和Hopfield网络模型更为突网络模型更为突出;出;l l着重结构模拟,研究神经元特征、神经着重结构模拟,研究神经元特征、神经元网络拓朴、学习规则、网络的非线性元网络拓朴、学习规则、网络的非线性动力学性质和自适应的协同行为。动力学性质和自适应的协同行为。21遗传算法和进化计算:遗传算法和进化计算:l l19751975年,年,年,年,John HollandJohn Holland提出遗传算法提出遗传算法提出遗传算法提出遗传算法( (Genetic Genetic Algorithm)Algorithm),模仿生物染色体中基因的选择模仿生物染色体中基因的选择模仿生物染色体中基因的选择模仿生物染色体中基因的选择( (selection)selection)、交叉交叉交叉交叉( (crossover)crossover)和变异和变异和变异和变异( (mutation)mutation)的自然进化过程的自然进化过程的自然进化过程的自然进化过程, ,通过个体结构重组通过个体结构重组通过个体结构重组通过个体结构重组, ,形成一代代新群体形成一代代新群体形成一代代新群体形成一代代新群体(populations) ,populations) ,最终收敛于最终收敛于最终收敛于最终收敛于近似优化解。用于处理多变量、非线性、不确定、近似优化解。用于处理多变量、非线性、不确定、近似优化解。用于处理多变量、非线性、不确定、近似优化解。用于处理多变量、非线性、不确定、甚至混沌的大搜索空间的有约束的优化问题;甚至混沌的大搜索空间的有约束的优化问题;甚至混沌的大搜索空间的有约束的优化问题;甚至混沌的大搜索空间的有约束的优化问题;22麻将原理:麻将原理:l l刚发到手的牌就刚发到手的牌就刚发到手的牌就刚发到手的牌就“ “和和和和” ”了的概率是非常非常小的。了的概率是非常非常小的。了的概率是非常非常小的。了的概率是非常非常小的。l l不管开始手中的牌有多坏,通过一次次摸牌、选不管开始手中的牌有多坏,通过一次次摸牌、选不管开始手中的牌有多坏,通过一次次摸牌、选不管开始手中的牌有多坏,通过一次次摸牌、选择、淘汰,可以逐步逼近到最优解。这相当进化择、淘汰,可以逐步逼近到最优解。这相当进化择、淘汰,可以逐步逼近到最优解。这相当进化择、淘汰,可以逐步逼近到最优解。这相当进化中的变异和选择原理。中的变异和选择原理。中的变异和选择原理。中的变异和选择原理。l l麻将的魅力在于可以在容忍的时间内让牌麻将的魅力在于可以在容忍的时间内让牌麻将的魅力在于可以在容忍的时间内让牌麻将的魅力在于可以在容忍的时间内让牌“ “和和和和” ”了。了。了。了。l l遗传算法和进化计算的收敛性问题。遗传算法和进化计算的收敛性问题。遗传算法和进化计算的收敛性问题。遗传算法和进化计算的收敛性问题。23行为主义学派行为主义学派( (R.A.BrooksR.A.Brooks为代表为代表) )l l控制论研究导致机器人和智能控制,机器人是控制论研究导致机器人和智能控制,机器人是控制论研究导致机器人和智能控制,机器人是控制论研究导致机器人和智能控制,机器人是“ “感知感知感知感知- -行为行为行为行为” ”模式模式模式模式, ,是没有知识的智能是没有知识的智能是没有知识的智能是没有知识的智能( (iwkiwk, , iwriwr) ),强调直觉和反馈的重要性;强调直觉和反馈的重要性;强调直觉和反馈的重要性;强调直觉和反馈的重要性;l l智能行为体现在系统与环境的交互之中,功能、智能行为体现在系统与环境的交互之中,功能、智能行为体现在系统与环境的交互之中,功能、智能行为体现在系统与环境的交互之中,功能、结构和智能行为不可分割。结构和智能行为不可分割。结构和智能行为不可分割。结构和智能行为不可分割。l l9090年代起智能年代起智能年代起智能年代起智能AgentAgent成为新的热点。它是一种成为新的热点。它是一种成为新的热点。它是一种成为新的热点。它是一种自治的、具有自发行为、体现交互性和环境适自治的、具有自发行为、体现交互性和环境适自治的、具有自发行为、体现交互性和环境适自治的、具有自发行为、体现交互性和环境适应性的新型智能机模型,具有移动性、推理、应性的新型智能机模型,具有移动性、推理、应性的新型智能机模型,具有移动性、推理、应性的新型智能机模型,具有移动性、推理、规划、学习和适应能力。规划、学习和适应能力。规划、学习和适应能力。规划、学习和适应能力。24行为主义学派行为主义学派l l反馈是控制论的基石,没有反馈就没有反馈是控制论的基石,没有反馈就没有智能智能。l l根据目标与实际行为之间的误差来消除根据目标与实际行为之间的误差来消除此误差的控制策略。此误差的控制策略。PID控制是控制论对控制是控制论对付不确定性的最基本手段。付不确定性的最基本手段。l l强调智能系统与环境的交互,从运行的强调智能系统与环境的交互,从运行的环境中获取信息(感知),通过自己的环境中获取信息(感知),通过自己的动作对环境施加影响。动作对环境施加影响。25当前,以实际问题驱动的人工智当前,以实际问题驱动的人工智能研究成为主流。人工智能不再能研究成为主流。人工智能不再是阳春白雪,尤其是数据挖掘技是阳春白雪,尤其是数据挖掘技术,要以机器再现人类认识过程术,要以机器再现人类认识过程的方式,为认知科学提供了一个的方式,为认知科学提供了一个新的实体模型和实在形式。新的实体模型和实在形式。26研研 究究 热热 点点l模式识别l智能检索l专家系统l自然语言理解l知识工程l数据挖掘l智能控制l智能机器人27人工智能三次大跃进人工智能三次大跃进第一次:第一次:智能系统代替人完成部分逻辑推理工作,如专家系统。第二次:第二次:智能系统能够和环境交互,从运行的环境中获取信息,代替人完成包括不确定性在内的部分思维工作,通过自身的动作,对环境施加影响,并适应环境的变化。如智能机器人。第三次:第三次:智能系统具有类人的认知和思维能力,能够发现新的知识,去完成面临的任务,如基于数据挖掘的系统。28人工智能的目标:人工智能的目标: 程序程序 = = 智能智能 ? ? 计算计算 = = 思维思维 ? ? 计算机计算机 = = 电脑电脑 ? ?目标:以机器方式再现人的智能目标:以机器方式再现人的智能29二、二、2020世纪物理学的成就世纪物理学的成就l物质层次结构和原子物理模型物质层次结构和原子物理模型l场理论和四种相互作用场理论和四种相互作用30物质层次结构和原子物理模型物质层次结构和原子物理模型l l可以把物质的组成层次看成一个个等级,眼前可以把物质的组成层次看成一个个等级,眼前可以把物质的组成层次看成一个个等级,眼前可以把物质的组成层次看成一个个等级,眼前的物体看成是宏观的,天体看成是宇观的,把的物体看成是宏观的,天体看成是宇观的,把的物体看成是宏观的,天体看成是宇观的,把的物体看成是宏观的,天体看成是宇观的,把分子和原子作为界标,比它们小的物质可以称分子和原子作为界标,比它们小的物质可以称分子和原子作为界标,比它们小的物质可以称分子和原子作为界标,比它们小的物质可以称之为微观的。原子这个层次十分重要。之为微观的。原子这个层次十分重要。之为微观的。原子这个层次十分重要。之为微观的。原子这个层次十分重要。l l原子模型的提出与演进,从开尔文模型、汤姆原子模型的提出与演进,从开尔文模型、汤姆原子模型的提出与演进,从开尔文模型、汤姆原子模型的提出与演进,从开尔文模型、汤姆孙模型、勒纳德模型、长冈模型、尼克尔森模孙模型、勒纳德模型、长冈模型、尼克尔森模孙模型、勒纳德模型、长冈模型、尼克尔森模孙模型、勒纳德模型、长冈模型、尼克尔森模型直到卢瑟福的原子有核结构模型,以及原子型直到卢瑟福的原子有核结构模型,以及原子型直到卢瑟福的原子有核结构模型,以及原子型直到卢瑟福的原子有核结构模型,以及原子核模型,都表明构思物质组成模型是一种普遍核模型,都表明构思物质组成模型是一种普遍核模型,都表明构思物质组成模型是一种普遍核模型,都表明构思物质组成模型是一种普遍有效的科学方法。原子的物理模型成为人类认有效的科学方法。原子的物理模型成为人类认有效的科学方法。原子的物理模型成为人类认有效的科学方法。原子的物理模型成为人类认识世界的五个里程碑之一。识世界的五个里程碑之一。识世界的五个里程碑之一。识世界的五个里程碑之一。31物理学中的势场物理学中的势场l l场可视为一个充满能量的空间。例如,场可视为一个充满能量的空间。例如,将一个位于无穷远处的电荷移至电场中将一个位于无穷远处的电荷移至电场中需要消耗能量。场在某点需要消耗能量。场在某点P(r)处的单位作处的单位作功能力被称为该点的势,记为功能力被称为该点的势,记为 (r) 。势势函数函数 (r)是一个关于场点位置的是一个关于场点位置的标量函标量函数,它在场空间中构成一个标量场,即数,它在场空间中构成一个标量场,即势场。势场。32梯度、散度与旋度梯度、散度与旋度l l梯度是描述标量场变化特性的矢量函数,它可梯度是描述标量场变化特性的矢量函数,它可梯度是描述标量场变化特性的矢量函数,它可梯度是描述标量场变化特性的矢量函数,它可以将一个标量场转换为矢量场,也可以通过引以将一个标量场转换为矢量场,也可以通过引以将一个标量场转换为矢量场,也可以通过引以将一个标量场转换为矢量场,也可以通过引入一个辅助标量函数来分析简化矢量场。入一个辅助标量函数来分析简化矢量场。入一个辅助标量函数来分析简化矢量场。入一个辅助标量函数来分析简化矢量场。l l散度、旋度是描述矢量场的两个固有特性:源散度、旋度是描述矢量场的两个固有特性:源散度、旋度是描述矢量场的两个固有特性:源散度、旋度是描述矢量场的两个固有特性:源密度和旋涡密度的物理量。在最一般的情况下,密度和旋涡密度的物理量。在最一般的情况下,密度和旋涡密度的物理量。在最一般的情况下,密度和旋涡密度的物理量。在最一般的情况下,一个矢量场总可以被看作由一个有源场和一个一个矢量场总可以被看作由一个有源场和一个一个矢量场总可以被看作由一个有源场和一个一个矢量场总可以被看作由一个有源场和一个旋涡场叠合组成,如电磁场。因此一个含义不旋涡场叠合组成,如电磁场。因此一个含义不旋涡场叠合组成,如电磁场。因此一个含义不旋涡场叠合组成,如电磁场。因此一个含义不明的矢量场只有当弄清它的两个分量各自的贡明的矢量场只有当弄清它的两个分量各自的贡明的矢量场只有当弄清它的两个分量各自的贡明的矢量场只有当弄清它的两个分量各自的贡献和物理本质后,即已知它的散度和旋度后才献和物理本质后,即已知它的散度和旋度后才献和物理本质后,即已知它的散度和旋度后才献和物理本质后,即已知它的散度和旋度后才算明确。算明确。算明确。算明确。33梯度场与旋梯度场与旋度度场、散场、散度场度场l l梯度场梯度场=有势场有势场=有源场有源场=保守场保守场=无旋场无旋场34电场和引力场的势函数电场和引力场的势函数l l电场的势函数电场的势函数电场的势函数电场的势函数l l引力场的势函数引力场的势函数引力场的势函数引力场的势函数l l从静电场和引力场的势函数计算中可以发现,从静电场和引力场的势函数计算中可以发现,从静电场和引力场的势函数计算中可以发现,从静电场和引力场的势函数计算中可以发现,两种场的物理机制虽然各不相同,但在数学形两种场的物理机制虽然各不相同,但在数学形两种场的物理机制虽然各不相同,但在数学形两种场的物理机制虽然各不相同,但在数学形态上却非常相似,即空间区域中不同物质粒子态上却非常相似,即空间区域中不同物质粒子态上却非常相似,即空间区域中不同物质粒子态上却非常相似,即空间区域中不同物质粒子相互作用的数学本质是相同或相近的。相互作用的数学本质是相同或相近的。相互作用的数学本质是相同或相近的。相互作用的数学本质是相同或相近的。 35物理学中的四种相互作用物理学中的四种相互作用l l牛顿万有引力定律(引力反比于距离的牛顿万有引力定律(引力反比于距离的平方)认为在多质点系中存在两两相互平方)认为在多质点系中存在两两相互作用的引力场和引力势能。作用的引力场和引力势能。l l库伦定律(电力反比于距离的平方)认库伦定律(电力反比于距离的平方)认为电荷之间通过电场相互作用,用电场为电荷之间通过电场相互作用,用电场线和等势线可使电场分布形象化。具有线和等势线可使电场分布形象化。具有相等电势的点构成等势面。相等电势的点构成等势面。36物理学中的四种相互作用物理学中的四种相互作用l l核物理认为,核子之间、核子与介子之间,通核物理认为,核子之间、核子与介子之间,通核物理认为,核子之间、核子与介子之间,通核物理认为,核子之间、核子与介子之间,通过夸克间交换胶子实现强相互作用。这就是力过夸克间交换胶子实现强相互作用。这就是力过夸克间交换胶子实现强相互作用。这就是力过夸克间交换胶子实现强相互作用。这就是力程甚短的核力。程甚短的核力。程甚短的核力。程甚短的核力。l l按照普适费米理论,弱相互作用是一种点作用,按照普适费米理论,弱相互作用是一种点作用,按照普适费米理论,弱相互作用是一种点作用,按照普适费米理论,弱相互作用是一种点作用,不涉及到任何场。后来人们发现这一观点有问不涉及到任何场。后来人们发现这一观点有问不涉及到任何场。后来人们发现这一观点有问不涉及到任何场。后来人们发现这一观点有问题。题。题。题。19841984年若贝尔奖被授予鲁比亚年若贝尔奖被授予鲁比亚年若贝尔奖被授予鲁比亚年若贝尔奖被授予鲁比亚 ( (Carlo Carlo RubbiaRubbia) ) 和范得米尔(和范得米尔(和范得米尔(和范得米尔(Simon Van Simon Van der Meerder Meer) )以表彰他们发现弱作用场量子以表彰他们发现弱作用场量子以表彰他们发现弱作用场量子以表彰他们发现弱作用场量子W+W+和和和和Z Z的杰出的杰出的杰出的杰出贡献。贡献。贡献。贡献。37物理学的大统一理论物理学的大统一理论l l如果以强相互作用的强度为如果以强相互作用的强度为如果以强相互作用的强度为如果以强相互作用的强度为1 1的话,电磁相互作的话,电磁相互作的话,电磁相互作的话,电磁相互作用的强度,其值约为用的强度,其值约为用的强度,其值约为用的强度,其值约为1010-2-2;弱相互作用约为;弱相互作用约为;弱相互作用约为;弱相互作用约为1010-13-13 1010-19-19 ;引力相互作用最弱,约为;引力相互作用最弱,约为;引力相互作用最弱,约为;引力相互作用最弱,约为1010-39-39。 l l物理学家一直企图将这四种相互作用进行统一。物理学家一直企图将这四种相互作用进行统一。物理学家一直企图将这四种相互作用进行统一。物理学家一直企图将这四种相互作用进行统一。爱因斯坦努力了,没有取得成果。真正取得进展爱因斯坦努力了,没有取得成果。真正取得进展爱因斯坦努力了,没有取得成果。真正取得进展爱因斯坦努力了,没有取得成果。真正取得进展的是量子场论。量子电动力学解释了电磁相互作的是量子场论。量子电动力学解释了电磁相互作的是量子场论。量子电动力学解释了电磁相互作的是量子场论。量子电动力学解释了电磁相互作用;量子色动力学解释了强相互作用,又将弱相用;量子色动力学解释了强相互作用,又将弱相用;量子色动力学解释了强相互作用,又将弱相用;量子色动力学解释了强相互作用,又将弱相互作用与电磁相互作用进行统一,即温伯格互作用与电磁相互作用进行统一,即温伯格互作用与电磁相互作用进行统一,即温伯格互作用与电磁相互作用进行统一,即温伯格- -萨萨萨萨拉姆电弱统一理论。大统一理论到现在还缺乏实拉姆电弱统一理论。大统一理论到现在还缺乏实拉姆电弱统一理论。大统一理论到现在还缺乏实拉姆电弱统一理论。大统一理论到现在还缺乏实验验证。验验证。验验证。验验证。38三、不确定性认知的原子模型三、不确定性认知的原子模型l 人类思维的基本单元人类思维的基本单元l 云模型及其数字特征云模型及其数字特征l 正向云发生器和逆向云发生器正向云发生器和逆向云发生器l 连续数据离散化(概念化)连续数据离散化(概念化)l 概念粒度、概念空间和泛概念树概念粒度、概念空间和泛概念树39人类思维活动的层次性人类思维活动的层次性 生命科学可还原成不同的层次:如脑生命科学可还原成不同的层次:如脑的生物化学层次和神经构造层次。认知活的生物化学层次和神经构造层次。认知活动可能对应着一定的生理上的化学、电学动可能对应着一定的生理上的化学、电学的变化。但是,目前生命科学还不能在思的变化。但是,目前生命科学还不能在思维活动与亚细胞的化学、电学层次的活动维活动与亚细胞的化学、电学层次的活动建立确切的关系。如:一个概念如何以生建立确切的关系。如:一个概念如何以生物学形式存储,它与其它概念发生联系的物学形式存储,它与其它概念发生联系的生物学过程是什么。也不能决定什么样的生物学过程是什么。也不能决定什么样的神经构造可以决定着哪些认知模式的发生。神经构造可以决定着哪些认知模式的发生。40人类思维活动的层次性人类思维活动的层次性 目前从脑的生物化学层次和神经构造层目前从脑的生物化学层次和神经构造层次研究认知活动尚有困难。再说,如同我们次研究认知活动尚有困难。再说,如同我们不能从最基础的硅芯片的活动来推测计算机不能从最基础的硅芯片的活动来推测计算机网络上电子邮件的行为一样,我们又怎么能网络上电子邮件的行为一样,我们又怎么能够设想从分析单个离子、神经元、突触的性够设想从分析单个离子、神经元、突触的性质就能够推断人脑的认知和思维活动呢?系质就能够推断人脑的认知和思维活动呢?系统论关于系统整体特征不是由低层元素加和统论关于系统整体特征不是由低层元素加和而成的原理对还原论提出质疑。因此,人工而成的原理对还原论提出质疑。因此,人工智能研究目前需要找到一个合适的层次和单智能研究目前需要找到一个合适的层次和单元,向上模拟人类的认知和思维活动。元,向上模拟人类的认知和思维活动。41人类思维活动的工具人类思维活动的工具 自然语言使人类获得一个强有力的思自然语言使人类获得一个强有力的思维工具,这是不争的事实,起到呈现和保维工具,这是不争的事实,起到呈现和保留思维对象及组织思维过程的作用。它是留思维对象及组织思维过程的作用。它是其它各种形式化系统(语言)的基础,派其它各种形式化系统(语言)的基础,派生出像计算机语言这样的特殊语言,也派生出像计算机语言这样的特殊语言,也派生出包括各种专业理论的专门化语言生出包括各种专业理论的专门化语言,如如数学语言。这些符号构成的形式系统数学语言。这些符号构成的形式系统, 又又成为新一级的形式化。成为新一级的形式化。42数学汉语外语自然语言符号语言自然语言和符号语言自然语言和符号语言43人类思维活动的工具人类思维活动的工具 自然语言中的语言值表达概念,自然语言中的语言值表达概念,最基本的语言值代表最基本的概念,最基本的语言值代表最基本的概念,成为思维的原子模型。同时,概念成为思维的原子模型。同时,概念具有层次性。具有层次性。44概念概念人类思维的基本单元人类思维的基本单元l l客观世界涉及物理对象,主观世界从认知单元客观世界涉及物理对象,主观世界从认知单元客观世界涉及物理对象,主观世界从认知单元客观世界涉及物理对象,主观世界从认知单元和它指向的物理对象开始,反映了主客观内外和它指向的物理对象开始,反映了主客观内外和它指向的物理对象开始,反映了主客观内外和它指向的物理对象开始,反映了主客观内外联系的特性。任何思维活动都是指向一定对象联系的特性。任何思维活动都是指向一定对象联系的特性。任何思维活动都是指向一定对象联系的特性。任何思维活动都是指向一定对象的,通过对象的存在到主观意识自身的存在。的,通过对象的存在到主观意识自身的存在。的,通过对象的存在到主观意识自身的存在。的,通过对象的存在到主观意识自身的存在。l l概念作为外部事物在主观认知中的对应物成为概念作为外部事物在主观认知中的对应物成为概念作为外部事物在主观认知中的对应物成为概念作为外部事物在主观认知中的对应物成为思维活动的基本单元。但是概念不是孤立的,思维活动的基本单元。但是概念不是孤立的,思维活动的基本单元。但是概念不是孤立的,思维活动的基本单元。但是概念不是孤立的,它同外部背景有着种种联系,是演变和流动的它同外部背景有着种种联系,是演变和流动的它同外部背景有着种种联系,是演变和流动的它同外部背景有着种种联系,是演变和流动的过程。因此,概念必然具有不确定性,甚至包过程。因此,概念必然具有不确定性,甚至包过程。因此,概念必然具有不确定性,甚至包过程。因此,概念必然具有不确定性,甚至包括盲目性和散漫性。括盲目性和散漫性。括盲目性和散漫性。括盲目性和散漫性。45概念的形成:学习和记忆概念的形成:学习和记忆l l标准特征是概念的一个组成部分,是用来确认标准特征是概念的一个组成部分,是用来确认标准特征是概念的一个组成部分,是用来确认标准特征是概念的一个组成部分,是用来确认某一具体样例属于该类别的必要或充分条件。某一具体样例属于该类别的必要或充分条件。某一具体样例属于该类别的必要或充分条件。某一具体样例属于该类别的必要或充分条件。l l原型在概念中占有特别的地位。原型在概念中占有特别的地位。原型在概念中占有特别的地位。原型在概念中占有特别的地位。l l模糊的边界和不清楚的样例是概念的普遍情况。模糊的边界和不清楚的样例是概念的普遍情况。模糊的边界和不清楚的样例是概念的普遍情况。模糊的边界和不清楚的样例是概念的普遍情况。l l在一个概括性更高而具体性更低的组织水平上,在一个概括性更高而具体性更低的组织水平上,在一个概括性更高而具体性更低的组织水平上,在一个概括性更高而具体性更低的组织水平上,下位概念作为一个样例被使用,形成基本水平、下位概念作为一个样例被使用,形成基本水平、下位概念作为一个样例被使用,形成基本水平、下位概念作为一个样例被使用,形成基本水平、下位水平和上位水平的层次结构下位水平和上位水平的层次结构下位水平和上位水平的层次结构下位水平和上位水平的层次结构 ( (basic lever/ basic lever/ subordinate level/subordinate level/superordinatesuperordinate lever) lever)。l l概念的形成是多次反复的学习和记忆的过程。概念的形成是多次反复的学习和记忆的过程。概念的形成是多次反复的学习和记忆的过程。概念的形成是多次反复的学习和记忆的过程。46困扰人工智能的认知模型困扰人工智能的认知模型l怎样表示用自然语言表述的定性知识怎样表示用自然语言表述的定性知识?l怎样反映自然语言中的不确定性,尤怎样反映自然语言中的不确定性,尤其是模糊性和随机性?其是模糊性和随机性?l怎样实现定性和定量知识之间的相互怎样实现定性和定量知识之间的相互转换?转换?l怎样体现语言思考中的软推理能力?怎样体现语言思考中的软推理能力?47知识表示知识表示 人工智能要以机器为载体模仿以人人工智能要以机器为载体模仿以人脑为载体的人的思维活动脑为载体的人的思维活动智能,必智能,必须找到在人脑和机器两种载体之间建立须找到在人脑和机器两种载体之间建立联系的手段,而这个任务正是由形式化联系的手段,而这个任务正是由形式化来担当的。知识表示的形式化在人工智来担当的。知识表示的形式化在人工智能中居于方法论的重要地位。能中居于方法论的重要地位。48认知模型认知模型(Cognitive Modeling) 云由许许多多云滴组成,每一个云云由许许多多云滴组成,每一个云滴就是这个定性概念映射到数域空间的滴就是这个定性概念映射到数域空间的一个点,即一次反映量的样例的实现。一个点,即一次反映量的样例的实现。这种实现带有不确定性,模型同时给出这种实现带有不确定性,模型同时给出这个点能够代表该定性概念的确定程度。这个点能够代表该定性概念的确定程度。49云图的可视化方法一云图的可视化方法一l l 给出云滴在数域(一维、二维或多维)给出云滴在数域(一维、二维或多维)的位置,用一个点表示一个云滴;同时,的位置,用一个点表示一个云滴;同时,用该点的辉度表示出这个云滴能够代表用该点的辉度表示出这个云滴能够代表概念的确定度。概念的确定度。50 “靠近坐标原靠近坐标原靠近坐标原靠近坐标原点左右点左右点左右点左右”的的的的10000100001000010000个量化云个量化云个量化云个量化云滴。任何一个滴。任何一个滴。任何一个滴。任何一个云滴都可以在云滴都可以在云滴都可以在云滴都可以在一定程度上代一定程度上代一定程度上代一定程度上代表这个概念。表这个概念。表这个概念。表这个概念。51云图的可视化方法二云图的可视化方法二l l用数域里的一个圈或球表示一个云滴,用数域里的一个圈或球表示一个云滴,其中心反映云滴在数域的位置;同时,其中心反映云滴在数域的位置;同时,圈或球的大小表示出这个云滴能够代表圈或球的大小表示出这个云滴能够代表概念的确定度。概念的确定度。52-3-2-1123-3-2-1123 “靠近坐标点靠近坐标点靠近坐标点靠近坐标点左右左右左右左右”的的的的200200200200个个个个量化云滴。任量化云滴。任量化云滴。任量化云滴。任何一个云滴都何一个云滴都何一个云滴都何一个云滴都可以在一定程可以在一定程可以在一定程可以在一定程度上代表这个度上代表这个度上代表这个度上代表这个概念。概念。概念。概念。53云图的可视化方法三云图的可视化方法三l l 用用N+1维表示,维表示, N维空间的点表示云滴维空间的点表示云滴在数域的位置,另一维表示这个云滴能在数域的位置,另一维表示这个云滴能够代表概念的确定度。够代表概念的确定度。54不同数值代表语言值不同数值代表语言值 “20 km左右左右”的确定程度的确定程度55不同的数值代表平面上的点不同的数值代表平面上的点 “靠近中心靠近中心”的确定程度的确定程度56l l期期期期望望望望值值值值: : : : 在在在在数数数数域域域域空空空空间间间间最最最最能能能能够够够够代代代代表表表表这这这这个个个个定定定定性性性性概概概概念念念念的的的的点点点点,反反反反映映映映了了了了云云云云滴滴滴滴群群群群的的的的重心位置。重心位置。重心位置。重心位置。云数字特征的双重云数字特征的双重性性ExEnHe熵一方面反映了在数域空熵一方面反映了在数域空间可被概念接受的范围,间可被概念接受的范围,即模糊度即模糊度, ,是定性概念亦此是定性概念亦此亦彼性的度量;另一方面亦彼性的度量;另一方面还反映了在数域空间的点还反映了在数域空间的点能够代表这个概念的概率,能够代表这个概念的概率,表示定性概念的云滴出现表示定性概念的云滴出现的随机性。的随机性。熵揭示了模糊性和随机性熵揭示了模糊性和随机性的关联性。的关联性。超熵是熵的不确定度量,超熵是熵的不确定度量,即熵的熵,反映了在数域即熵的熵,反映了在数域空间代表该语言值的所有空间代表该语言值的所有点的不确定度的凝聚性,点的不确定度的凝聚性,即云滴的凝聚度。即云滴的凝聚度。57正态云发生器的实现算法正态云发生器的实现算法1.1.生成以生成以EnEn为期望值,为期望值,HeHe为方差的一个正态随机为方差的一个正态随机数数EnEn;2.2.生成以生成以ExEx为期望值,为期望值,EnEn为方差的一个正态随为方差的一个正态随机数机数x x;3.3.计算计算 4. 4. 使(使(x , yx , y)成为论域中的一个云滴;成为论域中的一个云滴;5. 5. 重复步骤重复步骤1414直至要求数目的云滴产生。直至要求数目的云滴产生。58逆向云发生器算法逆向云发生器算法1 1 由由由由ExEx = = 求得求得求得求得ExEx;2 2 对每一对(对每一对(对每一对(对每一对(x xi i, , y yi i),),),),由由由由 求出求出求出求出EnEni i ;3 由由En = 求得求得En;4 求求Eni的均方差的均方差 得到得到He;59云模型的多种形态云模型的多种形态l l正态云正态云l l 云云l l其它其它l l多维云多维云60例子例子: : 射击评判射击评判射手乙射手甲射手丙评判人员:评判人员:统计学家、模糊学家、统计学家、模糊学家、 云理论研究者云理论研究者61射击评判射击评判l l统计学家用概率值表示射击效果统计学家用概率值表示射击效果;l l模糊学家用隶属度表示射击效果模糊学家用隶属度表示射击效果;l l裁判用总环数(模糊裁判用总环数(模糊+统计)统计)表示射击效果表示射击效果;l l人们用定性语言评价射击效果,云方法用人们用定性语言评价射击效果,云方法用3个数字特征表示定性概念个数字特征表示定性概念。62云评价方法云评价方法略偏左上,比较离散,不稳定略偏右下,射点集中,较稳定射点靠近靶心,比较离散,不稳定63原始原始靶标靶标还原还原10发发弹着弹着点点还原还原100发发弹着弹着点点64误解:云方法是模糊方法误解:云方法是模糊方法 云方法没有仅仅停留在哲学上的思辩,也不能云方法没有仅仅停留在哲学上的思辩,也不能简单地说是概率方法或模糊方法,通过云模型简单地说是概率方法或模糊方法,通过云模型实现定性概念和定量数据之间的转换是一个十实现定性概念和定量数据之间的转换是一个十分严格的数学方法,使得定性和定量之间的转分严格的数学方法,使得定性和定量之间的转换变得十分清晰、具体和可操作,同时又反映换变得十分清晰、具体和可操作,同时又反映了转换过程的不确定性。了转换过程的不确定性。65连续数据离散化连续数据离散化l l对连续数据,首先求得各数据点的频数,对连续数据,首先求得各数据点的频数,对其分布进行云变换,使之成为若干个对其分布进行云变换,使之成为若干个大小不同的云的叠加,每个云代表一个大小不同的云的叠加,每个云代表一个离散的、定性的概念。数据转换为概念。离散的、定性的概念。数据转换为概念。66原原始始数数据据分分布布拟拟合合结结果果云云变变换换连续数据离散化:云变换连续数据离散化:云变换67概念的粒度概念的粒度 在人的意识活动中,思维的推进是在人的意识活动中,思维的推进是与概念的转移和提升相联系的。转移和与概念的转移和提升相联系的。转移和提升的跨度和路径也是多样的,我们可提升的跨度和路径也是多样的,我们可以把在一定层次上的思维模式看作是为以把在一定层次上的思维模式看作是为原始思维活动拍摄的一张快照。反映概原始思维活动拍摄的一张快照。反映概念对应的客观事物的粒度。概念的粒度念对应的客观事物的粒度。概念的粒度可以用云模型中的熵度量。可以用云模型中的熵度量。68概念空间概念空间 概念空间是指同一类概念的数域。概念空间是指同一类概念的数域。例如,当讨论语言变量例如,当讨论语言变量年龄这个范畴年龄这个范畴内的不同语言值时,如内的不同语言值时,如10岁左右、少年、岁左右、少年、青少年、中年、晚年等等概念,常常要青少年、中年、晚年等等概念,常常要明确它们在数域上所表现出的内涵和外明确它们在数域上所表现出的内涵和外延,以及相互之间的等价(相似)关系延,以及相互之间的等价(相似)关系或从属(包含)关系。因此,不同信息或从属(包含)关系。因此,不同信息粒度之间的概念在概念空间会形成层次粒度之间的概念在概念空间会形成层次的结构。的结构。69概念的层次结构概念的层次结构 当讨论语言变量当讨论语言变量年龄这个范畴内年龄这个范畴内的不同语言值(概念)时,常常要明确的不同语言值(概念)时,常常要明确这些概念是大概念还是小概念,粗概念这些概念是大概念还是小概念,粗概念还是细概念,以及相互之间的等价(相还是细概念,以及相互之间的等价(相似)关系或从属(包含)关系。因此,似)关系或从属(包含)关系。因此,不同信息粒度之间的概念在概念空间会不同信息粒度之间的概念在概念空间会形成层次的结构,或者说是泛概念树结形成层次的结构,或者说是泛概念树结构。构。70不同年龄人的泛概念树不同年龄人的泛概念树少年少年少年少年 未成年人未成年人未成年人未成年人幼儿幼儿幼儿幼儿青年青年青年青年中年中年中年中年婴幼儿婴幼儿婴幼儿婴幼儿儿童儿童儿童儿童小学生小学生小学生小学生中青年中青年中青年中青年中学生中学生中学生中学生大学生大学生大学生大学生所有所有所有所有成年人成年人成年人成年人青壮年青壮年青壮年青壮年老年老年老年老年.71用云用云表示的泛概念树表示的泛概念树微观层中观层宏观层年龄年龄72泛概念树泛概念树l l可动态生成不同层次的概念可动态生成不同层次的概念l l体现了定性概念的随机性和模糊性体现了定性概念的随机性和模糊性l l体现不同层次概念间的多隶属关系体现不同层次概念间的多隶属关系l l反映了数据的实际分布情况反映了数据的实际分布情况l l泛概念树的爬升和跳跃泛概念树的爬升和跳跃73四、数据场和势函数四、数据场和势函数l l 客体间的相互作用和数据场客体间的相互作用和数据场l 势函数及其确定准则势函数及其确定准则l 用数据场思想进行特征提取和用数据场思想进行特征提取和 模式识别模式识别74数据场的引入数据场的引入 学科的交叉渗透是当前科学发展的总学科的交叉渗透是当前科学发展的总趋势,对客观世界的认识和描述,无论是趋势,对客观世界的认识和描述,无论是力学、热物理、电磁学和近代物理,从粒力学、热物理、电磁学和近代物理,从粒子到宇宙在不同尺度上都有场的作用。那子到宇宙在不同尺度上都有场的作用。那么,人自身的认知和思维过程,从数据到么,人自身的认知和思维过程,从数据到信息到知识,是否也可以用场来描述?信息到知识,是否也可以用场来描述?75物理场举例物理场举例l l在在在在一一一一个个个个质质质质量量量量为为为为MM的的的的质质质质点点点点产产产产生生生生的的的的引引引引力力力力场场场场中中中中,任任任任一一一一场点场点场点场点r r r r处的势可以描述为:处的势可以描述为:处的势可以描述为:处的势可以描述为:l l如如如如果果果果空空空空间间间间中中中中存存存存在在在在多多多多个个个个质质质质点点点点,则则则则r r r r处处处处的的的的势势势势等等等等于于于于每每每每个个个个质质质质点点点点单单单单独独独独产产产产生的生的生的生的势势势势的叠加,的叠加,的叠加,的叠加,即即即即76数据与数据场数据与数据场 受物理场的启发,可将物质粒子间相受物理场的启发,可将物质粒子间相互作用及其场描述方法扩展至抽象的数据空互作用及其场描述方法扩展至抽象的数据空间。间。数据空间中的每个对象都相当于一个质数据空间中的每个对象都相当于一个质点或核子,在其周围产生一个球形对称的作点或核子,在其周围产生一个球形对称的作用场用场,位于场内的所有对象都将受到其他对位于场内的所有对象都将受到其他对象的联合作用,从而在整个数据空间上形成象的联合作用,从而在整个数据空间上形成一个场,我们称之为数据场。一个场,我们称之为数据场。正如引力场、正如引力场、核力场可以用势函数描述,我们也引入势函核力场可以用势函数描述,我们也引入势函数来描述数据场的性质。数来描述数据场的性质。77确定势函数形态的准则确定势函数形态的准则l l势函数具有各向同性,即对称性;l l势函数是定义在数域空间上的连续函数;l l势函数值随离开场源的距离增大而下降;l l表示势函数的连续函数,应该光滑,即可微。78可选的势函数形态可选的势函数形态l l拟引力场的势函数:拟引力场的势函数:l l拟核力场的势函数:拟核力场的势函数: 其中,其中, 为以场源坐标为原点时场点的径向半径;参数为以场源坐标为原点时场点的径向半径;参数k为一个为一个正整数,用于调节势函数的衰减特性;参数正整数,用于调节势函数的衰减特性;参数bb(0,+),),用于控用于控制对象的作用范围,称为影响因子;参数制对象的作用范围,称为影响因子;参数a相当于质点或核子的质量相当于质点或核子的质量代表数据场的强度。代表数据场的强度。 79两种势函数形态比较两种势函数形态比较拟引力场的势函数拟核力场的势函数80数据场的势函数定义数据场的势函数定义 已知数据空间中的对象集已知数据空间中的对象集 及其产生的数据场,则任一场点及其产生的数据场,则任一场点y处的势函数处的势函数可以定义为可以定义为所有对象在该点处产生的单位势所有对象在该点处产生的单位势值的叠加:值的叠加: 其中,为场点y与对象xi间的距离;81数据场的可视化数据场的可视化二维二维数据空间数据空间中的一个数据中的一个数据集及其产生的集及其产生的数据场等势线数据场等势线图图82数据场扩展数据场扩展l l自然语言中的基本语言值是定性概念,由于每自然语言中的基本语言值是定性概念,由于每自然语言中的基本语言值是定性概念,由于每自然语言中的基本语言值是定性概念,由于每个定性概念都可以用一个数值型集合来表示其个定性概念都可以用一个数值型集合来表示其个定性概念都可以用一个数值型集合来表示其个定性概念都可以用一个数值型集合来表示其内涵和外延,内涵和外延,内涵和外延,内涵和外延, 即对应着一个定量的数据子空间,即对应着一个定量的数据子空间,即对应着一个定量的数据子空间,即对应着一个定量的数据子空间,称为概念空间。概念和概念之间也可以通过场称为概念空间。概念和概念之间也可以通过场称为概念空间。概念和概念之间也可以通过场称为概念空间。概念和概念之间也可以通过场相互作用,形成概念间的泛层次树,又称上、相互作用,形成概念间的泛层次树,又称上、相互作用,形成概念间的泛层次树,又称上、相互作用,形成概念间的泛层次树,又称上、下位词表。下位词表。下位词表。下位词表。l l人类思维过程中的对象,对应着一个定量的数人类思维过程中的对象,对应着一个定量的数人类思维过程中的对象,对应着一个定量的数人类思维过程中的对象,对应着一个定量的数据空间,反映对象的多个属性,称为特征空间。据空间,反映对象的多个属性,称为特征空间。据空间,反映对象的多个属性,称为特征空间。据空间,反映对象的多个属性,称为特征空间。对象和对象之间也通过场相互作用,形成知识。对象和对象之间也通过场相互作用,形成知识。对象和对象之间也通过场相互作用,形成知识。对象和对象之间也通过场相互作用,形成知识。l l概念空间和特征空间中的场统称为数据场。概念空间和特征空间中的场统称为数据场。概念空间和特征空间中的场统称为数据场。概念空间和特征空间中的场统称为数据场。83我们将云滴的我们将云滴的确定度视为场确定度视为场源的质量源的质量,显显然,确定度高然,确定度高的云滴具有较的云滴具有较强的作用场。强的作用场。右图中每个云右图中每个云滴的位置坐标滴的位置坐标和确定度为:和确定度为: A(10,12,0.6) B(10,10,1) C(13,11,0.3)8910111213141589101112131415A AB BC C不同确定度的三个云滴形成的数据场等势线图不同确定度的三个云滴形成的数据场等势线图84用数据场思想进行特征提取用数据场思想进行特征提取和模式识别和模式识别85AABBCCDDE EF FGGHHI IJ J预处理后的人脸图像预处理后的人脸图像每幅图象的原始尺寸为每幅图象的原始尺寸为 256 x 256 个像素点,个像素点,256级灰度级灰度86灰度数据集映射成为数据场灰度数据集映射成为数据场及势的局部极值及势的局部极值AABBCCDDE EF FGGHHI IJ J878.698.69171730308.418.411010191913.6113.6128282020J J11.8011.801919282811.1411.141010191913.9113.9127271818I I12.4512.451818292911.8311.839 9181814.0814.0827271616H H11.7111.711818292912.6612.661010191913.2013.2026261919GG10.9610.961818282812.8012.801010191913.1413.1426261919F F11.9211.921818292912.3912.391010191913.0513.0526261919E E11.2511.251818303012.0512.051010181812.8112.8126261818D D11.1011.101818292912.5512.551010191912.6912.6926261919C C10.9210.921818292911.8811.881010191913.2913.2925251919B B11.2111.211919303012.1312.131010191912.6312.6326261919A AV VP PY YX XV VP PY YX XV VP PY YX XThe third featureThe third featureThe second featureThe second featureThe first featureThe first featureNameNamefeaturefeature数据场的极值成为逻辑特征数据场的极值成为逻辑特征88二次生成数据场进行模式识别二次生成数据场进行模式识别lIf we pick up an extreme local maximum potential value and its position as the most important feature for each face image, the facial feature data field for the ten face images may be, once again, illustrated by a new isopotential lines.89Face identification with the first featureAABBCCDDE EF FGGHHI IJ J90Isopotential lines show the similarities and outliers for the ten imagesA A A AC C C CE E E EF F F FG G G GB B B BD D D DI I I IH H H HJ J J JAABBCCDDE EF FGGHHI IJ J91Face Recognition using Facial Main Feature Data FieldlWe may also pick up N local maximum potential values and their positions as the main features for each face picture, the main feature data are calculated byThe main feature data field for the ten face picture is illustrated once again by equal potential lines.and92用多个特征用多个特征值融合后的值融合后的识别结果识别结果AABBCCDDE EF FGGHHI IJ J93Face identification: discovering similarities and discriminationB B B BC C C CG G G GE E E ED D D DF F F FA A A AH H H HI I I IJ J J JAABBCCDDE EF FGGHHI IJ J94用数据场方法看用数据场方法看IRISIRIS数据分类数据分类95IRIS原始数据集2.12.15.45.43.13.16.96.9Virginica Virginica 1.81.84.84.83.03.06.06.0Virginica Virginica Virginica Virginica 2.52.55.75.73.33.36.76.7Virginica Virginica 2.32.35.95.93.23.26.86.8Virginica Virginica Versicolour Versicolour 1.51.54.94.93.13.1 6.9 6.9Versicolour Versicolour 1.51.54.54.53.23.26.46.4Versicolour Versicolour 1.41.44.74.73.23.27.07.0Versicolour Versicolour SetosaSetosa 0.20.21.41.43.63.65.05.0SetosaSetosa 0.20.21.31.33.23.24.74.7SetosaSetosa 0.20.21.41.43.03.04.94.9SetosaSetosa 0.20.21.41.43.53.55.15.1SetosaSetosa 花片宽度花片宽度花瓣长度花瓣长度萼片宽度萼片宽度萼片长度萼片长度类型类型96数据预处理数据预处理 对iris数据中的萼片属性和花瓣属性分别做降维处理,得到新的属性: 花瓣张角=arctg(花瓣宽度/花瓣长度); 萼片张角=arctg(萼片宽度/萼片长度);97处理后数据集处理后数据集0.33930.3393 0.4704 0.4704VirginicaVirginica0.40270.4027 0.5016 0.5016VirginicaVirginicaVirginicaVirginica0.41330.4133 0.4577 0.4577VirginicaVirginica0.37170.3717 0.4398 0.4398VirginicaVirginicaVersicolourVersicolour0.29710.29710.42230.4223VersicolourVersicolour0.32180.32180.46360.4636VersicolourVersicolour0.28950.28950.42880.4288VersicolourVersicolourSetosaSetosa0.13260.13260.59300.5930SetosaSetosa0.15260.15260.59780.5978SetosaSetosa 0.14190.14190.54940.5494SetosaSetosa 0.14190.14190.60150.6015SetosaSetosa 花瓣张角花瓣张角花瓣张角花瓣张角萼片张角萼片张角萼片张角萼片张角类型类型类型类型98预处理后数据分布预处理后数据分布99从数据场平面分布看分类结果从数据场平面分布看分类结果100从数据场立体分布看分类结果从数据场立体分布看分类结果12.376019.00029.99463.4336101五、认知场中的知识发现五、认知场中的知识发现l l 数据挖掘与知识发现数据挖掘与知识发现l 发现状态空间发现状态空间l 类谱图类谱图102数据挖掘与知识发现数据挖掘与知识发现Data Mining and Knowledge Discovery从从大大量量的的、不不完完全全的的、有有噪噪声声的的、模模糊糊的的、随随机机的的实实际际应应用用的的数数据据中中,提提取取隐隐含含在在其其中中的的、人人们们事事先先不不知知道道的的、但又是潜在有用的信息和知识的过程。但又是潜在有用的信息和知识的过程。103从数据中发现知识的难点从数据中发现知识的难点大大量量甚甚至至海海量量数数据据中中,存存在在有有数数据据的的误误差差、畸畸变变、丢丢失失或或过过度度重重叠叠,以以归归纳纳为为主主的的知知识识发发现现过过程程,实实际际上上是是建建立立在在或或多多或或少少的的病病态态数数据据之之上上;由由种种种种案案例例数数据据反反推推对对象象的的性性质质可可认认为为是是逆逆向向思思维维,人人们们在在命命题题、方方法法或结果三个方面会获得更多的目标选择。或结果三个方面会获得更多的目标选择。104数据挖掘数据挖掘数据选择数据选择数据选择数据选择预处理预处理预处理预处理挖掘和发现挖掘和发现挖掘和发现挖掘和发现知识解释和验证知识解释和验证知识解释和验证知识解释和验证SelectionPreprocessingTransformationData MiningInterpretation/EvaluationTraget DataProcessed DataTransformed DataPatternsKnowledgeDMKD系统的基本构成106发现什么样的知识?发现什么样的知识?关联知识关联知识关联知识关联知识聚类知识聚类知识聚类知识聚类知识序列知识序列知识序列知识序列知识 分类知识分类知识预测知识预测知识相似时间序列相似时间序列数据挖掘工具数据挖掘工具l l归纳归纳l l演绎演绎l l联想联想l l类比类比l l证伪证伪数据挖掘与知识发现数据挖掘与知识发现Data Mining and Knowledge Discovery 特定问题或特定环境下的数据,是特定问题或特定环境下的数据,是一种原始的、混乱的、不成形的自然状一种原始的、混乱的、不成形的自然状态积累,但又是一种可以从中生长出秩态积累,但又是一种可以从中生长出秩序和规则的源泉。如何透过表观上的千序和规则的源泉。如何透过表观上的千头万绪、混乱无规,去挖掘蕴含其中的头万绪、混乱无规,去挖掘蕴含其中的规则性、有序性、相关性和离群性,这规则性、有序性、相关性和离群性,这就是知识发现。就是知识发现。109DMKD的本质的本质l什么是数据?什么是信息?什么是知识什么是数据?什么是信息?什么是知识?l本质是归纳,是由微观到中观到宏观的本质是归纳,是由微观到中观到宏观的抽象抽象. .l瓶颈是数据、信息和知识表示的不确定瓶颈是数据、信息和知识表示的不确定性问题性问题. .110发现状态空间发现状态空间抽抽象象程程度度AMTO111发现状态空间发现状态空间l l特征空间的对象通过场发生相互作用。如同物特征空间的对象通过场发生相互作用。如同物特征空间的对象通过场发生相互作用。如同物特征空间的对象通过场发生相互作用。如同物理学中粒子之间通过场(场量子)形成强力、理学中粒子之间通过场(场量子)形成强力、理学中粒子之间通过场(场量子)形成强力、理学中粒子之间通过场(场量子)形成强力、电磁力、弱力或引力的相互作用一样。电磁力、弱力或引力的相互作用一样。电磁力、弱力或引力的相互作用一样。电磁力、弱力或引力的相互作用一样。l l对象在特征空间相互作用形成的场结构反映了对象在特征空间相互作用形成的场结构反映了对象在特征空间相互作用形成的场结构反映了对象在特征空间相互作用形成的场结构反映了对象的普遍知识(广义知识)。随着描述对象对象的普遍知识(广义知识)。随着描述对象对象的普遍知识(广义知识)。随着描述对象对象的普遍知识(广义知识)。随着描述对象粒度(熵)越来越大,形成的普遍知识越来越粒度(熵)越来越大,形成的普遍知识越来越粒度(熵)越来越大,形成的普遍知识越来越粒度(熵)越来越大,形成的普遍知识越来越宏观。发现了的知识上升到抽象级别更高的层宏观。发现了的知识上升到抽象级别更高的层宏观。发现了的知识上升到抽象级别更高的层宏观。发现了的知识上升到抽象级别更高的层次。次。次。次。l l2020世纪的物理学的发展是简化归纳。数据挖掘世纪的物理学的发展是简化归纳。数据挖掘世纪的物理学的发展是简化归纳。数据挖掘世纪的物理学的发展是简化归纳。数据挖掘的本质也是简化归纳。的本质也是简化归纳。的本质也是简化归纳。的本质也是简化归纳。112人类的认知过程是对复杂对象关系的中观、宏观的知识发现过程,是对象所在的特征空间的微观数据通过用自然语言表述的不同抽象度概念的非线性相互作用下涌现(突现)的自组织特性。113发现状态空间发现状态空间 = = ( (特征空间特征空间| |概念粒度概念粒度) 114数据挖掘过程,实际上是从不数据挖掘过程,实际上是从不同的抽象度上认识数据。所谓同的抽象度上认识数据。所谓微观、中观、宏观,就是可视微观、中观、宏观,就是可视化的称谓。因此,数据挖掘需化的称谓。因此,数据挖掘需要各级视图的支持。要各级视图的支持。115随着抽象度的提高:随着抽象度的提高:l l描述每个属性中的概念的粒度越来越大;描述每个属性中的概念的粒度越来越大;l l特征空间对象之间的关系越来越普遍;特征空间对象之间的关系越来越普遍;l l发现的知识逐步由微观走向中观、宏观;发现的知识逐步由微观走向中观、宏观;l l整个归纳过程形成发现状态空间的不断整个归纳过程形成发现状态空间的不断转换。转换。116对象属性的选取形成不同视对象属性的选取形成不同视图,好比是从不同角度投射图,好比是从不同角度投射到客体的不同光柱,它们各到客体的不同光柱,它们各有所见不及之处,但也各自有所见不及之处,但也各自照亮了不同景象照亮了不同景象。117从不同距离观察客体群,各从不同距离观察客体群,各有所见之景象。通过推拉镜有所见之景象。通过推拉镜头,可以改变观察的距离,头,可以改变观察的距离,形成不同粒度的视图。形成不同粒度的视图。118特征空间特征空间 当我们讨论一个客体(对象、事物、当我们讨论一个客体(对象、事物、案例、记录等)具有不同属性或特征时,案例、记录等)具有不同属性或特征时,常常用特征空间作为讨论问题的范畴,常常用特征空间作为讨论问题的范畴,N个个属性或特征,构成属性或特征,构成N维空间。这时,这个客维空间。这时,这个客体成为特征空间的一个点。特征空间任何体成为特征空间的一个点。特征空间任何一点的势可认为是所有客体在这一点的势一点的势可认为是所有客体在这一点的势的叠加。的叠加。119特征空间的聚类和类谱图特征空间的聚类和类谱图 当我们进行数据挖掘时,将数据库当我们进行数据挖掘时,将数据库中的一条记录按照其中的一条记录按照其N个属性,把这条记个属性,把这条记录映射到特征空间中的一个特定点上,录映射到特征空间中的一个特定点上,成千上万的记录在特征空间是成千上万成千上万的记录在特征空间是成千上万个点,整体上呈现出的抱团特性,可以个点,整体上呈现出的抱团特性,可以通过嵌套的等势线通过嵌套的等势线(面面)-自然的拓扑结自然的拓扑结构,形成自然的聚类和类谱图。构,形成自然的聚类和类谱图。120分类和聚类研究的基础性分类和聚类研究的基础性 分类和聚类,乃是人类社会活动、分类和聚类,乃是人类社会活动、生产活动以及科研活动中最基本、最重生产活动以及科研活动中最基本、最重要的活动之一。分类和聚类研究的基础要的活动之一。分类和聚类研究的基础性决定了其应用的普遍性。性决定了其应用的普遍性。121场方法发现聚类知识场方法发现聚类知识姓名工龄(月)工资(千元)A3030B5030C4070D6070E7050122304050607080工龄304050607080工资A AB BC CD DE E特征空间特征空间5 5个对象的自然聚类个对象的自然聚类1235 5个对象构成的泛类谱系图个对象构成的泛类谱系图ABCDE124特征空间的特征空间的3000个对象的自然聚类个对象的自然聚类A AB BC C304050607080工龄304050607080工资A AB BC CD DE E125和传统聚类方法的比较:和传统聚类方法的比较:l l通常,人们用通常,人们用N个客体中的个客体中的N1个样本作个样本作为为训练集训练集去形成聚类结果,用去形成聚类结果,用N-N1个样个样本作为本作为测试集测试集去验证聚类效果。实际上,去验证聚类效果。实际上,这就宣布了只有这这就宣布了只有这N1个样本才对聚类有个样本才对聚类有贡献,若贡献,若N=100,极端地设想极端地设想N1=2或或 N1=98,必然会有不同结果。如何确定必然会有不同结果。如何确定N1并选取那些样本为并选取那些样本为N1,成为一个大问题成为一个大问题,也暴露出这种方法的缺陷。,也暴露出这种方法的缺陷。126和传统聚类方法的比较:和传统聚类方法的比较:l l从极微观上看,这从极微观上看,这N个客体各自都有体现个客体各自都有体现自身价值的不同特征,差异是绝对的,自身价值的不同特征,差异是绝对的,最严最细的分法应该是最严最细的分法应该是N类。从极宏观上类。从极宏观上看,这看,这N个客体既然被用若干特征放到一个客体既然被用若干特征放到一起比较,说明具有可比性,可以统属一起比较,说明具有可比性,可以统属一类。类。l l在发现状态空间不同概念层次上聚类,在发现状态空间不同概念层次上聚类,以及聚类的相对性,就是我们的聚类观。以及聚类的相对性,就是我们的聚类观。127知识就是不同层次上的知识就是不同层次上的“规则规则+ +例外例外”128304050607080工龄304050607080工资去除例外后的聚类图去除例外后的聚类图A AC C304050607080工龄304050607080工资129304050607080工龄304050607080工资304050607080工龄304050607080工资3000个对象中类和离群的相对性个对象中类和离群的相对性130信息粒度信息粒度l l粒度粒度(Granularity)原本是一个物理学的原本是一个物理学的概念,是指概念,是指“微粒大小的平均度量微粒大小的平均度量”,在这里被借用作为对概念的抽象度的度在这里被借用作为对概念的抽象度的度量。把概念可视化。量。把概念可视化。l l概念的粒度用云的熵来度量。概念的粒度用云的熵来度量。l l概念在定量空间的位置用云的期望值来概念在定量空间的位置用云的期望值来标定。标定。131信息粒度信息粒度 人类智能的一个公认特点是人们能够从极不人类智能的一个公认特点是人们能够从极不相同的粒度上观察和分析同一问题,各有各相同的粒度上观察和分析同一问题,各有各的用处。人们不仅能够在同一粒度的世界上的用处。人们不仅能够在同一粒度的世界上进行问题求解,而且能够很快地从一个粒度进行问题求解,而且能够很快地从一个粒度世界跳到另一个粒度世界,往返自如;甚至世界跳到另一个粒度世界,往返自如;甚至具有同时处理不同粒度世界的能力。这正是具有同时处理不同粒度世界的能力。这正是人类问题求解的强有力的表现。人类问题求解的强有力的表现。132观察距离观察距离:境界决定了认知的高度境界决定了认知的高度l l从较细的粒度世界跃升到较粗的粒度世从较细的粒度世界跃升到较粗的粒度世界,是对信息或知识的抽象,可以使问界,是对信息或知识的抽象,可以使问题简化,数据处理量大大减少,这一过题简化,数据处理量大大减少,这一过程称为数据简约或归约。程称为数据简约或归约。l l换句话说,用粗粒度观察和分析信息,换句话说,用粗粒度观察和分析信息,就是增加观察距离,忽略细微的差别,就是增加观察距离,忽略细微的差别,寻找共性。共性常常比个性更深刻寻找共性。共性常常比个性更深刻,可以可以求得宏观的把握。求得宏观的把握。133观察距离观察距离:境界决定了认知的高度境界决定了认知的高度l l反过来,缩短观察距离,用细粒度观察反过来,缩短观察距离,用细粒度观察和分析信息,发现纷繁复杂的表象,更和分析信息,发现纷繁复杂的表象,更准确地区分差别,个性要比共性丰富,准确地区分差别,个性要比共性丰富,但是不能完全进入共性之中。但是不能完全进入共性之中。l l通过概念提升通过概念提升, 就是增加观察距离,可以就是增加观察距离,可以发现更普遍的知识。发现更普遍的知识。134拉镜头拉镜头发现特征空间的宏观知识:发现特征空间的宏观知识:l l属性方向和宏元组方向的概括性加大;属性方向和宏元组方向的概括性加大;知识模板的物理尺寸减小。知识模板的物理尺寸减小。l l从较细的粒度跃升到较粗的粒度世界,从较细的粒度跃升到较粗的粒度世界,是对数据的抽象,简化问题,减少数据是对数据的抽象,简化问题,减少数据量,这一过程称为数据的归约。量,这一过程称为数据的归约。l l忽略细微的差别,寻找共性。共性常常忽略细微的差别,寻找共性。共性常常比个性更深刻。比个性更深刻。135推镜头推镜头发现特征空间的微观知识:发现特征空间的微观知识:l l在发现空间的某个抽象层次上,缩短观在发现空间的某个抽象层次上,缩短观察距离,用较细粒度观察和分析信息,察距离,用较细粒度观察和分析信息,发现纷繁复杂的表象,更准确地区分差发现纷繁复杂的表象,更准确地区分差别;别;l l个性要比共性丰富,但是不能完全进入个性要比共性丰富,但是不能完全进入共性之中。共性之中。136发现策略和方法发现策略和方法l l发现是微观和宏观之间的跳跃,是信息发现是微观和宏观之间的跳跃,是信息粒度的变化,或者说是观察距离的不同;粒度的变化,或者说是观察距离的不同;l l综合运用归纳、类比、联想,并结合证综合运用归纳、类比、联想,并结合证伪和演绎,形成五大手段;伪和演绎,形成五大手段;l l以云模型作为定性定量转换和知识表示以云模型作为定性定量转换和知识表示的工具。的工具。l l具体发现方法可以是多种多样的。具体发现方法可以是多种多样的。137知识发现机理知识发现机理l l数据挖掘揭示了人类由个别到一般、从具体到数据挖掘揭示了人类由个别到一般、从具体到数据挖掘揭示了人类由个别到一般、从具体到数据挖掘揭示了人类由个别到一般、从具体到抽象的抽象的抽象的抽象的“ “数据数据数据数据概念概念概念概念规则规则规则规则” ”的认知规律。的认知规律。的认知规律。的认知规律。l l概念是认知的基元;数据是形成概念的要素;概念是认知的基元;数据是形成概念的要素;概念是认知的基元;数据是形成概念的要素;概念是认知的基元;数据是形成概念的要素;规则是在不同概念层次上客体之间的关联;不规则是在不同概念层次上客体之间的关联;不规则是在不同概念层次上客体之间的关联;不规则是在不同概念层次上客体之间的关联;不同抽象度的知识,实际上是不同概念层次上的同抽象度的知识,实际上是不同概念层次上的同抽象度的知识,实际上是不同概念层次上的同抽象度的知识,实际上是不同概念层次上的“ “规则加例外规则加例外规则加例外规则加例外” ”而已;境界决定了认知的高度。而已;境界决定了认知的高度。而已;境界决定了认知的高度。而已;境界决定了认知的高度。l l认知物理学用计算机具体实现了这一规律的发认知物理学用计算机具体实现了这一规律的发认知物理学用计算机具体实现了这一规律的发认知物理学用计算机具体实现了这一规律的发现过程。现过程。现过程。现过程。138从数据开采的角度看专家系统:从数据开采的角度看专家系统:l l专家系统是正向方式认识世界,以演绎专家系统是正向方式认识世界,以演绎为主;数据开采是逆向方式认识世界,为主;数据开采是逆向方式认识世界,以归纳为主。以归纳为主。l l通过数据开采来发现知识的过程,就是通过数据开采来发现知识的过程,就是构造专家系统、生成知识库的过程。构造专家系统、生成知识库的过程。139The Experimental Database140Mining Association Rulesl lApriori algorithmApriori algorithml lCloud based generalization as preprocessingCloud based generalization as preprocessing 2D clouds : location2D clouds : location 1D clouds : elevation, road density, distance to the 1D clouds : elevation, road density, distance to the sea, average incomesea, average incomel lMinimum Support : 6% Minimum Support : 6% Minimum Confidence : 75%Minimum Confidence : 75%l lMining association at multiple concept levelsMining association at multiple concept levels141Discovered Association Rules for “average income”l lRule 1 : If location is “southeast”, Rule 1 : If location is “southeast”, road density is “high”, and distance road density is “high”, and distance to the sea is “close”, then average to the sea is “close”, then average income is “high”.income is “high”.l lRule 2 : If location is “north by east”, Rule 2 : If location is “north by east”, road density is “high”, and distance road density is “high”, and distance to the sea is “close”, then average to the sea is “close”, then average income is “high”income is “high”l lRule 5 : If location is “northwest”, Rule 5 : If location is “northwest”, road density is “low”, and distance to road density is “low”, and distance to the sea is “far”, then average income the sea is “far”, then average income is “low.is “low.l lRule 6 : If location is “central”, road Rule 6 : If location is “central”, road density is “high”, and distance to the density is “high”, and distance to the sea is “middle”, then average income sea is “middle”, then average income is “middle”.is “middle”.142Discovered Association Rules for “road density”l lRule 1: If elevation is “low”, Rule 1: If elevation is “low”, then road density is “high”.then road density is “high”.l lRule 2: If elevation is “high”, Rule 2: If elevation is “high”, then road density is “low”.then road density is “low”.l lRule 3: If elevation is Rule 3: If elevation is “middle” and location is “middle” and location is “northwest”, then road “northwest”, then road density is “low”.density is “low”.l lRule 4: If elevation is Rule 4: If elevation is “middle” and location is “middle” and location is “north”, then road density is “north”, then road density is “middle”.“middle”.143世界著名科学家、诺贝尔物世界著名科学家、诺贝尔物理学奖获得者李政道在物理学奖获得者李政道在物理的挑战讲演中说:理的挑战讲演中说:l l“20世纪的物理发展,是简化归纳世纪的物理发展,是简化归纳”l l“科学,不管天文、物理、生物、化学,科学,不管天文、物理、生物、化学,对自然界的现象,进行新的准确的抽象,对自然界的现象,进行新的准确的抽象,科学家抽象的叙述越简单,应用越广泛,科学家抽象的叙述越简单,应用越广泛,科学创造也就越深刻。科学创造也就越深刻。”144认知物理学的局限性认知物理学的局限性l l 认知心理学认知心理学认知心理学认知心理学 (Cognitive Psychology)Cognitive Psychology) 知觉、记忆、意识、学习、言语、情感、识别、思知觉、记忆、意识、学习、言语、情感、识别、思知觉、记忆、意识、学习、言语、情感、识别、思知觉、记忆、意识、学习、言语、情感、识别、思考、决策、创造等考、决策、创造等考、决策、创造等考、决策、创造等l l 认知语言学认知语言学认知语言学认知语言学 ( (Cognitive Linguistics)Cognitive Linguistics) 言语理解(语音、语调、语意)、言语和情感、语言语理解(语音、语调、语意)、言语和情感、语言语理解(语音、语调、语意)、言语和情感、语言语理解(语音、语调、语意)、言语和情感、语言和概念、语言和思维、听和说、语言和音乐、语言和概念、语言和思维、听和说、语言和音乐、语言和概念、语言和思维、听和说、语言和音乐、语言和概念、语言和思维、听和说、语言和音乐、语言和心理、儿语和认知等言和心理、儿语和认知等言和心理、儿语和认知等言和心理、儿语和认知等l l 认知物理学认知物理学认知物理学认知物理学 ( (Cognitive Physics)Cognitive Physics) 主观和客观、物质和概念、层次和模型、认知场等主观和客观、物质和概念、层次和模型、认知场等主观和客观、物质和概念、层次和模型、认知场等主观和客观、物质和概念、层次和模型、认知场等145结结 论论 一一 物理学对客观世界的认识,无论是力学、物理学对客观世界的认识,无论是力学、热物理、电磁学和近代物理,从粒子到热物理、电磁学和近代物理,从粒子到宇宙,在不同尺度上都有宇宙,在不同尺度上都有模型、层次和模型、层次和场场的理论。那么,人自身的主观认知和的理论。那么,人自身的主观认知和思维过程,从数据到信息到知识,是否思维过程,从数据到信息到知识,是否也可以用也可以用模型、层次和场模型、层次和场来描述?来描述?146结结 论论 二二 按照认知物理学的思路,把云模型作为思维的按照认知物理学的思路,把云模型作为思维的按照认知物理学的思路,把云模型作为思维的按照认知物理学的思路,把云模型作为思维的原子模型;通过概念空间中的数据场形成不同原子模型;通过概念空间中的数据场形成不同原子模型;通过概念空间中的数据场形成不同原子模型;通过概念空间中的数据场形成不同的概念层次关系;通过特征空间对象的数据场的概念层次关系;通过特征空间对象的数据场的概念层次关系;通过特征空间对象的数据场的概念层次关系;通过特征空间对象的数据场形成不同的类和类谱系图;在不同概念粒度上形成不同的类和类谱系图;在不同概念粒度上形成不同的类和类谱系图;在不同概念粒度上形成不同的类和类谱系图;在不同概念粒度上对象构成的特征空间呈现出不同的发现状态,对象构成的特征空间呈现出不同的发现状态,对象构成的特征空间呈现出不同的发现状态,对象构成的特征空间呈现出不同的发现状态,境界决定了认知的高度,用场和等势线可视化境界决定了认知的高度,用场和等势线可视化境界决定了认知的高度,用场和等势线可视化境界决定了认知的高度,用场和等势线可视化人类的思维过程,从而发现对象之间的关联,人类的思维过程,从而发现对象之间的关联,人类的思维过程,从而发现对象之间的关联,人类的思维过程,从而发现对象之间的关联,形成不同抽象度的知识,即不同概念层次上的形成不同抽象度的知识,即不同概念层次上的形成不同抽象度的知识,即不同概念层次上的形成不同抽象度的知识,即不同概念层次上的“ “类和离群类和离群类和离群类和离群” ”,或者,或者,或者,或者 “ “规则加例外规则加例外规则加例外规则加例外” ”。147结结 论论 三三l l “ “数据数据数据数据概念概念概念概念规则规则规则规则” ”的发现机理和方法揭示的发现机理和方法揭示的发现机理和方法揭示的发现机理和方法揭示并用计算机模拟了人类由个别到一般、从具体并用计算机模拟了人类由个别到一般、从具体并用计算机模拟了人类由个别到一般、从具体并用计算机模拟了人类由个别到一般、从具体到抽象的认知规律和具体的、用计算机实现的到抽象的认知规律和具体的、用计算机实现的到抽象的认知规律和具体的、用计算机实现的到抽象的认知规律和具体的、用计算机实现的思维和发现知识的过程。思维和发现知识的过程。思维和发现知识的过程。思维和发现知识的过程。l l 认知物理学为当前人工智能研究开辟了新的认知物理学为当前人工智能研究开辟了新的认知物理学为当前人工智能研究开辟了新的认知物理学为当前人工智能研究开辟了新的道路和提供了新的工具,在数据挖掘、模式识道路和提供了新的工具,在数据挖掘、模式识道路和提供了新的工具,在数据挖掘、模式识道路和提供了新的工具,在数据挖掘、模式识别、自然语言理解、图象压缩等许多领域都有别、自然语言理解、图象压缩等许多领域都有别、自然语言理解、图象压缩等许多领域都有别、自然语言理解、图象压缩等许多领域都有着广阔的应用前景。着广阔的应用前景。着广阔的应用前景。着广阔的应用前景。148认知物理学认知物理学 大统一的梦想大统一的梦想 求知是人的本能。人从自然界异化出来之后,求知是人的本能。人从自然界异化出来之后,求知是人的本能。人从自然界异化出来之后,求知是人的本能。人从自然界异化出来之后,便开始了对宇宙万物的认识活动,取得了惊人的便开始了对宇宙万物的认识活动,取得了惊人的便开始了对宇宙万物的认识活动,取得了惊人的便开始了对宇宙万物的认识活动,取得了惊人的成就,同时人们也开始了对自身认知机理的理解。成就,同时人们也开始了对自身认知机理的理解。成就,同时人们也开始了对自身认知机理的理解。成就,同时人们也开始了对自身认知机理的理解。这种主客观的认知活动有没有相似之处?既然这种主客观的认知活动有没有相似之处?既然这种主客观的认知活动有没有相似之处?既然这种主客观的认知活动有没有相似之处?既然2020世纪的物理发展是简化归纳。数据挖掘的本质也世纪的物理发展是简化归纳。数据挖掘的本质也世纪的物理发展是简化归纳。数据挖掘的本质也世纪的物理发展是简化归纳。数据挖掘的本质也是简化归纳。能不能预言,是简化归纳。能不能预言,是简化归纳。能不能预言,是简化归纳。能不能预言,2121世纪的认知和思维世纪的认知和思维世纪的认知和思维世纪的认知和思维科学的发展,就是把现代物理学中对客观世界的科学的发展,就是把现代物理学中对客观世界的科学的发展,就是把现代物理学中对客观世界的科学的发展,就是把现代物理学中对客观世界的认知理论引伸到对主观世界的认知,不妨认为这认知理论引伸到对主观世界的认知,不妨认为这认知理论引伸到对主观世界的认知,不妨认为这认知理论引伸到对主观世界的认知,不妨认为这是主客观一致的大统一理论梦想。是主客观一致的大统一理论梦想。是主客观一致的大统一理论梦想。是主客观一致的大统一理论梦想。149 谢谢 谢!谢!150
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号