资源预览内容
第1页 / 共27页
第2页 / 共27页
第3页 / 共27页
第4页 / 共27页
第5页 / 共27页
第6页 / 共27页
第7页 / 共27页
第8页 / 共27页
第9页 / 共27页
第10页 / 共27页
亲,该文档总共27页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第二章 医学数据、 信息和知识医学数据、信息和知识医学数据和计量症状学医学数据和计量症状学医学数据医学数据 医学数据与信息医学数据与信息 医疗数据的变异医疗数据的变异 医疗数据的解释医疗数据的解释 计量症状学计量症状学 检查的诊断价值检查的诊断价值 症状的情报价值症状的情报价值 症状预测价值的评估方法症状预测价值的评估方法 教学要求教学要求通过本课学习,学生应该能够:通过本课学习,学生应该能够: 区分医学数据和信息区分医学数据和信息 描述医学数据的变异来源描述医学数据的变异来源 医学信息的类型及其量的计算医学信息的类型及其量的计算 医学数据、信息和知识数据(数据(Data):为分析所预备的单个条目。为分析所预备的单个条目。 一条数据一条数据( A datum):在这里是指对病人的一项观察。:在这里是指对病人的一项观察。医学数据医学数据(medical data):有关一个病人的观察的集合。有关一个病人的观察的集合。信息(信息(Information):带有某种解释或者附加含义的成带有某种解释或者附加含义的成 组的数据。组的数据。从数据中抽出的有意义或者有用的事实。简称之为解释过从数据中抽出的有意义或者有用的事实。简称之为解释过的数据的数据(interpreted data)。知识(知识(Knowledge):一组用于从数据和信息中创造信息的一组用于从数据和信息中创造信息的规则、公式或者探索方法。规则、公式或者探索方法。医学数据、信息和知识医疗过程中医疗过程中 数据、信息与知识数据、信息与知识病人病人推理推理观察观察计划计划信息知识治疗数据医学数据、信息和知识小结:小结: 三者的区别在于加工与抽象的不同三者的区别在于加工与抽象的不同数据数据 信息信息 知识知识医疗过程的知识生产特点医疗过程的知识生产特点知识增量是目的知识增量是目的医学数据、信息和知识叙述叙述(narrative):由医生纪录。测量数值测量数值(numerical measurements):血压、体温、 化验值等。编码数据(编码数据(coded data):):文本数据文本数据(textual data):某些以文本形式报告的结果。记录的信号记录的信号(recorded signals):心电图、脑电图等等。图像图像( image):X线等。第二节第二节 医学数据医学数据医学数据的类型医学数据的类型(从表(从表现形式划分)形式划分)医学数据、信息和知识 计量资料(计量资料(measurement data):对每个观察对象的观察指标用定量的方法测定该指标的数值大小数值大小所得的资料。一般用度量衡单位表示,如身高、体重、浓度等等。计数资料计数资料(enumeration data):先将观察对象的观察指标按性质或者类别进行分组,然后计数各组该观察指标的数目数目所得的资料。如人群的血型分布。 等级分组资料:等级分组资料:具有计数资料的性质,同时又兼有半定量的性质。如化验结果的加号。 上述的资料可以转化。医学数据的类型(从分布角度划分)医学数据的类型(从分布角度划分)医学数据、信息和知识 此外,还有一种类似的对此外,还有一种类似的对变量变量(被观察单位的特征或(被观察单位的特征或指标)的分类方法:指标)的分类方法:分类变量(分类变量(categorical variable):):定性变量,定性变量,有两个有两个或多个互不相容的类别或属性。又进一步分为无序分类和或多个互不相容的类别或属性。又进一步分为无序分类和有序分类。无序分类包括二项分类和多项分类。有序分类。无序分类包括二项分类和多项分类。数值变量数值变量(numerical variable):定量变量,定量变量,也就是计量也就是计量资料。以连续形式存在的,如生理信号、资料。以连续形式存在的,如生理信号、ECG、EKG等。等。有时可以数值化的数据与一段自由文本存放在一起。在计有时可以数值化的数据与一段自由文本存放在一起。在计算机病历中往往存储这种混合式的数据(文字和数据)。算机病历中往往存储这种混合式的数据(文字和数据)。固定和活动图像是另一类的混合数据,有时还附有自由文固定和活动图像是另一类的混合数据,有时还附有自由文本式的文字评述。本式的文字评述。医学数据的类型(变量分类)医学数据的类型(变量分类)医学数据、信息和知识变量类型变量类型变量值表现变量值表现实例实例资料资料类型类型数量变量数量变量定量(具体数值)定量(具体数值)身高(身高(cm)计量计量资料资料分分类类变变量量无无序序二分类二分类对立的两类属性对立的两类属性性别(男,女)性别(男,女)计数计数资料资料多分类多分类不相容的多类属性不相容的多类属性血型(血型(A,B,O)有有序序多分类多分类类间有程度差异的属类间有程度差异的属性(又称等级资料)性(又称等级资料)文化程度(初中、文化程度(初中、高中、大学高中、大学.)医学数据和变量的分布类型医学数据和变量的分布类型医学数据、信息和知识 每一条医疗数据至少应当包括每一条医疗数据至少应当包括4种元素:种元素:病人姓名(如韦小宝)病人姓名(如韦小宝)问题的属性或参数(如年龄)问题的属性或参数(如年龄)参数的值(如参数的值(如40)观察的时间(如观察的时间(如1999年年9月月5日日9:12)医学数据的组成医学数据的组成姓名姓名属性属性属性值属性值观察时间观察时间赵大宝赵大宝诊断诊断抑郁性精神病抑郁性精神病2003-2-12赵大宝赵大宝年龄年龄402003-2-12医学数据、信息和知识仪器内仪器内仪器间仪器间观察者观察者总变异总变异生物学上生物学上分析或方法性上分析或方法性上个体个体仪器仪器个体内个体内个体间个体间观察者间观察者间观察者内观察者内医学数据的变异医学数据的变异变异的来源变异的来源变异变异(variation)同值个体同指标之同值个体同指标之间的差异叫间的差异叫变异变异。医学数据、信息和知识医学数据变异程度的测量医学数据变异程度的测量 医疗数据通常不能提供完全的信息。也不能用肯定程医疗数据通常不能提供完全的信息。也不能用肯定程度来确认病人。一条数据可能因为不精确和或不准确而度来确认病人。一条数据可能因为不精确和或不准确而偏离实际值。对其变异程度的测量可以有以下指标:偏离实际值。对其变异程度的测量可以有以下指标: 精密度:同一对象反复测量值的一致性。精密度:同一对象反复测量值的一致性。 正确度:被测值与其正确度:被测值与其“真值真值”的接近程度。的接近程度。 精确度:一致性以及与其精确度:一致性以及与其“真值真值”的接近程度。的接近程度。 从测量误差的角度来说,精确度是测得值的随机误从测量误差的角度来说,精确度是测得值的随机误差和系统误差的综合反映。差和系统误差的综合反映。医学数据、信息和知识第三节第三节 医学信息医学信息 有关信息的定义至今多达百余种。从有关信息的定义至今多达百余种。从信息论的角度出发,目前大多数学者接受的信息论的角度出发,目前大多数学者接受的定义是:定义是:“信息具有物质属性,是物质的存信息具有物质属性,是物质的存在方式及运动的规律和特点的表征,是事物在方式及运动的规律和特点的表征,是事物及其现象的内外特征、相互联系及作用的反及其现象的内外特征、相互联系及作用的反映。映。”从不同角度可得出不同的定义。我们从不同角度可得出不同的定义。我们介绍几种具有代表性的观点。介绍几种具有代表性的观点。医学数据、信息和知识R.V.L. Hartley. TransmissionofInformation. Bell System Technical Journal, 7(4):535-563, 1928. 1928 1928 1928 1928信息传输信息传输信息传输信息传输:“:“:“:“信息信息信息信息” ” ” ” 是是是是符符号。发信者所发出的信息,就是从号。发信者所发出的信息,就是从号。发信者所发出的信息,就是从号。发信者所发出的信息,就是从通信符号表中选择符号的具体方式。通信符号表中选择符号的具体方式。通信符号表中选择符号的具体方式。通信符号表中选择符号的具体方式。不管符号所代表的意义是什么,只要不管符号所代表的意义是什么,只要不管符号所代表的意义是什么,只要不管符号所代表的意义是什么,只要选择的符号数目一定,发信者发出的选择的符号数目一定,发信者发出的选择的符号数目一定,发信者发出的选择的符号数目一定,发信者发出的信信信信息的数量也就确定了。息的数量也就确定了。 信息是指有新内容、新知识的消息。信息是指有新内容、新知识的消息。 首次从通信的角度(1888-1970) 哈特莱医学数据、信息和知识香农通信的数学理论通信的数学理论信息论诞生的标志信息论诞生的标志信息信息信息信息是通信的内容,是是通信的内容,是“ “用来消除未来的某用来消除未来的某种不确定性的东西种不确定性的东西” ”,信息的多少反映了消,信息的多少反映了消除了的不确定性的大小,即除了的不确定性的大小,即信息是二次不定性之差。不定性就是对事物认识不清楚,不知道。信息就是消除人们认识上的不定性。 不不不不确确确确定定定定性性性性:对对客客观观事事物物的的不不了了解解、不不肯肯定定。通通信信的的直直接接目目的的就就是是要要消消除除接接受受端端(信信宿宿)对对于于发发出出端端(信信源源)可可能能会会发发出出哪哪些些消消息息的的不确定性。不确定性。1916-2001A Mathematical Theory of Communication in the Bell System Technical Journal (1948). 医学数据、信息和知识维纳Norbert Wiener (1894-1964)人有人的用处人有人的用处控制论与社会控制论与社会19501950维纳(维纳(N.WienerN.Wiener)将人与外部环境交换信息的过程看成是一种)将人与外部环境交换信息的过程看成是一种广义的通信过程,认为广义的通信过程,认为信息是人们在适应客观世界的过程中与客观信息是人们在适应客观世界的过程中与客观世界进行交换的内容的名称世界进行交换的内容的名称,是人与外部世界的,是人与外部世界的中介中介。如果没有信。如果没有信息作为中介,人就会同外部世界隔绝,就不能认识世界和改造世界。息作为中介,人就会同外部世界隔绝,就不能认识世界和改造世界。信息既不是物质又不是能量,信息就是信息。医学数据、信息和知识钟义信 信息是事物存在方式或运动状态,信息是事物存在方式或运动状态,以及这种方式以及这种方式/状态的直接的或间接的状态的直接的或间接的表述。表述。从本质上讲,信息是事物自身显从本质上讲,信息是事物自身显示其存在方式和运动状态的属性,是客示其存在方式和运动状态的属性,是客观存在的事物现象。观存在的事物现象。 信息与认知主体有着密切的联系,信息与认知主体有着密切的联系,信息必须通过主体的主观认知才能被反信息必须通过主体的主观认知才能被反映和揭示映和揭示。医学数据、信息和知识信息的性质(个):信息的性质(个): 信息的内涵及特性很多,一般可以从以下九个方面描述信息的内涵及特性很多,一般可以从以下九个方面描述其信息的性质与内涵。其信息的性质与内涵。(1 1) 信息的相对性:信息的相对性:一方面对于同一事物,不同的观察者获得的信息量一方面对于同一事物,不同的观察者获得的信息量是不同的。另一方面,不同的用户对信息的认识和需求也是不同的。另一方面,不同的用户对信息的认识和需求也是不同的。因此,对信息系统的开发既要考虑共性的应用,是不同的。因此,对信息系统的开发既要考虑共性的应用,也要考虑个性化需求。也要考虑个性化需求。 (2 2) 信息的事实性:信息的事实性:事实性是信息最基本的属性。如果在信息系统中收集事实性是信息最基本的属性。如果在信息系统中收集的信息不符合事实,则信息毫无价值。的信息不符合事实,则信息毫无价值。(3 3) 信息的信息的转移性:移性:信息在时间上或空间上可以从一点转移到另一点。信息在时间上或空间上可以从一点转移到另一点。时间上的转移称之为储存,而空间上的转移称之为通信。时间上的转移称之为储存,而空间上的转移称之为通信。医学数据、信息和知识(4 4) 信息的信息的变换性:性:信息是可以变换的信息是可以变换的,它可以由不同的载体和不同的方法来载荷。它可以由不同的载体和不同的方法来载荷。信息的变换性可以根据不同用户的不同需求,采用不同的信息表现信息的变换性可以根据不同用户的不同需求,采用不同的信息表现方式和方法来加工处理。例如,可以采用数据二维表的结构方式表方式和方法来加工处理。例如,可以采用数据二维表的结构方式表达,也可以采用直方图等直观方式来表达。达,也可以采用直方图等直观方式来表达。(5 5) 信息的有序性:信息的有序性: 信息的有序性,一方面信息可以用来消除系统的不稳定信息的有序性,一方面信息可以用来消除系统的不稳定性,增加系统的有序性;另一方面信息本身也可根据一定的规则进性,增加系统的有序性;另一方面信息本身也可根据一定的规则进行编码。编码质量的好坏,直接影响系统的稳定性和整体行编码。编码质量的好坏,直接影响系统的稳定性和整体质量。质量。 (6 6) 信息的信息的动态性:性:信息是随事物变化而改变的客观反映。这种变化大多数表现为信息是随事物变化而改变的客观反映。这种变化大多数表现为信息本身内容的变化,对于信息系统来讲,就是增加记录、修改记信息本身内容的变化,对于信息系统来讲,就是增加记录、修改记录或者删除记录。进而要求整个信息系统也要做相应的调整和对信录或者删除记录。进而要求整个信息系统也要做相应的调整和对信息进行加工处理。息进行加工处理。医学数据、信息和知识(7 7) 信息的信息的时效性:效性:信息是有寿命的。脱离了事物源的信息,因为不再能够反信息是有寿命的。脱离了事物源的信息,因为不再能够反映变化了的事物的新的状态和本质,它的效用就会逐渐减映变化了的事物的新的状态和本质,它的效用就会逐渐减低,直至信息效用完全丧失。在开发信息系统时,要充分低,直至信息效用完全丧失。在开发信息系统时,要充分注意信息系统的响应速度,以保证处理信息的同步,确保注意信息系统的响应速度,以保证处理信息的同步,确保信息的真实有效性。例如,天气预报信息就必须保证提前信息的真实有效性。例如,天气预报信息就必须保证提前获知,才会产生社会的和经济的价值。获知,才会产生社会的和经济的价值。(8 8) 信息的共享性:信息的共享性:信息可以被无限制的复制、传播或分配给众多用户,为大信息可以被无限制的复制、传播或分配给众多用户,为大家而共享。基于这一特点,就要求信息的录入、加工、传家而共享。基于这一特点,就要求信息的录入、加工、传输、存储、复制等所有的处理环节确保信息的准确性,又输、存储、复制等所有的处理环节确保信息的准确性,又要求信息系统处理的高效率。这样真实有效的信息才能够要求信息系统处理的高效率。这样真实有效的信息才能够为更多的用户共享。为更多的用户共享。 (9 9) 信息的可信息的可转化性:化性:信息在一定的条件下,可以转化为物质、能量、时间或其信息在一定的条件下,可以转化为物质、能量、时间或其他,其中最主要的条件是被人们合理而有效的利用,达到他,其中最主要的条件是被人们合理而有效的利用,达到知而获智。信息的利用才能产生知识的积累,才能转化成知而获智。信息的利用才能产生知识的积累,才能转化成为知识经济。为知识经济。 医学数据、信息和知识 为了更好地掌握信息的内涵,我们需要引进一个概念全信息:即同时考虑到事物存在方式和运动状态的外在形式、内在含义和效用价值的认识论层次上的信息。仅考虑形式因素的信息语法信息仅考虑内容因素的信息语义信息仅考虑效用因素的信息语用信息医学数据、信息和知识包括两种基本的类型:包括两种基本的类型:病人信息(病人信息(patient-specific):信息来):信息来自于病人治疗。如数值、文本、图像。自于病人治疗。如数值、文本、图像。知识信息(知识信息(knowledge-based):有关):有关于医疗保健的科学文献。即以研究和实践为于医疗保健的科学文献。即以研究和实践为基础的科学知识纪录。基础的科学知识纪录。 一、医学信一、医学信息的类型息的类型9/20/202422医学数据、信息和知识二、信息量的计算二、信息量的计算根据香农的定义,一条消息的信息含量的计算公式根据香农的定义,一条消息的信息含量的计算公式I=log(I/p)=-logP 0PII是一条消息的信息含量是一条消息的信息含量,以比特(以比特(bit)方式表示方式表示P表示的是一条信息发生的概率表示的是一条信息发生的概率医学数据、信息和知识三个概念比特(比特(bit):):英语Binary digit(二进制数)位的缩写,是 数学家John Wilder Tukey提议的术语。这个术语第一次被正式使用,是在香农著名的信息论,即通信的数学理论(A Mathematical Theory of Communication)论文之第1页中。比特串:比特串:比特串就是信息按照ANSI(美国国家标准编码)编码后转化为二进制存储。比如说110 这个就叫比特串医学数据、信息和知识医学数据、信息和知识一、医疗活动中的决策一、医疗活动中的决策二、医学知识的类型二、医学知识的类型 医学数据、信息和知识Who is she? How information from is she?医学数据、信息和知识
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号