资源预览内容
第1页 / 共49页
第2页 / 共49页
第3页 / 共49页
第4页 / 共49页
第5页 / 共49页
第6页 / 共49页
第7页 / 共49页
第8页 / 共49页
第9页 / 共49页
第10页 / 共49页
亲,该文档总共49页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1选选择择合合适适的的数数据据管管理理软软件件是是保保证证数数据据质质量量的的重重要要方方面面 2主要内容主要内容 EpiData EpiData基本情况简介基本情况简介 EpiDataEpiData使用流程使用流程 建立调查表及数据文件生成建立调查表及数据文件生成 添加字段控制添加字段控制 录入数据和数据转出录入数据和数据转出3一、简介(一、简介(INTRODUCTIONINTRODUCTION)EpiData 是一个免费的数据录入和数据管理软件。4(一)(一)EPIDATAEPIDATA的特点的特点直直观方便方便简单易学易学实用性用性强对计算机要求不高算机要求不高数据数据录入功能入功能强(有良好的(有良好的逻辑检错功能)功能)5(二)如何获取(二)如何获取 EPI-DATAEPI-DATA软件软件 www.epidata.dkwww.epidata.dk 搜索其它下载网站搜索其它下载网站 当前最高版本当前最高版本3.13.1 可不必安装,直接可不必安装,直接copycopy并运行安装目并运行安装目 录下录下epidata.exeepidata.exe6(三)在数据管理方面的优点(三)在数据管理方面的优点 规则简单规则简单 数据文件生成与录入界面设计方便数据文件生成与录入界面设计方便 具备双份录入核查功能具备双份录入核查功能 具有多种常用数据库的输出接口具有多种常用数据库的输出接口 FreeFree7(四)应用方面的局限性(四)应用方面的局限性 变量名不能为中文变量名不能为中文 记录数最好不超过记录数最好不超过300000300000条条 录入界面不超过录入界面不超过999999行行8(五)(五)EpiDataEpiData的三种文件类型的三种文件类型 QESQES文文件件( (调调查查表表文文件件) ):定定义义调调查查表表(问问卷卷)的结构的结构 ; RECREC文文件件( (数数据据文文件件) ):存存放放数数据据以以及及已已经经定定义义好的编码;好的编码; CHKCHK文文件件( (核核查查文文件件) ):定定义义了了数数据据输输入入时时字字段段的有效性规则。的有效性规则。910直直观方便方便11 EpiData EpiData 的屏幕具有标准的视窗形式,包括一的屏幕具有标准的视窗形式,包括一行菜单和两行工具条;行菜单和两行工具条;“工作过程工具条工作过程工具条”可以指导用户从可以指导用户从“1.1.定义数定义数据据”到到“6.6.数据导出数据导出”工作过程工具条界面界面12(一)(一)EPIDATAEPIDATA使用流程使用流程最最简单的使用流程是:的使用流程是:1) 1) 创建调查表文件(创建调查表文件(* *.qes.qes););2) 2) 在调查表文件的基础上建立数据库(在调查表文件的基础上建立数据库(* *.rec.rec););3) 3) 在数据库(在数据库(* *.rec.rec)中录入数据。)中录入数据。 数据定义是基础性工作,也是关键性的工作;数据定义是基础性工作,也是关键性的工作; 在在EpiDataEpiData中表现为建成中表现为建成QESQES文件文件13(二)(二). QES. QES文件的建立文件的建立2.直接复制、粘贴word调查表1.建立途径14按shift键+#字段编辑器:字段编辑器:方便实现对变量类型和长度的定义方便实现对变量类型和长度的定义 15使用制表符使用制表符,只会改,只会改变变量量录入框在表格中的位置,入框在表格中的位置,而不会而不会对变量或量或REC数据数据库产生其它不良影响。生其它不良影响。在在变量量编码前插入前插入,可以将,可以将这个个变量量对齐到下一个到下一个制表位置。制表位置。注意:注意:插入的插入的与与变量量编码间不能有空格不能有空格文件文件选择项Show data formTabs/IndentsTab stop in data form every pixels 中中进行行设置,默置,默认值为40家庭住址shi_地市xian_县区xiang_乡(镇、街办) cun_村(小区)hao_组(楼、号)16默认值默认值200与与40的差别的差别17编辑编辑字段清单(字段清单(ctrl+q)字段选取清单字段选取清单 日期日期存在存在bug(程序缺陷)(程序缺陷)早期版本:不能计算早期版本:不能计算当前版本:当前版本: 记录存在缺失时,记录存在缺失时, 导出数据导出数据 库会出问题(错位)库会出问题(错位)建议:暂时不要用此种格式建议:暂时不要用此种格式本次采用的格式。本次采用的格式。由于问卷中只设计了年月,由于问卷中只设计了年月,调查者应将调查者应将日日调查清楚并填写调查清楚并填写18数数值型型变量:量:#,最,最长允允许14个字符个字符字符型字符型变量:量:_,最最长允允许80个字符,一个中文个字符,一个中文字占字占2个字符个字符日期型日期型变量:量: 注意其他注意其他变量:自量:自动生成生成ID号号逻辑是否是否19数值型变量允许录入数字、减号和小数点。在QES 文件中和数据录入过程中,你可以用圆点(.)或逗号(,)来表示小数点。一个变量中只允许输入一个小数点,这意味着不能用逗号作为千位的分隔符(例如:1,000,000)。字符“#” 的数目表示变量的长度,小数点占一位字符。变量最长允许18 个字符。2021 在在EpiDataEpiData表现为生成表现为生成.REC.REC文件文件 本文件基于本文件基于QESQES文件而生成文件而生成 产生产生RECREC文件前可输入文件标记文件前可输入文件标记 警惕:覆盖文件操作一定要警惕:覆盖文件操作一定要慎重!慎重!(二)创建数据库(二)创建数据库22注意:注意:.qes和和.rec可同名、可不同名可同名、可不同名建建议:同名:同名23创建数据库创建数据库24修改数据库修改数据库非常非常重要重要25CHECK 的文件建立:必须与数据库的文件名相同,唯一不同的就是扩展名;打开需要检查的数据库26常用常用语法法Range:允:允许范范围,允,允许值例:例:4-5,1,2, -inf-5(=0)Jump:跳:跳转功能功能例:例:age变量量1v23, 2v40,3end,4write Must Enter:必:必须录入入 Repeat:重复:重复输入入Value label:添加数:添加数值标签例:例:label sex1 male2 female27忽略缺失值(IGNOREMISSING)V4BEFORE ENTRYIGNOREMISSINGV4=V1+V2+V3END使用运算符号和函数使用运算符号和函数Let 命令:命令:例例1: V1let field5=field2/field3end例例2:birth today let age=round(today-birth)/365.25)28添加字段控制添加字段控制 可可以以使使数数据据输输入入过过程程按按给给定定的的一一些些规规则则和和 算法完成,是算法完成,是EpiDataEpiData功能强大的体现功能强大的体现 添加输入控制的指令以文件形式单独保添加输入控制的指令以文件形式单独保 存,该文件后缀为存,该文件后缀为CHKCHK 程序运行时,自动寻找与扩展名程序运行时,自动寻找与扩展名RECREC相相 同文件的同文件的CHKCHK文件文件 29添加字段控制添加字段控制5 5项基本功项基本功 限定特定值(数值范围,合法值)限定特定值(数值范围,合法值) 指定输入的顺序(跳转)指定输入的顺序(跳转) 某些字段不得缺项,必须输入某些字段不得缺项,必须输入 重复上一条记录的某字段值重复上一条记录的某字段值 标签:给出各数字对应的描述性文本标签:给出各数字对应的描述性文本 30(二)添加字段控制(二)添加字段控制1 1项高级功项高级功 相当于在相当于在CHKCHK文件中进行编程文件中进行编程 需掌握各种需掌握各种check commandscheck commands:-if-ifthenthenendifendif、 mustentermustenter、relaterelate 需需 熟熟 悉悉 各各 种种 operatorsoperators和和functionsfunctions:-arithmetic-arithmetic、 stringstring、 datedate、timetime31四、输入数据四、输入数据 点击点击“数据录入数据录入”,给定数据文件,给定数据文件, 即显示数据录入界面即显示数据录入界面注意事项注意事项 无键入内容,仅按回车,以缺失值论无键入内容,仅按回车,以缺失值论 字段填满,光标自动跳到下一个字段字段填满,光标自动跳到下一个字段 任何时候要退出录入,按任何时候要退出录入,按F10F10键即可键即可 3233数据库中查找记录数据库中查找记录 查找查找定位记录:用于已知记录号时定位记录:用于已知记录号时 查找查找查找记录:用于不知记录号时查找记录:用于不知记录号时341、修改数据、修改数据库:增加、增加、删除除变量;量;改改变变量量类型,型,变量名字量名字2、数据、数据库的追加、合并的追加、合并3、双、双录入和核入和核查4、数据的、数据的输出和出和输入入对已输入的数据库进行系列操作对已输入的数据库进行系列操作35在不在不丢失数据的前提下,修改一个已失数据的前提下,修改一个已经录入入了的数据了的数据库的的结构。已构。已经录入的数据会被拷入的数据会被拷贝到新数据到新数据库中相同名字的中相同名字的变量下,量下,这个个变量的格式有可能是修改了的格式。量的格式有可能是修改了的格式。也可以增加也可以增加变量、修改量、修改变量的定量的定义、或者、或者删除除变量。然后,先关量。然后,先关闭所有的文件,点所有的文件,点击菜菜单ToolsRevise Data File,完成数据,完成数据库的的修改。修改。36修改步骤1打开打开调查表文件(表文件(* *.qes)进行修改;如果没有行修改;如果没有现成的成的调查表文件,可以用已有的数据表文件,可以用已有的数据库(* *.rec)反)反过来来创建一个新的建一个新的调查表文件,即表文件,即选择菜菜单ToolsQES File from REC File(根据数据文件(根据数据文件产生生调查表)表) ;编辑、修改、修改调查表文件(表文件(* *.qes),例如增加新),例如增加新变量、量、删除除变量、改量、改变变量量类型等;型等;保存修改后的保存修改后的调查表文件,然后关表文件,然后关闭该文件;文件;选择 ToolsRevise Data File(更新数据文件);(更新数据文件);选择修改好的修改好的调查表文件(表文件(* *.qes)和准)和准备修改的数据修改的数据库(* *.rec)。)。3738如果如果删除或者修改了除或者修改了变量名,会量名,会丢失一些数据。失一些数据。请认真真检查修改了的数据修改了的数据库,避免,避免错误操作。操作。即使操作失即使操作失误,原来的数据,原来的数据库还是可以恢复的,它是可以恢复的,它现在已被存在已被存为另外一个数据另外一个数据库(仍在相同的文件(仍在相同的文件夹里),文件名里),文件名为FILENAME.OLD.RECEpiData 中有两种方式生成中有两种方式生成变量名量名改改变命名方式,有可能会修改命名方式,有可能会修改变量名,量名,进而而丢失数据。在修改数失数据。在修改数据据库时,程序会先,程序会先检查原始数据原始数据库创建建时使用使用变量名定量名定义方法,方法,如果不同于如果不同于现在的在的Options 中的中的设置,程序会自置,程序会自动弹出一个警告出一个警告框,建框,建议你使用相同的你使用相同的变量名定量名定义方法。方法。修改原始数据修改原始数据库中的中的变量量类型。所有型。所有变量量类型都可以修改型都可以修改为字符字符型型变量或大写字母的字符型量或大写字母的字符型变量。数量。数值型型变量可以修改量可以修改为有相同有相同或更多小数位数的数或更多小数位数的数值型型变量。如果修改后的小数位数量。如果修改后的小数位数变少了,少了,程序会程序会弹出警告框,提醒出警告框,提醒这样修改可能会修改可能会丢失数据。失数据。慎重!慎重!39工具字段更名选择文件名出现文件名在在弹出的窗口中,第一列出的窗口中,第一列是原有的是原有的变量名,第二列量名,第二列是是标签。如果要修改。如果要修改变量量名,名,请将光将光标放在第三列放在第三列相相应的的变量行上,量行上,键入新入新的的变量名。修改完量名。修改完毕后,后,点点击Save and close,保,保存并关存并关闭窗口。窗口。旧的数据旧的数据库会被另存会被另存为Filename.old.rec,以,以备需要的需要的时候恢复。候恢复。40保存路径保存路径41Append / Merge追加(append) 是将两个数据结构完全一样或基本上一样的数据库纵向连起来。如:几个不同人分录数据的合并横向连接(Merge)可使两个数据库结构不同的文件横向连接,前提是两个文件中有相同的关键变量如:基本情况库,实验室信息库,流调数据库的合并42以A库结构为准,B库中多余的变量将被忽略两库中相同名称的变量,则新创建数据库对应的变量类型将以数据库A为准新库中包括A库和B库中的所有变量43以A库结构为准,只合并标识变量在两个数据库中完全匹配的记录两库共有标识变量,唯一不重复可同时选择13个变量不一定要设置KEY或key unique合并两个数据库中的所有记录44注意!45数据数据库的的输出出/输入入输出出选项:可:可选择部分部分变量和量和记录变量个数的限制量个数的限制输出到出到dBaseIII,最多,最多128个个变量,且量,且变量量标签、数、数值标签无法同无法同时转出出Excel不同版本的行、列数均有限制,且不同版本的行、列数均有限制,且变量量标签、数、数值标签无法同无法同时转出出Spss文件文件syntax语句要句要删除注除注释部分部分输出到出到epidata:可可创建一个新建一个新库,含部分,含部分记录或部分或部分变量量4647Qes中要尽量与原始中要尽量与原始问卷卷结构相同,以减少数据构相同,以减少数据录入中的失入中的失误Chk中多中多设置数置数值标签,导出出时Chk文件要在同一文件要在同一文件文件夹中中在在进行大量行大量录入前,数据入前,数据库建立者要自己建立者要自己录入入1020份左右,以份左右,以发现存在的存在的问题数据数据转出出时,特,特别是是较大数据大数据库转出出时,可,可试用几用几种格式(如种格式(如.xls,.sps,.txt),注意每种),注意每种转出格式局出格式局限性限性关关联数据数据库:能不用就不用:能不用就不用配套文件:数据配套文件:数据录入入说明明48 谢谢49
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号