资源预览内容
第1页 / 共4页
第2页 / 共4页
第3页 / 共4页
第4页 / 共4页
亲,该文档总共4页全部预览完了,如果喜欢就下载吧!
资源描述
敏 感 性 问 题 随 机 化 回 答 模 型 的 改 进孔 圣 元 孟 生 旺A B ST RA C TT h e p ap e r f ir st eva lu a te sho r tage o f ex ist in g ran dom re spo n se m o de l o f sen si2 t ive p ro b lem s, an d th en se t up a n ew ran dom re spo n se m o de l an d ca lcu la te it s e st i2 m a to r s an d va r ian ce s, f in a lly dem o n st ra te th a t n ew m o de l is m o re ea sy in op e ra t io nan d h a s b e t te r p rop e r t ie s com p a red w ith tho se o f th e p rev io u s o n e.运 用 随 机 化 回 答 模 型 , 对 社 会 敏 感 性 问 题 进 行 调查 , 这 种 方 法 已 越 来 越 受 到 人 们 的 重 视 。 但 现 有 模 型 孰 优 孰 劣 ? 如 何 最 优 设 计 ? 在 实 际 使 用 模 型 时 , 这 些 问 题 是 经 常 碰 到 的 。 本 文 对 现 有 模 型 的 不 足 进 行 了 分 析 , 在 此 基 础 上 设 计 了 新 模 型 , 并 给 出 了 最 优 设 计 方 案 。方差的后一部分反映了由于采用 随 机 化 回 答 方法 而 引 起 方 差 的 增 大 , 说 明 了 宁 愿 牺 牲 某 些 精 度 来 换取被调查者进行合作的思想 。沃纳模型存在的主要问题是 :(1) 从随机化处理过程来看, 被 调 查 者 仍 必 须 回 答 敏 感 性 问 题, 因 为 1 号 卡 片 和 2 号 卡 片 上 都 是 敏 感性问题 , 只是一个问题的两种提法而已 。 因此被调 查者可能仍然心存顾虑 。一 、 现 有 模 型 之 不 足11 沃纳模型美 国 统 计 学 家 沃 纳 于 1965 年 首 次 提 出 利 用 随 机 化 回 答 来 调 查 敏 感 性 问 题, 其 基 本 思 想 是 使 被 调 查 者 在 回 答 敏 感 性 问 题 时 能 保 守 秘 密 , 从 而 消 除 回 答问题的顾虑 , 以达到配合调查的目的 。 方法是制作 一套卡 片 , 其中一部分卡片 (可 称 为 1 号 卡 片 ) , 写 上 需要调查的敏感性问题 ; 另一部 分 卡 片 ( 可 称 为 2 号 卡片 ) , 写上对立的敏感性问题 。 将这些卡片混和 , 由 被 调 查 者 随 机 地 抽 取 卡 片, 对 照 自 己 的 情 况 , 作 出 “是” 或 “否” 的真实回答 。 这样 调 查 者 并 不 知 道 在 回 答那一个问题 , 从而起到了保密作用 。 如果我们预先 设 置 卡 片 的 比 例 分 别 为 p 和 1- p , 调 查 的 样 本 容 量为 n , 回 答 “是” 的 人 数 为 m , 则 回 答 敏 感 性 问 题 “是 ” 的估计量为 :(2) 显 然 当 p = 1 时, 最 能 得 到 被 调 查 者 的 配21 合, 但 在 该 模 型 中 , 当 p = 2 时 无 法 得 到 0 的 估 计值 。(3) 从 方 差 V ( 0 来 看, 要 减 少 模 型 方 差 就 应W )使 p 偏 离 1 愈 大 愈 好 , 比 如 p 018 或 p 0115, 可2以 使 方 差 的 增 量 减 少 , 但 这 又 不 易 得 到 被 调 查 者 的较好配合 , 例如 p = 1 或 p = 0 时, 这 就 等 于 不 采 用 随 机化回答方法 。21 西蒙斯模型 西 蒙 斯 模 型 试 图 在 沃 纳 模 型 的 基 础 上 加 以 改进, 其方法是在 1 号卡片上仍提 调 查 的 敏 感 性 问 题 ,而 2 号卡片上则是与敏感性问 题 无 关 的 问 题 。 比 如2 号卡片上可写上 “您” 是 4 月出生的吗? 若是, 请答1, 若不是请回答 0。 西蒙斯模型的估计量 为 : m - (1- p ) n 0W = (1)2p - 1可以证明上述估计量是极大似然 估 计 量 和 无 偏估计量 , 其方差为 :m (1- P ) q u- n 0 ( )u = 3pm (1- m ) 同样可以证得该估计量也是极大 似 然 估 计 量 和= n n V (0 W ) n (2p - 1) 2 无偏估计量 其方差为, :经分解得 : m m(1- ) = 0W ( 1- 0W ) p ( 1- p ) n n V (0 =u )V (0 W ) (2) (4)n + n (2p - 1) 2 np 260 统 计 研 究经分解得 : 保证他们的结构具有相似性 , 从而产生较大误差 。 ) = 0 u ( 1- 0 u ) q u ( 1- q u ) ( 1- p ) 2 (2) 方差 V (0 G ) 是两次试验产生的方差之和 。 在相同条件下, 它要比西蒙斯模型的方差大得多 。V (0 +u n n p 2 + p ( 1- p ) 0 u + qu - 20 u q u (5) ( )3 从 估 计 量 式 6 和 方 差 式 7 可 以 看 出 p 1 和( ) ( )p 2np 2 不能太接近 。 特别是当 p 1 = p 2 时 , 模型失效 。 要减小方差 V ( 0 , 就 应 增 大 p 而 减 小 p , 但 当 p 增 大G ) 1 2 1时, 又不容易得到被调查者的配合 。41 双随机化回答模型赵 俊 康 3 提 出 了 一 种 改 进 模 型, 我 们 称 之 为 双 随机化回答模型 。 其方法是制作两套卡 片 , 每一套都 由两部分组成 。 一套卡片上提出有关问题 , 另一套卡 片上不提任何问题 。 由被调查者随 机 地 抽 取 二 套 卡 片, 作出真实回答 。 其估计量为 :n方 差 的 第 二 部 分 为 由 于 提 出 无 关 问 题 , 而 引 起的 方 差 增 大 , 第 三 部 分 反 映 了 随 机 化 回 答 方 法 引 起 的方差增大 。其中 p 仍为 1 号卡片的比例 ; m 为回 答 “1”的 人数 ; q 为样本中具有无关问题特征的单位比例 。u西蒙斯模型的改进之处在于 :( 1) 2 号 卡 片 并 不 是 敏 感 性 问 题, 易 于 取 得 真 实 的回答 ;( 2) 卡 片 的 比 例 可 以 各 为 1/ 2, 有 利 于 消 除 被 调 查者的顾虑 。但仍然存在以下不足之处 : 2 i- p b 10 n = p a - p b , = n方差为 :( 1) 0 u 中 的 q u 必 须 预 先 已 知 或 是 待 估 计 的 值 , = 0 n (1- 0 n ) + 0 np a (1- p a ) +因而 q 的估计偏误会引起 0 的估计偏误 。 V (0 n )u u n (p - p ) 2nn ) p b (1- p b )a b( 2) 要 减 小 估 计 方 差 , 就 应 增 大 p 值 和 减 小 qu 0(1-n (p a - p b ) 2的 值, 但 随 着 p 的 增 大 和 q 的 减 小 , 被 调 查 者 的 配u其 中 p a 和 p b 分 别 为 两 套 卡 片 中 1 号 卡 片 之 比例 ; i= a ix i+ b i (1- x i) 为被调查者要回答的 值 。 双 随 机 化 回 答 模 型 的 改 进 之 处 在 于, 两 套 卡 片中 有 一 套 卡 片 不 提 任 何 问 题, 更 能 得 到 被 调 查 者 的 合作 。 但某些方面也有进一步探讨的必要 。( 1) 该 模 型 要 求 被 调 查 者 根 据 两 次 抽 取 的 卡 片回 答 i 的值 。 由于 i= a ix i+ b i (1- x i) , 计算较复杂 ,不易于被调查者接受 。( 2) 要 减 少 该 模 型 的 方 差 , 也 需 要 p a 和 p b 不 能 太 接 近 , 这 就 要 相 应 增 大 敏 感 性 问 题 卡 片 所 占 的 比合程度会逐渐降低 。31 两次试验模型为了解决西 蒙 斯 模 型 对 q 的 估 计 依 赖 问 题 , 格u林伯格 、 穆尔斯等人提出两次随机 化 样 本 试 验 模 型 。其估计量为 :m 1 (1- m 2 (1-p ) - p )2 1n 1 n20 G = (6)p 1 - p 2方差为 :m 1 (1- m 1 )= 1 n 1 n 1 (1-V (0 G ) 2 ) 2p(p - p ) 2 n1 2 1 例 但随之又产生了被调查者 的 配 合 问 题 。 另 外 其方差表明 , 在相同条件下, 要比西斯模型的方差大 。, ,m 2 (1- m 2 )n2 n2 p ) 2 (1- (7)+1n 2二 、 新 模 型 的 提 出通 过 对 上 述 模 型 的 讨 论 , 我 们 认 为 在 设 计 模 型 时应注意以下几点 :第 一, 模 型 设 计 既 要 消 除 被 调 查 者 回 答 敏 感 性 问题的顾虑, 还要尽量减少被调查者参与的次数 。第二, 模型中要求估计的参数应尽量少 。第 三 , 模 型 设 计 要 简 单 , 易 于 被 调 查 者 理 解 和 掌 握 。 根据以上要求, 我们设计的模型如下 : 制作一套卡片, 由三部分组成, 第 一 部 分 卡 片 称为 1 号 卡 片 , 上 面 写 上 “如 果 您 具 有 特 征 A , 请 回 答1, 如果不具有特征 A , 请 回 答 0。 第 二 部 分 卡 片其 中 n 1 和 n 2 分 别 为 两 次 试 验 的 样 本 容 量 ; p 1和 p 2 分别为两个随机化模型中 1 号卡片的比例 。 从 方 差 中 可 以 看 出, 两 次 试 验 模 型 的 主 要 思 想是 通 过 增 加 一 个 随 机 化 回 答 模 型 引 起 的 方 差 增 大 ,消除 q 的估计偏误对 0 的偏误影响 。u u两 次 试 验 模 型 的 改 进 之 处 在 于 不 需 预 先 知 道qu , 而且通过其他 途 径 对 非 敏 感 性 问 题 进 行 核 对, 以此验证调查的准确性 。 但它的主要缺陷在于 :(1) 如果对同一批被调查者 试 验 两 次, 他 们 两 次 回 答 的 结 果 必 然 具 有 相 关 性, 从 而 破 坏 了 模 型 的 随 机性 。 如果对两批被调查者分别进行试验 , 又不容易61孔 圣 元 、 孟 生 旺 : 敏 感 性 问 题 随 机 化 回 答 模 型 的 改 进n称 为 2 号卡片 , 上面写上 “请您回答 1。 第三部分卡片称为 3 号卡片 , 上面写上 “请 您 回 答 0”。 这 三 部 分 卡 片 的 比 例 分 别 为 p 1、 p 2 和 p 3。 然 后 由 被 调 查 者 采用有效回的方法随机地从中抽取一 张 卡 片 并 作 出 回答 。 回答结果只有 “1”和 “0”两种可能 。 根据样本中 回答
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号