资源预览内容
第1页 / 共30页
第2页 / 共30页
第3页 / 共30页
第4页 / 共30页
第5页 / 共30页
第6页 / 共30页
第7页 / 共30页
第8页 / 共30页
第9页 / 共30页
第10页 / 共30页
亲,该文档总共30页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
今日头条算数中 心研究目的本报告分析今日头条过去一年的用户阅读 大数据,研究在移动阅读环 境下,什么样的资讯 更易引发评论 ,为创 作者提供参考。本报告主要 通过评论 率这一指标来衡量资讯引发评论 的难易程度。样样本说说 明 本报告选取的样本是2016.7.15-2017.7.15期间,今日头条平台上分 发的共计66,492,398篇资讯。核心发发 现现中长篇(1000字以上)资讯比短资讯(1-500字)更易引发评论 。文章(包括含有插图的文章)比组图和视频更易引发评论 。政务、媒体、移民、游戏、本地、数码、房地产、科技、财经、社会 等资讯更易引发评论 。严肃+倾向性的资讯评论 率最高;严肃+蹭热点的资讯评论 率最高 。评论率高的资讯,大多以祈使句结尾,或是以问句结尾,或是结尾设 置投票。目 录录CONTENTS010203040501.PART ONE篇幅 Length数据来源:头条指 数样样本说说明 2017.07 今日头条算数中心我们将移动资讯 按照字数进行划分 ,每500字划分一档,共分为七档。表1呈现了在剔除无效样本后,各档 的样本量和总样本量。01篇幅(字)样样本量1-50031,290,680501-100011,373,3731001-15004,775,3001501-20002,310,4612001-25001,109,6132501-3000733,4733001以上927,043总计52,519,943表1数据来源:头条指数 注:评论 率反映某类文章引发评论 的难易程度,评 论率=评论数/阅读 数。研究结论结论06 2 2017.07 今日头条算数中心2001-2500字1001-1500字3001字以上501-1000字1501-2000字2501-3000字1-500字02.PART TWO体裁 Genre数据来源:头条指 数样样本说说明03 2017.07 今日头条算数中心体裁样本 量文章48402296组 图3246246视 频14843856总 计66492398我们将移动资讯 按照体裁分为三类: 文章(包括含有插图的文章)、组图和视频。 表2呈现了在剔除无效样本后,三类的样本量和总样本量。表2。研究结 论国1.7吕目 率 1 . 80瑞 1. 60届1. 40阳文章组 图视 摄体 载(包商富饵 由国四:Xl比组图和视频更易引发评论 。数据来源:头条指数 注 : 评 论 率 反 映 某 类 文 章 引 发 评 论 的 难 易 程 度 , 评 论 率 = 评 论 数 / 阅 读 数 。 ( ) 2017.07 今日头条算数中心1. 20%1.1 0%1. 00%0.80%0.65%0.60%0.40%0.20问 o.口口时03.PART THREE题题材 Theme数据来源:头条指 数样样本说说明05 2017.07 今日头条算数中心我们将移动资讯 按照内容题材进 行分类,剔除无效样本后,对各 类样本进行分析。 表3仅展示部分类别的样本量。表 3题材样本量农业18327890 社会8318385财经4249367体育2390962科技2336720教育1982724旅游1880833文化1633823情感1580555数码1541048游戏1293588国际768964房地产723718军事551284政务435635动漫432065本地396347彩票198820媒体100787移民39781。研究结 论政务 媒体移民 游戏本地 数码 房地产科技 财经社会 。 民 增K动漫彩票 体育 教育国际 军事 文化 情感农业 旅游。.ooo0.0500lb不同类别 的文章评论 率(取 Top20)26.9r地m 24.8白 也 。 24.71%0。 24.43%回 23.7脱帽 23.3础。 。 21.98旦 咀 21.0部 20.08%00 18. 71比a 17.35黑白 16.68%00 16.34咒蛐 15.85咒 15.67%帽13.32%00 13.08地。 11. 7 仇 。 11.5扳回 11 . . 44%0。0.15但到评论 率0.3臼X胁0.1000届0.2000抽0.2500幅数据来源:头条指数 注:评论 率反映某类文章引发评论 的难易程度,评论 率=评 论数/阅读 数。 此处评论 率以%00 (万分号)为单 位,表示每10000次阅读中严 笠评论的数量。2017.07 今日头条算数中心2017年6月人在评论 区丰富多维的内容为今日头条引来 了大量明星、名人、达人用户,为头条增 加了鲜活、有趣、有个人特色的短内容, 引发大量网友评论。,头条用户用叫错名的玩法在评论区玩得不亦乐乎。明星名 也非常活跃,他们不仅彼此互动,还与网友互动,诞生了一位准现象级网红色厨李奇斌。”04.PART FOUR写作方式 Style of Writing我们在今日头条平台上,选择 了科技类、娱乐类 、体育类、财经类 、社会类五个细分类 别,在剔除无效样本后,按照评论数选择Top300的资讯作为研究对象。在这部分中,依照资讯 特点,我们从严肃 /活泼、倾向性/非倾向性两个维度进行写作方 式的分析和标注,探讨不同写作方式的资讯评论 率的高低。严肃 是指信源真实可靠,用词严谨 ,在陈述事实时 不用或少用夸张、比喻、拟人等修辞 手法,不用或少用网络流行语,图片原始真实,没有使用表情包类图片。 倾向性是指在陈述完事件后对该事件作出了褒贬或赞同反对等主观性评论。表4是五大类别不同写作方式的样本量。严肃+倾向性活泼+倾向性严肃+非倾向性活泼+非倾向性合计科技类691009338300娱乐类341129460300体育类923416311300财经类76651509300社会类251425110300表407。写作万式国+UIB回悍 的资讯评论 率最高,如科技类、娱乐类 和体育类 。评论 率 .8%0. 67% 0.61%。.6% 。.4%O.2GJ 。.49%朋也严肃 +假向 性0.56%0.46% 0.48%0.38% 0.38%写作巧立 活泼叫顷向性- 科技美严肃 +非假向 性- 撬吁美 - 体育提话道叫剧团 向性数据来源:头条指数 注:评论 率反映某类文章引发评论 的难易程度,评论 率=评论 数/阅读 数。2017.07 今日头条算数中心。写作万式评论 率0.88%的b但是,也存在一些例外的情况。 对于 财经类 而言, 活泼 +非倾 向性 的资讯评论 率最高。对于 社会类 而言, 活泼 +倾 向性 的资讯评论 率最高 。0.59%。.44%0.46%0.41%。38%.0.35%活泼+菲假向性严肃 +非倾向性- 阳经提活泼4军向 性- 社会提严肃叫团向 性数据来源:头条指数 注:评论率反映某类文章引发评论 的难易程度, 评论率=评论数/阅读数。写件后式。2017.07 今日头条算数中心1.0%0.8%0.6% I0.53%0.4% 。.2%我们在今日头条平台上选择 了育儿类、健康类、时尚类三个细分类别 ,在剔 除无效样本后,按照评论数选择Top300的资讯作为研究对象。在这一部分,依照资讯特性,我们从严肃/活泼、蹭热点/非蹭热点两个维度 进行写作方式的分析和标注,从而探讨不同写作方式的资讯评论 率的高低。蹭热点是指使自己的内容与当前热点产生关联,或围绕当前热点创作内容。 表5是三大类别不同写作方式的样本量。表510严肃严肃+蹭热热点活泼泼+蹭热热点严肃严肃+非蹭热热点活泼泼+非蹭热热点合计计育儿类15620475300健康类211417491300时尚类1066027107300。写作万式的资讯评论 率最高, 如+菲踵搞点 的资讯 F评论率最高 。总体而言 F 严 肃 +但是对于 时间类 而言 ,评论 军0.49%0.5%。.4% 0.3% 0.27% 0.22%0.23%0.22%。.2300/0.2%0.1%田也严肃 +踵热点严肃-叶在育眉前1点活泼 唱赞 点) l且 是 - 健康美 - 时南美活罩+非踵挣点数据来源:头条指数 注:评论率反映某类文章引发评论 的难易程度, 评论率=评论数/阅读数。写作古式。2017.07 今日头条算数中心05.PART FIVE结结尾方式 Ways of Ending数据来源:头条指 数12 2017.07 今日头条算数中心以祈使句结结尾文 章 给 娃 取 的 名 字 , 你 后 悔 了 吗 ? 的 结 尾 为 : “ 如 果 你 的 宝 宝 已 经 有 个让 你 得 意 的 名 字 , 那 就 在 留 言 中 分 享 一 下 你 的 起 名 大 法 吧 ! ”数据来源:头条指 数以问问句结结尾13 2017.07 今日头条算数中心文 章 这 5 种 症 状 都 在 表 明 : 你 体 内 可 能 有 大 量 蛔 虫 寄 生 的 结 尾 为 : 如 果 大 家 有 什 么 经 验和 方 法 , 请 务必 和 我 们 分 享 , 让 我 们 能帮 助 到 更 多 的 人 远 离 蛔 虫 病 ! 下 期 见 !数据来源:头条指 数结结尾设设置投票14 2017.07 今日头条算数中心文 章 华 为荣 耀 系 统 停 更 , 请 愿 无 效 ! 花 粉 反 目 的 结 尾 为 : “ 荣 耀 6 系 统 停 更 你 怎 么 看 ?(单 选) ” 支 持 ! 配 置 跟 不 上 就 不 更 不 支 持 ! 老 用 户 也 需 要 关 爱 打 酱 油结结 语语Conclusion15数据来源:头条指 数。黯辅助,净化讨论环 境头条评论 每天对漫骂、低俗内窑的识 别准确率达99%。到起字写t最42 函姐则机器学习非常高把 握用户反馈和审核人员纠 编数据来源:今日头条打击网络暴力评论的流程 图E国机器学习比较有把 握用户& 馈和审核人员纠 编。2017.07 今日头条算数中心今日头条算数中 心本文就你话多今日头条用户评论 数据报告(下)(以下简称“ 本报告” )由今 日头条算数中心(以下简称“ 算数中心” )制作。报告中文字、数据等受中国知识产权 法律法规保护。除注明的引用第三方数据及公开信息,本报告所有权归今日头条算数中 心所有。算数中心致力于更及时、更全面、更深度的阅读数据挖掘和数据应用创新。未经允许, 不得对本报告进行加工或改造。如有转载或引用,需及时与我们联系并注明出处“今日 头头条算数中心” ,同时不得删减或改写报告内容。特此声明。重要声明 Declaration
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号