资源预览内容
第1页 / 共31页
第2页 / 共31页
第3页 / 共31页
第4页 / 共31页
第5页 / 共31页
第6页 / 共31页
第7页 / 共31页
第8页 / 共31页
第9页 / 共31页
第10页 / 共31页
亲,该文档总共31页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
今日头条算数中心今日头条用户评论数据报告(下)研究目的本报告分析今日头条过去一年的用户阅读大数据,研究在移动阅读环境下,什么样的资讯更易引发评论,为创作者提供参考。本报告主要通过评论率这一指标来衡量资讯引发评论的难易程度。样本说明本报告选取的样本是2016.7.15-2017.7.15期间,今日头条平台上分发的共计66,492,398篇资讯。核心发现篇幅体裁题材写作方式结尾方式中长篇(1000字以上)资讯比短资讯(1-500字)更易引发评论。文章(包括含有插图的文章)比组图和视频更易引发评论。政务、媒体、移民、游戏、本地、数码、房地产、科技、财经、社会等资讯更易引发评论。严肃+倾向性的资讯评论率最高;严肃+蹭热点的资讯评论率最高。评论率高的资讯,多以祈使句结尾,或是以问句结尾,或是结尾设置投票。目录CONTENTS01020304篇幅体裁题材写作方式05结尾方式01. PART ONE篇幅Length数据来源:头条指数样本说明 2017.07 今日头条算数中心篇幅(字)样本量1-50031,290,680501-100011,373,3731001-15004,775,3001501-20002,310,4612001-25001,109,6132501-3000733,4733001以上927,043总计52,519,943我们将移动资讯按照字数进行划分,每500字划分一档,共分为七档。表1呈现了在剔除无效样本后,各档的样本量和总样本量。表101数据来源:头条指数注:评论率反映某类文章引发评论的难易程度,评论率=评论数/阅读数。研究结论中长篇资讯(1000字以上)比短资讯(1-500字)更易引发评论。06 2017.07 今日头条算数中心2.31%2.20%2.16%2.02%1.80%1.12%0.89%2001-2500字501-1000字1501-2000字2501-3000字1-500字3001字以上1001-1500字02即便在移动互联网上,某些规律依然成立复杂的有价值的事情需要更多的字数描述,中长篇的内容丰富度更高,容纳矛盾的可能性更大,可阐释性更高,更易获得评论。”今日头条副总编辑 徐一龙02. PART TWO体裁Genre数据来源:头条指数样本说明03 2017.07 今日头条算数中心体裁体裁样本量样本量文章48402296组图3246246视频14843856总计总计66492398我们将移动资讯按照体裁分为三类:文章(包括含有插图的文章)、组图和视频。表2呈现了在剔除无效样本后,三类的样本量和总样本量。表2数据来源:头条指数注:评论率反映某类文章引发评论的难易程度,评论率=评论数/阅读数。研究结论文章(包括含有插图的文章)比组图和视频更易引发评论。04 2017.07 今日头条算数中心03. PART THREE题材Theme数据来源:头条指数样本说明05 2017.07 今日头条算数中心题材题材样本量样本量农业18327890社会8318385财经4249367体育2390962科技2336720教育1982724旅游1880833文化1633823情感1580555数码1541048游戏1293588国际768964房地产723718军事551284政务435635动漫432065本地396347彩票198820媒体100787移民39781我们将移动资讯按照内容题材进行分类,剔除无效样本后,对各类样本进行分析。表3仅展示部分类别的样本量。表3数据来源:头条指数注:评论率反映某类文章引发评论的难易程度,评论率=评论数/阅读数。此处评论率以(万分号)为单位,表示每10000次阅读中产生评论的数量。研究结论不同类别的文章评论率(取Top20)06 2017.07 今日头条算数中心2017年6月,头条用户用叫错名的玩法在评论区玩得不亦乐乎。明星名人在评论区也非常活跃,他们不仅彼此互动,还与网友互动,诞生了一位准现象级网红色厨李奇斌。”今日头条UGC运营总监 王一波丰富多维的内容为今日头条引来了大量明星、名人、达人用户,为头条增加了鲜活、有趣、有个人特色的短内容,引发大量网友评论。04. PART FOUR写作方式Style of Writing在这部分中,依照资讯特点,我们从严肃/活泼、倾向性/非倾向性两个维度进行写作方式的分析和标注,探讨不同写作方式的资讯评论率的高低。严肃严肃+倾向性倾向性活泼活泼+倾向性倾向性严肃严肃+非倾向性非倾向性活泼活泼+非倾向性非倾向性合计合计科技类691009338300娱乐类341129460300体育类923416311300财经类76651509300社会类251425110300我们在今日头条平台上,选择了科技类、娱乐类、体育类、财经类、社会类五个细分类别,在剔除无效样本后,按照评论数选择Top300的资讯作为研究对象。严肃是指信源真实可靠,用词严谨,在陈述事实时不用或少用夸张、比喻、拟人等修辞手法,不用或少用网络流行语,图片原始真实,没有使用表情包类图片。倾向性是指在陈述完事件后对该事件作出了褒贬或赞同反对等主观性评论。表4是五大类别不同写作方式的样本量。表44-107数据来源:头条指数注:评论率反映某类文章引发评论的难易程度,评论率=评论数/阅读数。写作方式08 2017.07 今日头条算数中心严肃+倾向性的资讯评论率最高,如科技类、娱乐类和体育类。数据来源:头条指数注:评论率反映某类文章引发评论的难易程度,评论率=评论数/阅读数。写作方式09 2017.07 今日头条算数中心但是,也存在一些例外的情况。对于财经类而言,活泼+非倾向性的资讯评论率最高。对于社会类而言,活泼+倾向性的资讯评论率最高。我们在今日头条平台上选择了育儿类、健康类、时尚类三个细分类别,在剔除无效样本后,按照评论数选择Top300的资讯作为研究对象。在这一部分,依照资讯特性,我们从严肃/活泼、蹭热点/非蹭热点两个维度进行写作方式的分析和标注,从而探讨不同写作方式的资讯评论率的高低。蹭热点是指使自己的内容与当前热点产生关联,或围绕当前热点创作内容。表5是三大类别不同写作方式的样本量。严肃+蹭热点活泼+蹭热点严肃+非蹭热点活泼+非蹭热点合计育儿类15620475300健康类211417491300时尚类1066027107300表54-210数据来源:头条指数注:评论率反映某类文章引发评论的难易程度,评论率=评论数/阅读数。写作方式11 2017.07 今日头条算数中心总体而言,严肃+蹭热点的资讯评论率最高,如育儿类和健康类 。但是对于时尚类而言,严肃+非蹭热点的资讯,评论率最高。今日头条绝不唯流量是举、唯点击率是举,我们相信用户愿意接受各种好的东西,平台也会继续在推荐机制设计上给严肃的、优质的内容更多资源扶持和倾斜。”今日头条高级运营总监 吴达05. PART FIVE结尾方式Ways of Ending数据来源:头条指数以祈使句结尾12 2017.07 今日头条算数中心文章这5种症状都在表明:你体内可能有大量蛔虫寄生的结尾为:如果大家有什么经验和方法,请务必和我们分享,让我们能帮助到更多的人远离蛔虫病!下期见!11,970在健康类资讯中,大约每8个样本中就有1个以祈使句结尾(13.00%) 。数据来源:头条指数13 2017.07 今日头条算数中心以问句结尾13,050在育儿类资讯中,大约每7个样本中就有1个以问句结尾(14.33%)。文章你站哪边?2岁小孩被4岁熊娃从滑梯推落 孩爸怒踹熊娃的结尾为:这些事儿,你怎么看?数据来源:头条指数结尾设置投票14 2017.07 今日头条算数中心文章华为荣耀系统停更,请愿无效!花粉反目的结尾为:“荣耀6系统停更你怎么看? (单选)”支持!配置跟不上就不更不支持!老用户也需要关爱打酱油3,810在科技类资讯中,大约每37个样本中就有1个结尾设置投票(2.67%) 。结语Conclusion15数据来源:头条指数人们更多地参与到创作与交流中我们监测了今日头条平台2017年第15周至第30周的平均每百万人评论量,增长率为49.76%。数据来源:今日头条算法辅助,净化讨论环境16 2017.07 今日头条算数中心机器学习比较有把握机器学习非常有把握评论机器学习模型&规则进折叠区以作警示自见以避免骚扰放出用户反馈和审核人员纠编用户反馈和审核人员纠编头条评论每天对谩骂、低俗内容的识别准确率达99%。打击网络暴力评论的流程图今日头条算数中心今日头条用户评论数据报告(下)本文就你话多今日头条用户评论数据报告(下)(以下简称“本报告”)由今日头条算数中心(以下简称“算数中心”)制作。报告中文字、数据等受中国知识产权法律法规保护。除注明的引用第三方数据及公开信息,本报告所有权归今日头条算数中心所有。算数中心致力于更及时、更全面、更深度的阅读数据挖掘和数据应用创新。未经允许,不得对本报告进行加工或改造。如有转载或引用,需及时与我们联系并注明出处“今日头条算数中心”,同时不得删减或改写报告内容。特此声明。重要声明Declaration关于我们About Us今日头条算数中心依靠今日头条海量用户每天数以百亿次级的阅读行为产生的数据,测量每一则资讯的传播力,描绘每一个用户更精准的画像,洞悉用户阅读行为下更深层的动机,致力于更广更深的阅读数据挖据,用数据服务各个行业。下载更多原版报告,请访问今日头条媒体实验室(mlab.toutiao.com)报告下载区。电邮:datadancebytedance.com地址:北京海淀区知春路63号中国卫星通信大厦F17研究人员:刘志毅&裴俊良&吴珏报告下载区二维码公众号二维码
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号