资源预览内容
第1页 / 共55页
第2页 / 共55页
第3页 / 共55页
第4页 / 共55页
第5页 / 共55页
第6页 / 共55页
第7页 / 共55页
第8页 / 共55页
第9页 / 共55页
第10页 / 共55页
亲,该文档总共55页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
2015年11月 20152015全局数据白皮书 全局数据白皮书 我们面对的世界我们面对的世界 万物互联:人类连接方式的改变促进了数据的爆炸性增长,导致了 社会驱动力变革 A B 信息时代的驱动力变革:技术驱动-数据驱动-场景驱动 万物互联万物互联 人类连接方式的改变导致了数据体量的爆炸性增长人类连接方式的改变导致了数据体量的爆炸性增长 在人类文明的伊始,日光之下,人 与人的第一声交流即意味着“连 接”的开始。语言使人与人连接, 连接即产生“数据”。而文字使这 种连接沉积为信息与知识。 工业文明时代,“连接”开始 通过无线电台、电报、电视的 形式存在,但这样的“连 接”产生的信息往往是单向性 而缺乏互动的。 伴随着移动互联网的发展、物 联网的逐渐普及,人类的沟通 和交互成本趋向为零成本、零 时差,万物互联的时代来临, 使随时随地收集数据成为可能。 在整个农耕文明时代,“连接”仅 是以语言沟通和书面文字沟通的形 式存在。 互联网时代,人和人开始通过网 络进行复杂交错的互动连接。社 交网站、电子邮件、搜索引擎、 聊天工具人类建立连接的方 式开始多样化、多维化。人类社 会产生的数据开始爆炸性增长。 万物互联万物互联 农耕文明连接方式 工业时代连接方式 互联网时代连接方式 文字 Word 语言 Language 电报 Telegram 电台 Radio 电视 Televison 互联网 Internet 移动互联网 MI 社交网络 SNS 物联网 IOT 连 接 方 式 改 变 导 致 可 收 集 记 录 的 数 据 体 量 增 长 人类连接方式的改变导致了数据体量的爆炸性增长人类连接方式的改变导致了数据体量的爆炸性增长 n 移动互联网移动互联网、物联网的兴起物联网的兴起,产业的数据化及技术的进步产业的数据化及技术的进步,让人类社会可被收集让人类社会可被收集、记录的数记录的数 据量产生了爆炸性增长据量产生了爆炸性增长。 万物互联万物互联 n 以移动设备为媒介以移动设备为媒介,人类与人类之间人类与人类之间、人类与设备之间人类与设备之间、设备与设备之间建立了更密切设备与设备之间建立了更密切、更即时的连接更即时的连接。 。 万物互联包括人与人万物互联包括人与人、人与设备人与设备、设备与设备之间的连接设备与设备之间的连接 万物互联万物互联 人类收集数据的渠道和手段极大丰富人类收集数据的渠道和手段极大丰富,数据开始真实还原客观世界的映射 数据开始真实还原客观世界的映射 客 观 世 界 OMINI DATA 30亿 30亿 2015全球互联 网用户数 映映 射 射 19亿 19亿 2015全球 智能手机 49亿 49亿 2015物联网设备 1亿 1亿 2017可穿戴设备 20亿 20亿 2015全球社交 媒体用户 n 数据是信息和知识的基础数据是信息和知识的基础,数据的激增也导致了人类社会信息和知识的爆炸性扩大数据的激增也导致了人类社会信息和知识的爆炸性扩大。 A B C 知识 数据 A C B 信息 A C B D E F 万物互联、数据爆炸的态势下, 什么在驱动着我们的未来? 从技术驱动到数据驱动从技术驱动到数据驱动,再到场景驱动 再到场景驱动 定位 测试优化 精准画像 预测分析 全渠道整合 场景化决策 A A B B C C 技术驱动技术驱动 “用户参与”成为可能,收集用户初始化信息, 根据信息执行策略并实施 信 息 时 代 的 驱 动 力 变 革 数据驱动数据驱动 收集的数据量打打增加,可直接通过数据进行趋 势预测和决策分析,可绘制用户画像,进行针对 性产品/服务推介 场景驱动场景驱动 可针对不同个体、群体所处情境,洞察情境中 “人”的决策机制 n 技术发展驱动了数据收集量的暴增技术发展驱动了数据收集量的暴增,而数据成为场景驱动的基础而数据成为场景驱动的基础。 n 人类对数据质量的要求大大提升人类对数据质量的要求大大提升。人类需要经过治理的数据去做智慧的驱动和决策人类需要经过治理的数据去做智慧的驱动和决策。 信息时代的驱动力变革信息时代的驱动力变革 从技术驱动到数据驱动从技术驱动到数据驱动,再到场景驱动 再到场景驱动 “场景驱动”三要素 A B C n “场景驱动”的基础一定是经过 治理的数据。 n “场景驱动”的“场景”对应的 一定是有应用价值的场景。 n “场景驱动”不仅会驱动人类的决策, 亦会驱动机器的自我进化和升级*。 *未来,机器将从“模拟再现人类某些智能行为”进化到自主收集信息、自动优化和“深度学习”,甚至可以开始独立思考。喂食给他们什么质量的数据,关系到机器如何优化、学习和思考。 n 人类掌控未来的核心破局点人类掌控未来的核心破局点,是以什么样的数据是以什么样的数据、以何种方式驱动人和机器的进化。 以何种方式驱动人和机器的进化。 n 我们需要经过我们需要经过治理的数据治理的数据去做去做智慧的智慧的驱动驱动,才不致于将人类社会引入歧途才不致于将人类社会引入歧途。 大数据需要进化大数据需要进化 A 大数据应用的问题,关键是连接方式问题和数据质量问题。 B 万物互联、驱动力变革的时代,我们更需要数据治理导向下“开 放、可度量、场景化”的全局数据 “大数据指的是大小超出常规的数据库工具获取、存储、管理和分析能力的数据集但并不 是说一定要超过特定TB值的数据集才能算是大数据。” 麦肯锡Big data: The nextfrontier for innovation, competition,and productivity “(大数据指)海量的数据规模(Volume)、快速的数据流转和动态的数据体系 (Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value)。” IDC,国际数据公司 “大数据是任何超过了一台计算机处理能力的数据量。” John Rauser ,亚马逊大数据科学家 “巨量资料(big data),或称大数据,指的是所涉及的资料量规模巨大到无法通过目前主流软 件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资 讯。”维基百科 01 03 02 04 大数据的定义 大数据的定义 映射 映射 映射 时间 空间 空间 t i t i-1 数据映像与场景的逻辑关系数据映像与场景的逻辑关系 体系 体系 体系 场景1 场景3 场景2 映像2 场景1 场景3 场景2 映像3 场景1 场景3 场景2 映像1 BIGBIG? 仅仅大是不够的 仅仅大是不够的 n 映像是不同体系根据不同需求对客观世界的数据化抽象和沉积映像是不同体系根据不同需求对客观世界的数据化抽象和沉积。在这种抽取和沉积中本身已包含了一种逻辑在这种抽取和沉积中本身已包含了一种逻辑 (映射本身即算法(映射本身即算法)。)。 n 不同的映像构成体系不同的映像构成体系,而不同体系组合交叠成为客观世界而不同体系组合交叠成为客观世界。映像永远只是客观世界的一部分投影映像永远只是客观世界的一部分投影,而非全部而非全部。 BIGBIG? 仅仅是大仅仅是大,是不够的是不够的 数据映像与场景的逻辑关系数据映像与场景的逻辑关系 场景 时间 空间 语义 社群 情绪 语境 场景1 场景2 场景3 场景 N 映像映像 n 场景包括四部分:时间、空间、语义、语境(情绪、 社群)。 n 这四部分在不同的场景中随机组合而存在。 n 场景是映像的子集,不同的场景组合而成映像。 01 时间时间 01 空间空间 01 语义语义 01 语境语境 表达事物的生灭排列。 其内涵是无尽永前,其 外延是一切事件过程长 短和发生顺序的度量。 空间是与时间相对的 一种物质客观存在形 式,由长度、宽度、 高度、大小表现。通 常指四方上下。 信息的含义。(信息 是被赋予意义的数 据)。本处我们定义 为特定场景中的内容 表达。 语义产生的环境。不 同语境下,相同的语 义会产生不同的含义。 又可细分为不同要素, 如社群*、情绪*等。 *社群:群体代表在不同场景中,特定人的不同身份。*情绪:情绪指在特定场景中的一种引导情绪。 什么是“场景四要素什么是“场景四要素” BIGBIG? 仅仅大是不够的 仅仅大是不够的 BIGBIG? 仅仅大是不够的仅仅大是不够的 目前的大数据应用存在的问题,是连接方式和数据质量的问题 典型的的商业场景是,在BAT自有体系 内,他们的数据量都是非常巨大的。但 是,他们只能沉积和应用自己产品体系 内的各种数据,不能相互关联与开放。 商业竞争下BAT数据割据而形成的数据孤岛 n 仅仅是体量大,而不能使数据之间打破体系,互相流动印证是 不够的。 n 孤立的数据的价值远远小于全局的、广泛连接的数据价值。 n 数据的核心价值不来源“大”,而来源于其中蕴含的规律性与 智慧性。而这需要打破体系的界限,让数据产生连接,从而导 向更深度的洞察。 问题一 分散的数据孤岛分散的数据孤岛,无法建立连接无法建立连接,导致数据无法流动印证 导致数据无法流动印证 体系 体系体系1 1 场景1 场景3 场景2 映像2 场景1 场景3 场景2 映像3 场景1 场景3 场景2 映像1 体系 体系体系3 3 场景1 场景3 场景2 映像2 场景1 场景3 场景2 映像3 场景1 场景3 场景2 映像1 体系 体系体系2 2 场景1 场景3 场景2 映像2 场景1 场景3 场景2 映像3 场景1 场景3 场景2 映像1 BIGBIG? 仅仅大是不够的仅仅大是不够的 目前的大数据应用存在的问题,是连接方式和数据质量的问题 分散的数据孤岛,体系与体系间、映像 与映像间、场景与场景间都没有连接
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号