资源预览内容
第1页 / 共33页
第2页 / 共33页
第3页 / 共33页
第4页 / 共33页
第5页 / 共33页
第6页 / 共33页
第7页 / 共33页
第8页 / 共33页
第9页 / 共33页
第10页 / 共33页
亲,该文档总共33页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
18 幂律与富者更富现象 Power Laws and Rich-Get- Richer Phenomena1“富者愈富,穷者愈穷”r马太效应m圣经新约的“马太福音”第二十五章中 有这么说道:“凡有的,还还要加给给他叫他多 余;没有的,连连他所有的也要夺过夺过 来。”r道德经七十七章:“天之道,损损有 余而补补不足;人之道则则不然,损损不足以 奉有余。”r1968年,罗伯特莫顿(Robert K. Merton) 提出马太效应概括一种社会心理现象:“相对 于那些不知名的研究者,声名显赫的科学家通 常得到更多的声望,即使他们的成就是相似的 ,同样地,在一个项目上,声誉通常给予那些 已经出名的研究者”2现实中体现“富者愈富”特征的过程 r书籍、流行歌曲唱片的 销售 r微博主的粉丝的增加 r一个人的名声,得到的“ 好处”r网页的入向链接数 r“买了这,也买了那”的 推荐方式 r3粉丝 7500万粉丝 600多4r“名人效应”m考虑一个网络中,度大的节点会越来越大,而度小的节点呈现出 普遍性m极少数节点有大量的连接,而大多数节点只有少量连接r“富者愈富”的网络在演化中,存在一种“偏好连接”性m经济学报酬增加律m人工智能适应性学习m生物学自然选择m正反馈,“富者愈富,穷者愈穷”“富者愈富”类似的概念5r增长性m网络节点数不可能一成不变,它有一个增长的过程r偏好连接m新加入节点与其它已经存在的节点连接概率跟该已存在节点的度 成正比“富者愈富”演化模型r令 t 足够大,因此得到网络稳定度序列分布的 概率密度函数近似为:r网络演化模型节点度分布的方程为:“富者愈富”导致幂律:节点度分布 解析 Reka Albert, Albert-Laszlo Barabasi. Statistical mechanics of complex networks. REVIEWS OF MODERN PHYSICS, VOLUME 74, JANUARY 20026幂律分布The difference between a power law and an exponential distribution204060801000.20.61Above a certain x value, the power law is always higher than the exponential. 7semilog 10100101102103-410-310-210-1100loglogThis difference is particularly obvious if we plot them on a log vertical scale: for large x there are orders of magnitude differences between the two functions.The difference between a power law and an exponential distribution8Over 3 billion documentsROBOT: collects all URLs found in a document and follows them recursivelyNodes: WWW documents Links: URL linksExpectedP(k) k-FoundScale-free NetworkExponential NetworkWhat does the difference mean? Visual representation.R. Albert, H. Jeong, A-L Barabasi, Nature, 401 130 (1999).9WORLD WIDE WEB10Nodes: WWW documents Links: URL linksOver 3 billion documentsROBOT: collects all URLs found in a document and follows them recursivelyExpectedP(k) k-FoundR. Albert, H. Jeong, A-L Barabasi, Nature, 401 130 (1999).WORLD WIDE WEB11protein-gene interactionsprotein-protein interactionsPROTEOMEGENOMECitrate CycleMETABOLISMBio-chemical reactionsBio-Mapprotein-protein interactionsPROTEOMEMETABOLIC NETWORK13H. Jeong, S.P. Mason, A.-L. Barabasi, Z.N. Oltvai, Nature 411, 41-42 (2001)14Prot P(k)Nodes: proteins Links: physical interactions-binding TOPOLOGY OF THE PROTEIN NETWORKC. ElegansLi et al. Science 2004Drosophila M.Giot et al. Science 200315“富者愈富”的不可预测性 r流行度的上升,在初始阶段是比较脆弱的;一 旦被充分肯定,在富者愈富模型的推动下,其 流行度就可能变得更高r富者愈富的过程是一个不确定的过程,充满了 潜在的意外和失误:m让时光倒流15年,哈利波特还会售出上亿本或者只是默 默无闻?m历史重演多次,每次的流行度都应该服从幂律分布,但我们 并不清楚最流行的项目是否在每次重演都保持一致r一本书、一部电影、一个名人或网站的成功受 到反馈效应的影响,表现出固有的不可预知性16Experimental Study of Inequality and Unpredictability in an Artificial Cultural MarketrSalgankik、Dodds、Watts 音乐推广网站实验rSCIENCErFEBRUARY 2006 VOL 311 r创建一个音乐下载网站,提 供48首公众不熟悉的歌曲r9个复制网站,其中8个网站 实验社会影响,用户能看到 之前的下载数量,第9个网 站看不到下载数量r用户被随机分配到8个之一17Experimental Study of Inequality and Unpredictability in an Artificial Cultural Market18Experimental Study of Inequality and Unpredictability in an Artificial Cultural Market19Experimental Study of Inequality and Unpredictability in an Artificial Cultural Market20r不同歌曲的市场占 有率在不同的网站差 别很大r最好的歌曲不会在最 低点,最差的歌曲也 不会在最高点“长尾”现象 r流行度的分布可以产生重要的商业效应,特别 是在传媒业m畅销产品:品种少但非常流行,产生较高收益m利基产品:品种多但每种都不太流行,每种产品吸引一小部 分用户m想象一个拥有大量库存的传媒公司,如一家图书零售巨头, 需要做一个决定:大规模的降价销售是选择畅销产品还是利 基产品?r基于互联网的销售方式以及其它因素,已经将 媒体和娱乐产业推向以利基产品为主导的世界 ,那些不起眼的产品“长尾”吸引了大量的用户 ,如亚马逊(Amazon)和淘宝网21“长尾”现象 r两种视角m(图1)作为k的函数,流行 度恰好为k的图书所占比例 是多少?m(图2)作为k的函数,有多 少图书的流行度至少是k?r图2中以“销售排名”对 图书进行排序,销售 排名越靠后移到利基 产品时,尾部慢慢向 右下降,视觉上很像 一个“长尾”22“长尾”现象 r讨论m曲线上某个点j向右曲线以下面积=所有销售排名为j或者 更靠后的图书销售的总量m畅销产品与利基产品的权衡问题,表现为:对于某一特 定产品,曲线左边以下部分(畅销产品)面积更大还是 右边以下部分(利基产品)面积更大23长尾理论 24r当商品储存流通展示的场地和渠道 足够宽广,商品生产成本急剧下降 以至于个人都可以进行生产,并且 商品的销售成本急剧降低时,几乎 任何以前看似需求极低的产品,只要 有卖,都会有人买。这些需求和销 量不高的产品所占据的共同市场份 额,可以和主流产品的市场份额相 比,甚至更大r长尾市场也称之为“利基市场场”。“利 基”一词是英文“Niche” 的音译,意 译为“壁龛”,有拾遗补缺或见缝插 针的意思克里斯安德森搜索引擎与推荐系统r互联网搜索工具的出现,如谷歌。它是加强了 富者更富现象还是减弱了这种现象?m一方面,谷歌使用流行度测量网页的排名,排名较高的网页 是用户在建立自己的链接时能看到的主要网页,这种反馈会 加强富者愈富现象,产生更不平等的流行度m另一方面,用户在谷歌输入一些非常宽泛的查询,结果并没 有找到一个符合条件的结果列表,对于这类结果不明朗的查 询,用户可能被引领到一些从没有浏览过的网页,从而削弱 了富者愈富现象r推荐系统m从巨大数量的利基产品中盈利,公司需要其客户了解这类产 品,并采用一些合理的方式来展示这些商品m根据客户过去的购买历史,推断哪些不那么广泛流行的、但 符合用户兴趣的项目,如亚马逊和淘宝推广的推荐系统25深度学习:分析富者愈富的过程r体现富者愈富过程的一种模型m网页按照顺序创建:1,2,3,j,m当创建网页 j时,以概率p或1-p 选择如下(a) 或(b)执行a. 以概率 p,均匀地、随机地选择一个早先创建的网页 i, 建立一个从 j到 i的链接 b. 以1-p 的概率,按照与已有入度成比例的概率,选择一个 早先创建的网页 i,建立一个从 j到 i的链接。26富者愈富:已有链接越多,再得到链接的可能性 越大;而且,p越小,这个现象会越明显节点入度的表达(随机)r考虑一个任意节点j,看它的入度随时间(步 )t=1,2,j,j+1,变化的情况r显然,节点j的入度是一个随机变量,Xj(t)mXj(t)=0,tj;对于tj,节点t+1给j链接的概率为两部分之和27因每个节点只发出一条边,这式子也可解释为: 基于j在t时的入度,在t+1时得到的增量这直接对应于前述模型 过程的描述节点入度的近似:从随机到确定r用连续函数xj(t)近似Xj(t),类似有xj(j)=0,且其中,q=1-p 。这就得到一个用微分方程描述的节 点入度,将过程(t)和目标参量联系起来。对 每个j都有这样一个方程,边界条件xj(j)=028因节点只发出一条边,可解释为:基 于j在t时的入度,在t+1时得到的增量解节点入度方程r解节点入度微分方程,有:r利用初值xj(j)=0,求得:r代入方程解就是:29对每一个j,都有这样一个关于 t的幂函数,tj。j越大,值越 小。节点入度的概率分布函数(PDF)r我们需要的是节点入度的分布,考虑在t时刻 入度至少为k的节点个数的占比,即要看满足 xj(t)k的节点 j在节点总数t中的占比。先是解 出满足不等式的j,即:除以t就得到:30这就对应我们要求 的 概率分布函数(1- PDF)从PDF到概率密度函数(pdf)r于是,概率分布函数为:r求导得概率密度函数(pdf):31即入度为k的节点出现的概率呈幂 律富者愈富模型中的概率与幂指数r关于指数r当p1,c趋大。根据模型,即富者愈富的现 象越来越不明显;而在概率分布表达式中,c 较大的意义是较大的k出
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号