资源预览内容
第1页 / 共103页
第2页 / 共103页
第3页 / 共103页
第4页 / 共103页
第5页 / 共103页
第6页 / 共103页
第7页 / 共103页
第8页 / 共103页
第9页 / 共103页
第10页 / 共103页
亲,该文档总共103页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
互联网广告算法和系统实践前言这两年在招聘过程中,有很多的同学问我“大互联网公司的广告部门是做什么的?”,或者“互联网广告算法都包括哪些?”。有些时候,一些同学还会问的更加细致,比如“DSP的报价算法是怎么设计的?”、“不同公司的搜索广告算法一样吗?”、“海量数据下的模型训练系统是怎么搭建的?”。更有一些焦急的找工作的同学直接了当的问我“我学的专业能否进入广告部门?”。在解答同学们的问题之余,我开始构思写这个入门短书,本书的定位非常明确,就是力求用简单明了的语言,给入门级的同学介绍一下互联网广告算法的体系。在本书中,有很多的地方没有详细的展开,这是留给同学们去自学的地方,大家可以根据书中的内容,自己去深入挖掘。比如,对于逻辑回归的详细推导,大家可以去找一下相关的书籍和博客;对于ctr prediction的工程优化,大家可以去google上面找找相关论文,扩展一下视野。本书注重实践,写了一些实践的例子,有些实践是一个方向的深入阐述,有些实践是经验的总结。希望这本短书能够帮到大家。与人分享,不亦乐乎。第一部分 互联网广告简介1.1 广告简介在今天,如果你问一个人:“什么是广告?”回答可能五花八门,因为现在的广告形式日新月异,已经发生了巨大的变化,渗透到了几乎生活的每一个角落。我们现在在电视上、电影放映前、地铁里、商场里、车站牌上、洗手间里广告无处不在。以至于有些人预测了一幅未来的人类社会场景:随着显示硬件技术和联网技术的极大发展,所有的公共区域,甚至墙上都布满了显示和输入设备,每个人都可以随意的在街角的一块墙上输入自己的身份,然后登陆完成自己的所有操作,同时也收到了来自各种源的定向广告内容。当然,这只是一种带有科幻色彩的想象,目前的广告形式和广告渠道并没有达到这种大一统的阶段。William F.Arens在(中文名当代广告学)里,给了一个定义:广告是由已确定的出资人通过各种媒介进行的有关产品(商品、服务和观点)的、有偿的、有组织的、综合的、劝服性的非人员的信息传播活动。这个定义到现在也不过时,在这个定义里,我们看到了传统广告业务包括了三方角色,分别是:广告主(Advertiser)、媒体(Media)、普通受众(Audience)。这三方的诉求和利益各不相同,共同构成了一个博弈的生态系统。充分理解这个生态系统的构成,对于后面理解广告系统的算法设计、目标设计、平衡之道,具有重要意义。既然谈到了广告,那么,在这里简单说一下广告的历史。目前认为最早的广告是古希腊的寻奴,这是一则寻人启事,描述了一个在逃的奴隶,并悬赏一枚硬币抓捕。古罗马也有早期广告的痕迹,庞贝古城的废墟里面就发现了关于商业信息和政治信息展示物。在古埃及和古阿拉伯,也都有用纸莎草来制作销售信息和贴墙海报的历史。真正意义的现代广告,随着印刷术在15世纪的广泛应用出现在欧洲。英国出现了世界广告史上第一个纸质的广告宣传教会图书。随着纸质媒体的发展,广告业务迅速发展,到了1843年,第一家广告代理公司由Volney Palmer创立,专门贩卖广告版面,却并不提供内容。在1869年,Georage P Rowell编写了广告史上第一部报纸索引,即罗威尔美国报纸指南,后来他又创办了,即印刷商的油墨,这是第一份广告行业杂志。在1869年,F. Wayland Ayer成立了美国艾尔父子广告公司,这家公司在后来提供了设计、文案、媒体策略等各方面的服务,是第一个具备现代广告公司基本特征的公司。在大热的美剧疯狂广告人里面,描述了美国上世纪60年代,处于黄金时期的传统广告业。剧中展现了令人叹为观止的广告创意和灵感,有些即便放在今天也是经典。时至今日,中国互联网广告产业已经有了千亿的规模,产品形式丰富多样,每天影响着几亿中国网民,是实实在在的“大产业”。而且,互联网广告可以用算法进行优化,投放效果可以量化评估,这些都是传统广告行业不可比拟的。1.2 互联网广告简史在20世纪末的美国,大型互联网公司开始崛起,美国在线(AOL)、雅虎(Yahoo!)开始逐渐成为科技之星,Amazon还只是个网上的小书店。AOL和Yahoo!的巨大的流量(刚开始也只是百万级的pv)并没有转换成巨大的收入。这时,这些互联网公司开始尝试在页面中插入条幅(banner)广告创意,并向广告主收取费用,这种条幅广告就是显示广告(Display Advertising)的最初雏形。显示广告的售卖方式是按照所谓的合约广告(Agreement-based Advertising)方式进行的,合约广告是指:采用合同约束的方式,让某一广告位在某一段时间被特定广告主所独占。这个时候的广告并没有今天这么复杂的在线计算,甚至就是没有什么计算,只是工程师把HTML的代码嵌入到网站的某个位置而已。这种简单的售卖方式,非常符合普通的广告售卖认知,但是却无法提升互联网广告的地位。很快,对于不同的人群做不同的广告创意投放开始出现了,这是一个重要的转折点,标志着互联网广告从单纯的位置、时间售卖,进入到算法驱动的时代。这种定向广告(Targetd Advertising),通过受众定向技术(Audience Targeting)分析用户的属性(User Profile)标签(性别、年龄),通过广告投放服务(Ad Server),将原来静态的广告HTML代码转变为根据算法实时变换广告HTML代码,返回给浏览者。一开始的广告投放,网站作为媒体方,需要跟广告主保证一定的投放量(页面展示或者时长),这种担保式的投放(Guaranteed Delivery)开始逐渐成为最流行的方式,此时的计费方式,主要以CPM(Cost per Mille)为主,即千次展现付费。我们可以看出,担保式的投放是一个面对广告主的包销式的售卖,这种方式是不能达到“每次流量的利益最大化”的。在Overture公司(原名GoTo公司)的开创下,竞价广告(Auction-based Advertising)应运而生,开创了互联网广告崭新的一片天地。后来,Overture公司被雅虎收购。竞价广告随着Google公司的腾飞而发扬光大的。Google公司在2002年发布了第一个广告推送产品:Adwords Select,并革命性的采用了广义二阶价格拍卖(GSP),取代了Overture公司的广义一阶价格拍卖(GFP),成为后来互联网广告的定价(Pricing)基石。关于定价的详细理论,我们后面还会讨论。Google的最主要的收入来自于搜索广告(Search Ad),而这种搜索广告的形式,其实就是根据用户的搜索词进行定向,然后投放相关的广告。Google公司并没有满足于搜索广告,而是继续把目光投向了其它的网站的流量,利用自身的技术优势,开始大量分析其它网站的网页内容,并根据网页的内容给用户提供广告,这就产生了上下文广告(Contextual Advertising)。上下文广告是根据网页的上下文内容进行的定向,这种定向方式是假定用户的兴趣点跟当前的网页内容是相关的。在定向广告以后的发展历史里,将会产生根据用户历史行为进行定向的技术(Behavior Targeting),那时,对用户历史行为的挖掘和分析将获得极大的发展。随着互联网广告的演进,有一些需求方(Demand Side)对流量的定制化需求越来越高,甚至想自己去控制竞价流量,这样就产生了一种新的竞价模式:实时竞价(Real Time Bidding)。这种竞价方式改变了预先由广告主出价的模式,改为每次请求的时候,实时出价。随着互联网广告市场的媒体流量的聚合,一些聚合的流量联盟采用实时竞价的方式来变现自己的流量,这样就产生了一个新的互联网广告产品:广告交易平台(Ad Exchange)。说到广告交易平台,总要提起股票交易大厅的概念来作类比,也就是说,广告交易平台是一个交易平台,处于中间的角色,一方面接入了流量,另一方面接入了竞价的广告主;这种角色配置跟股票交易大厅的情况很类似。广告交易平台所聚合的中小流量,很多都不可能单独满足一个广告主的精细的定制化需求,比如:一个小型网站,作为流量的提供方(Supply Side),没有技术力量去做人群分析等工作,就可以接入广告交易平台,由需求方来按照自己的挑选流量的标准去竞价,价高者得。这样既避免了小网站变现难的尴尬,也给广告主更多更自主的选择。上面所说的需求方组成的平台,叫做需求方平台(Demand Side Platform,DSP),提供方组成的平台叫做提供方平台(Supply Side Platform)。DSP可以是广告主自己,也可以是一些专门的技术公司,这是因为RTB技术是很专业、很复杂的技术,需要较强的技术力量。这方面的内容在后面还会详细讲到。平行于售卖方式进化历史的另一个历史,是计费方式的历史。CPC(Cost per Click)是按照点击付费的方式,这种方式能够让一些中小网站媒体获得了可以变现的方式,即:不用跟大网站一样去费力的向大品牌广告主兜售自己的流量大品牌广告主更倾向于大网站的充沛流量和影响力而是可以把自己的流量加入到某些网络联盟里面,借助联盟的力量为自己变现,只要获得了点击就可以有收入。而CPS(Cost per Sale)模式则是更加有利于广告主的一种计费方式,这种方式只有在发生了销售的情况下,广告主才付费,这样的定价方式,可以让广告主基本达到一种“无忧”的投放状态,即不担心投资回报率的问题。但是,另一方面,CPM、CPC和CPS这些计费方式,无法相互取代,因为广告主的诉求是不一样的。有些广告主要求大面积、稳定的曝光,这时候,可能CPM会比较适合。有些广告主只是想把流量引入到自己的网站,这时候,CPC可能比较合适。有些广告主只想在成交的时候才付费,那么,CPS比较合适。关于计费方式,后面还要讨论。目前在中国,最大的三家互联网公司BAT(Baidu、Alibaba、Tencent)已经掌控了超过90%的互联网在线广告市场收入。这三家企业分别是搜索、电子商务、即时通讯这几个方向的领军企业,在广告产品形式方面各有特点,但是背后的算法、引擎架构、存储方案都有相同或者想通的地方,这些将在后面详细介绍。1.3 互联网广告类型互联网广告从诞生之日起,就没有停止过形式创新的步伐,从最初的条幅广告开始,随之技术的进步,不断的丰富广告展示内容和方法。下面就对这些类型做一个简单的介绍。(一)条幅广告(Banner Ad)起源最早的互联网广告形式,一直到目前都活跃在各种网站上。这种广告一般具有固定的尺寸,内容用图片或者Flash等方式展现,有很多是动态的创意素材。(二)邮件直接营销广告(Email Direct Marketing, EDM)通过电子邮件的方式进行宣传的方式,这种方式要对客户的兴趣有一定的了解,否则极易沦为垃圾邮件,被扔进黑名单。(三)富媒体广告(Rich Media Ad)顾名思义,这种广告是内容展现力很强的一种广告形式,一般是采取中断式、侵入式、遮挡式的方式,想浏览者推送品牌性很强、创意很丰富的广告。这种广告甚至有时候允许用户交互。(四)视频广告(Video Ad)视频广告的形式比较多样,片头广告、片尾广告、暂停阶段的广告、正常播放中间的插片广告,等等。(五)文字链广告(Textual Ad)顾名思义,就是以文字内容为主的广告,文字一般配有链接,会引导到广告主的网站或者活动页。由于文字链广告占用篇幅少,而且可以跟上下文进行配合,所以应用场景很多,在搜索广告当中是主流形式。(六)社交广告(Social Ad)随着社交网络(Social Network)的兴起,在社交场景下,跟场景结合推出的广告,取得了很好的效果。随着国内社交产品
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号