资源预览内容
第1页 / 共64页
第2页 / 共64页
第3页 / 共64页
第4页 / 共64页
第5页 / 共64页
第6页 / 共64页
第7页 / 共64页
第8页 / 共64页
第9页 / 共64页
第10页 / 共64页
亲,该文档总共64页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
高级高级高级高级W bW b技术技术技术技术高级高级高级高级WebWeb技术技术技术技术WebWeb上的数据标准上的数据标准XMLXMLWebWeb上的数据标准上的数据标准XMLXML概述与语法概述与语法概述与语法概述与语法课程主要内容组织课程主要内容组织课程主要内容组织课程主要内容组织课程主要内容组织课程主要内容组织课程主要内容组织课程主要内容组织高级开发与应用技术概述高级开发与应用技术概述请清听课思请清听课思?WEBWEB高级开发与应用技术概述高级开发与应用技术概述?基于Web的应用程序概及其演变基于Web的应用程序概及其演变?N层次架构,分布式对象(组件)技术概述N层次架构,分布式对象(组件)技术概述?核心技术讲解核心技术讲解?Web数据标准-XML的相关标准和应用Web数据标准-XML的相关标准和应用?VRMLVRML?X3DX3D?VRMLVRML?X3DX3D?Web上的分布式虚拟环境Web上的分布式虚拟环境?Application Web-J2EE Application Web-J2EE ?J2EE概述J2EE概述?企业应用背景企业应用背景?E BussinessEAI etcE BussinessEAI etc?Servlet & JSPServlet & JSP?EJB EJB ?J2EE组件与APIJ2EE组件与APIJ2EE MVCJ2EE MVC模式与框架模式与框架(struts spring etcstruts spring etc)?E E_ _BussinessBussiness, , EAIEAI etcetc. .?应用案应用案?J2EEJ2EE MVCMVC模式与框架模式与框架(strutsstruts, ,springspring etcetc)?Service Web Service Web Web ServicesWeb Services?Semantic WebSemantic Web本次课程内容本次课程内容本次课程内容本次课程内容?XML简介与起源简介与起源简介与起源简介与起源?XML的设计目的的设计目的?XML的特点的特点?XML1.0规范组成规范组成?XML文档逻辑结构文档逻辑结构?XML文档规则文档规则XML简介与起源简介与起源XML简介与起源简介与起源?XML是是 Extensible Markup Language (可扩展标记语言可扩展标记语言)的简称,是一的简称,是一种元语言种元语言(定义其他语言的系统定义其他语言的系统 )种元语言种元语言(定义其他语言的系统定义其他语言的系统 )?1996年年, W3C(World Wide WebConsortium,互联网联合组织)为了,互联网联合组织)为了克服克服HTML的局限性的局限性 在在SGML的基础上创建的基础上创建XML克服克服HTML的局限性的局限性, 在在SGML的基础上创建的基础上创建XML?计算机产业界 的需求:开发计算机产业界 的需求:开发简单而又可扩展的简单而又可扩展的、结构化和半结构化信息结构化和半结构化信息文本表示机制文本表示机制文本表示机制文本表示机制?HTML是是SGML的一个应用,的一个应用,XML是是SGML的一个子集的一个子集, 并且已经成为并且已经成为Internet上事实的数据交换标准上事实的数据交换标准Internet上事实的数据交换标准上事实的数据交换标准?1998年年2月推出第一个正式的月推出第一个正式的XML1.0版本;目前版本;目前XML已经以已经以扩展巴科斯扩展巴科斯-诺尔范式诺尔范式 EBNF(Extended Backus-Naur Form notation)的形式正式的形式正式诺尔范式诺尔范式 EBNF(Extended Backus Naur Form notation)的形式正式的形式正式定义了下来定义了下来?(XML 1.1 (Second Edition), W3C Recommendation, 16 August 2006 )?http:/www.w3.org/TR/2006/REC-xml11-20060816/?独立于平台的独立于平台的XML是为是为Web开发的开发的, 这是它最具影响的地方这是它最具影响的地方.HTML的局限性的局限性HTML的局限性的局限性?可扩展性可扩展性差差可扩展性可扩展性?HTML的标记集是固定的,即的标记集是固定的,即HTML语法是不可扩展的语法是不可扩展的缺乏对信息含义的描述能力缺乏对信息含义的描述能力信息检索效率低信息检索效率低?缺乏对信息含义的描述能力缺乏对信息含义的描述能力,信息检索效率低信息检索效率低?HTML是针对人机交流而设计的,标记几乎全都是用来设计网页的布局和外观的。检索信息时,需要对全部页面的所有内容扫描,并且检是针对人机交流而设计的,标记几乎全都是用来设计网页的布局和外观的。检索信息时,需要对全部页面的所有内容扫描,并且检索质量往往极差索质量往往极差夜夜我不觉晓夜夜我不觉晓夜夜我不觉晓夜夜我不觉晓苦苦绕世界找苦苦绕世界找玩儿命好几天玩儿命好几天玩儿命好几天玩儿命好几天有用的知多少有用的知多少HTML的局限性的局限性HTML的局限性的局限性?搜索引擎简介搜索引擎简介?搜索引擎简介搜索引擎简介?分类分类?目录式搜索引擎:早期的目录式搜索引擎:早期的Yahoo?全文搜索引擎:全文搜索引擎:Google及百度等第二代商用搜索引擎及百度等第二代商用搜索引擎?元搜索引擎:元搜索引擎:WebCrawlerHTML的局限性的局限性HTML的局限性的局限性?搜索引擎简介搜索引擎简介?搜索引擎简介搜索引擎简介?搜索引擎的体系结构搜索引擎的体系结构?下载系统:网络蜘蛛下载系统:网络蜘蛛(Spider),广度,深度优先,广度,深度优先( p)?分析系统:分词,分析系统:分词,PageRank?索引系统:正排索引;倒排索引索引系统:正排索引;倒排索引查询系统查询系统检索模型检索模型?查询系统查询系统:检索模型检索模型HTML的局限性的局限性HTML的局限性的局限性?搜索引擎简介搜索引擎简介?分词分词?基于字符串匹配基于字符串匹配?基于理解基于理解?基于统计基于统计PageRank?PageRankPR (A ) = (1- d) + d (PR (T1)/C (T1) + ?+ PR (Tn)/C (Tn) )?PR (A ) :网页:网页A 的的PageRank 值;值;?T1, T2, ?, Tn :网页网页A 的链入网页;的链入网页;,?PR (T i) :网页网页T i 的的PageRank 值值( i= 1, 2, ?n) ;?C (T i) :网页网页T i 的链出网页的数量的链出网页的数量( i= 1, 2, ?n) ;个衰个衰?d :一:一个衰个衰减因子减因子, 0 d 1, 通常取值为通常取值为0. 85。HTML的局限性的局限性HTML的局限性的局限性?搜索引擎简介搜索引擎简介?搜索引擎简介搜索引擎简介?索引系统索引系统?正排索引正排索引?倒排索引倒排索引?倒排索引倒排索引HTML的局限性的局限性HTML的局限性的局限性?搜索引擎简介搜索引擎简介?搜索引擎简介搜索引擎简介?查询系统查询系统?搜索引擎的评价标准搜索引擎的评价标准?查全率(查全率(Recall)?查准率(查准率(Precision)HTML的局限性的局限性HTML的局限性的局限性?搜索引擎简介搜索引擎简介?搜索引擎简介搜索引擎简介?垂直搜索引擎垂直搜索引擎HTML的局限性的局限性HTML的局限性的局限性?搜索引擎简介搜索引擎简介?搜索引擎简介搜索引擎简介?智能搜索引擎?智能搜索引擎?“这是“这是Web 将以一种智能的方式为我们服务、为我们完成乏味任务的时代的开始。将以一种智能的方式为我们服务、为我们完成乏味任务的时代的开始。Web 和信息量的增长速度非常快,开发智和信息量的增长速度非常快,开发智能化的搜索系统是势在必行的能化的搜索系统是势在必行的”能化的搜索系统是势在必行的能化的搜索系统是势在必行的。” Medstory的创始人、首席执行官阿莱因的创始人、首席执行官阿莱因HTML的局限性的局限性HTML的局限性的局限性?与应用程序的数据自动交换受限制与应用程序的数据自动交换受限制?服务器端在服务器端在HTML中嵌入动态数据是非常困难的中嵌入动态数据是非常困难的?客户端应用程序也很难自动从客户端应用程序也很难自动从HTML中获取所需的数据中获取所需的数据?描述能力有限描述能力有限?HTML语言不能描述矢量图形、数学公式、化学符号等特殊对象语言不能描述矢量图形、数学公式、化学符号等特殊对象?链接功能有限链接功能有限链路丢失后不能自动纠正链路丢失后不能自动纠正?链路丢失后不能自动纠正链路丢失后不能自动纠正?HTML不能维持文档间的任何历史和关系,因此如果页面的不能维持文档间的任何历史和关系,因此如果页面的URL地址变化了,浏览这些页面时就会遇到烦人的地址变化了,浏览这些页面时就会遇到烦人的404 URL地址未找到的信息。地址未找到的信息。链接方式是纯单向的链接方式是纯单向的?链接方式是纯单向的链接方式是纯单向的?虽然链接文档知道它要链接到的地法,但被链接的文档却无法知道它是从何处被链接的,而这一点对于开发者往往是很重要的信息虽然链接文档知道它要链接到的地法,但被链接的文档却无法知道它是从何处被链接的,而这一点对于开发者往往是很重要的信息。SGML简介简介SGML简介简介?是是标准通用化标记语言标准通用化标记语言(Standard Generalized Markup 的简称的简称是种用标记是种用标记来描述文档资料的国际来描述文档资料的国际Language)的简称的简称,是是一一种用标记种用标记(tag)来描述文档资料的国际来描述文档资料的国际标准通用语言标准通用语言?Web发明之前就存在了,是发明之前就存在了,是HTML和和XML的基础。的基础。?SGML中包中包含含了一系列的文了一系列的文档档类型定义(类型定义(简简称称DTD),用于定义),用于定义含档含档简简标记的含义,因而它的语法是可以扩展的标记的含义,因而它的语法是可以扩展的?优点: SGML的语义标记有助于计算机分类和索引的语义标记有助于计算机分类和索引,并且可扩展并且可扩展优点: SGML的语义标记有助于计算机分类和索引的语义标记有助于计算机分类和索引,并且可扩展并且可扩展成处理新数据格式的各种方法成处理新数据格式的各种方法?缺点: SGML十分庞大十分庞大,不易学不易学,不易用不易用,在计算机上尤其是在计算机上尤其是?缺点: SGML十分庞大十分庞大,不易学不易学,不易用不易用,在计算机上尤其是在计算机上尤其是web上实现也十分困难。上实现也十分困难。SGML 也代表“听起来很棒,但或许以后会用(也代表“听起来很棒,但或许以后会用(Sounds Great, Maybe Later)”)”XML的设计目的的设计目的XML的设计目的的设计目的?其设计目的在于其设计目的在于使得在使得在Web上以现有的上以现有的HTML方式提供、方式提供、接收和处理通用的接收和处理通用的SGML成为可能成为可能Its goal is to enable generic SGML to be served, received, and processed on the Web in hhiibli h HTML XML hbdid ffthe way that is now possible with HTML. XML has been designed for ease of implementation and for interoperability with both SGML and HTML.-(XML) 1.1 W3C Recommendation?W3C建议的建议的XML 1.0中对中对XML设计目标设计目标:(1)应该可以在)应该可以在Internet上直接使用上直接使用
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号