这篇文章介绍的比较全的:http://wenku.baidu.com/view/bb73b94acf84b9d528ea7a69.html 此文档介绍适用于 Sitemap 协议的 XML 架构。 Sitemaps 协议格式由 XML 标记组成。Sitemap 的所有数据数值应为实体转义过的。文件本身应为 UTF-8 编码。 Sitemap 必须: 以 <urlset> 开始标记作为开始,以 </urlset> 结束标记作为结束。 在 <urlset> 标记中指定命名空间(协议标准)。 每个网址包含一个<url> 条目作为 XML 父标记。 在每个 <url> 父标记中包含一个 <loc> 子标记条目。 其他所有标记均为可选,搜索引擎不同,对可选标记的支持也各不相同。有关详情,请参阅各个搜索引擎的文档。
Browsing the archives for the xml tag
下表简要介绍了站点地图在列举网络网址时所需的标记。要添加关于特定内容类型的更多详情,请参见视频、图片、移动、新闻、软件源代码以及地理 (KML) 信息。 标记 必需? 说明 <urlset> 必需 包含站点地图中网址集的所有相关信息。 <url> 必需 包含特定网址的所有相关信息。 <loc> 必需 指定网址。请指定图片和视频的目标网页(又称播放页、引用页)。必须是具有唯一性的网址。 <lastmod> 可选 网址的最后修改时间,使用 YYYY-MM-DDThh:mmTZD 格式(时间值是可选的)。 <changefreq> 可选 提供关于网页更改频率的提示。有效值为: always。对于每次访问时都发生更改的网页,请使用该值。 hourly daily weekly monthly yearly never。对于已存档的网址,请使用该值。 <priority> 可选 说明网站上的某个网址相对于其他所有网址的优先级。此优先级的范围是 1.0(极其重要)到 0.1(一点都不重要)。不影响您的网站在 Google 搜索结果中的评级。由于该值是相对于您网站上的其他网页而言的,指定高优先级(或为所有网址指定相同优先级)对提高您网站的搜索评级毫无帮助。此外,将所有网页设置为同一优先级也不起作用。 来源:http://www.google.com/support/webmasters/bin/answer.py?answer=183668 要注意内容里的一些特殊字符,可能会产生异常的,解决方案见这里xml特殊字符的处理
转义字符 不合法的XML字符必须被替换为相应的实体。 如果在XML文档中使用类似"<" 的字符, 那么解析器将会出现错误,因为解析器会认为这是一个新元素的开始。所以不应该象下面那样书写代码: <message>if salary < 1000 then</message> 为了避免出现这种情况,必须将字符"<" 转换成实体,象下面这样: <message>if salary < 1000 then</message> 下面是五个在XML文档中预定义好的实体: < < 小于号 > > 大于号 & & 和 ' ' 单引号 " " 双引号
刚做完一个小的使用Ajax的项目。整个小项目使用JavaScript做客户端,使用PHP做服务器端、利用xmlHttpRequest组件作为交互工具,利用XML作为数据传输的格式。做完后基本做一个简单总结,简单分析一下使用XML作为传输格式的优劣。 [ XML ] 使用XML作为传输格式的优势: 1. 格式统一, 符合标准 2. 容易与其他系统进行远程交互, 数据共享比较方便 缺点: 1. XML文件格式文件庞大, 格式复杂, 传输占用带宽 2. 服务器端和客户端都需要花费大量代码来解析XML, 不论服务器端和客户端代码变的异常复杂和不容易维护 3. 客户端不同浏览器之间解析XML的方式不一致, 需要重复编写很多代码 4. 服务器端和客户端解析XML花费资源和时间 [ JSON ] 那么除了XML格式, 还有没有其他格式, 有一种叫做JSON (JavaScript Object Notation) 的轻量级数据交换格式能够替代XML的工作.
1.引言 当今,互联网已成为人类有史以来资源最多、品种最全、规模最大的信息库。作为网上发挥着非常重要的作用。传统的搜索引擎大都是基于最主要的信息检索工具,搜索引擎HTML的搜索引擎,HTML重显示而非内容的特点大大限制了搜索引擎的查准率,传统搜索引擎的查准率有待提高。现在越来越多的文档开始用XML语言来描述、存储和交换。XML的标记含义丰富、意义明确,能明白的提示所标记的内容,搜索引擎可以依靠标记和内容之间的依存关系,准确定位、找到目标,从而大大减小搜索范围,提高检索精度。目前基于XML的搜索引擎有两种信息检索单位:第一种是以文档为检索单位,第二种是以文档中被标注的元素为检索单位。其中第二种把XML文档库看作是半结构化文档的数据库,并使用了相应的数据库风格的查询语言。目前基于XML的搜索引擎研究是一个较新的课题。 点击下载:Research-on-XM-based-Search-Engine.pdf
从网上找来的XML-RPC库,对于开发小型的外部通讯接口很有用,把这个代码保存为xml-rpc.inc.php
cssrain翻了N多的关于AJAX加载XML的帖子尸体。。。。
总结一下:
1,Content-Type
很多时候无法解析就是Content-Type的问题。
如果本身就是xml文件,请跳过这一步
动态生成的XML一定要将其设置为text/xml,否则默认就是text/html也就是普通的文本了。
常见语言的Content-Type设置
header("Content-Type:text/xml"); //php
response.ContentType="text/xml" //asp
response.setHeader("ContentType","text/xml"); //jsp
2,xml结构。
XML一定要封闭的,很重要!