XML学习笔记--背诵版

zyjj 2019-06-26

前言

一直想系统性的学XML,就没时间学,今晚抽出几个小时时间学完了XML。过几天再过来看看,背一背应该就差不多,记得东西较多,没什么难理解的。

XML数据传输格式

第一章 XML概述

1.1 引入

当我们看到 XML 标准突飞猛进的开发进度,以及大批的软件开发商采用这个标准的日新月异的速度时,真的是不禁感叹这真是令人叹为观止。

目前,XML 在 Web 中起到的作用不会亚于一直作为 Web 基石的 HTML。

XML 无所不在。XML 是各种应用程序之间进行数据传输的最常用的工具,并且在信息存储和描述领域变得越来越流行。

XML的主要用途有哪些?

1.程序之间的数据传输通讯(可以是跨语言传输)

2.配置文件config.xml

3.存储数据,充当小型数据库

优势:

规范数据格式,是数据具有结构性,易读易处理

1.2 什么是XML

XML 指可扩展标记语言(eXtensible Markup Language),被设计用来传输和存储数据;XML 需要自行定义标签,且标签名称具有自我描述性;XML 是 W3C 推荐的数据传输存放标准。

XML和HTML的区别?

1.html标签不能自定义,XML只能自定义标签。

2.html语法要求不严格,xml对于语法的要求非常严格,标签必须是闭合的。

3.XML 被设计用来传输和存储数据,其焦点是数据内容;HTML 被设计用来显示数据,其焦点是数据的外观呈现。

第二章 XML的基本语法

2.1 语法规则

1.XML 文档必须有根元素,根元素是所有其他元素的父元素。

2.XML声明语句是可选部分,如果存在需要放在文档的第一行

所谓的文档声明就是告诉解析器当前文档格式、版本号以及编码格式。

3.所有的 XML 元素都必须是成对闭合标签;非闭合标签是非法的,解析器将报错,不无正常解析.

4.XML 标签对大小写敏感,必须头尾标签一致。

5.XML标签不允许有交叉嵌套,也就是父子标签关系不能交叉嵌套。

6.XML标签名不要使用特殊字符,尽量只用数字字母下划线。

7.XML 中的注释与HTML中注释一个语法格式。

8.实体引用 & 特殊字符

在 XML 中,一些字符拥有特殊的意义,如果您把字符 "<" 放在 XML 元素中,会发生错误,这是因为解析器会把它当作新元素的开始<age>46 < 100 </age>这样会产生 XML 错误;

为了避免错误,要用实体引用来代替特殊字符,格式与HTML中的实体字符用法一样

实体引用实体字符含义
&lt<小于-less than
&gt>大于-greater than
&amp&与--ampersand
&apos'单引号-apostrophe
&quot"双引号-quotation mark

2.2 元素属性

XML 元素中,可以随意添加一个或多个属性,前提是

属性值一定要用引号(单引号或双引号)引起来

属性名称的命名规范与元素的命名规范相同

元素中的属性是不允许重复的

属性也是用来存储数据信息的但实际开发经验是 在HTML中,属性用起来很便利,而在 XML 中,应该尽量避免使用属性,原因是

1.一个属性不能包含多个值(元素可以)

2.属性值不能是结构化数据(元素可以)

3.属性不容易扩展(为未来的变化)

4.属性难以阅读和维护。

总结:将数据放在属性中和放在子元素中,目的都是为了传输数据,而子元素更加容易被解析,更好维护,更便于引用。

2.3 CDATA

要处理大量特殊字符时,不能再用实体引用来处理了(主要是太麻烦,工作量大)可以使用CDATA将数据包裹就可以按原格式输出。

格式:<test><![CDATA[第一题题1:已知 c<4,d>5,问:c和d那个更好看? ]]> </test>

实体引用和CDATA的使用时机:

1.对于内容比较少的情况,可以使用实体引用对特殊字符进行直接替换操作。

2.对于内容比较多的情况,建议采用CDATA区段。

第三章 使用PHP解析XML文档

在PHP5版本以后,其提供了一个非常非常强大的类库,SimpleXML类库,专门用于实现对XML文档的解析操作。PHP中使用这个类库来处理XML数据。

3.1 XML解析原理

XML在解析时一共要经历三个步骤:

  1. 读取XML文档到内存

2.形成DOM树结构(DOM树可以简单理解文档的父子结构)

3.生成SimpleXML对象

3.2 SimpleXML类库

语法:simplexml_load_file('test.xml');

<?xml version="1.0" encoding="UTF-8"?>
<user>
    <man>
    <name>aklman</name>
        <age>20</age>
            <sex>男</sex>
    </man>
    <man sex="男">
        <name>ak</name>
        <age>22</age>
    </man>
</user>
$xml=simplexml_load_file('test.xml');//引入文件并读取
var_dump($xml);//输出,输出个格式就是一个对象
1.如果当前读取的节点是对象就通过->来进行访问;

2.如果当前读取的节点是数组就通过[]来进行访问;

3.3 遍历XML数据

1.foreach循环遍历
$xml=simplexml_load_file('test.html);
foreach($xml->man as $v){
    echo 'Name:'.$v->name.'Age:'.$v->age.'<br>';
}
2.for循环遍历
$xml=simplexml_load_file('test.html);
$length=count($xml);
for($i=0;$i<$length;$i++){
    echo $xml->man[$i]->name;
}
读取节点的属性时XML属性要加到父节点,PHP才能解析
$xml=simplexml_load_file('test.xml');
echo $xml->man[1]->attributes()->sex;
//attributes()方法是用来获取节点属性,
//内存中节点属性存放在attributes中,它是一个以为数组,可以使用attributes()方法获取

3.4 使用SImpleXML增加节点

$xml=simplexml_load_file('test.html);
$man=
//创建添加子节点
$man = $xml->addChild('man');
//为节点添加属性
$man->addAttribute('sex','女');
//创建添加子节点及节点值
$man->addChild('name','aklman');
$man->addChild('age','23');
var_dump($xml);//打印,已经添加到内存
$xml->asXML('test1.xml');//保存数据进XML文件,没有文件,则创建;

3.5 案例

查询手机归属地案例,数据来源聚合网
<form action="03.5.php" method="get">
    <input type="text" name="num"><br>
    <input type="submit" value="提交">
</form>
//接受前台提交的数据
$tel = $_GET['num'];
//组装请求地址
$url = 'http://v.juhe.cn/telephone/index?telephoneNumber='.$tel.'&dtype=xml&format=&key=810c3b2c488bc37d5f521196d8799a7211';//地址已经打乱了,需要从聚合网购买
//发送请求并接受返回的数据
$s = file_get_contents($url);
// echo $s; //打印返回的XML数据
//使用 simplexml_load_string 函数读入并解析XML数据
$xml = simplexml_load_string($s);
//找到并打印我们想要的数据
echo '归属省:'.$xml->result->place->city111.'<hr>';
echo '归属城市:'.$xml->result->place->city.'<hr>';

第四章 Xpath语言

4.1 概述

XPath是一门在 XML 文档中查找信息的语言,XPath可用来在 XML 文档中对元素和属性进行遍历。

4.2 使用及语法

使用注意事项:

1.使用绝对路径实现数据查询
$xml = simplexml_load_file('user.xml');
//按节点的绝对路径查找
$data = $xml->xpath('/user/man/name');//返回数组
foreach($data as $v){
    echo $v.'<hr>';
}
/*
*如果路径以斜线 / 开始, 那么该路径就表示到一个元素的绝对路径,
*绝对路径实现数据查询必须一级一级的查询下去,不能越级。
*/
2.使用相对路径实现数据查询
$xml = simplexml_load_file('user.xml');
//按节点的相对路径查找
$data = $xml->xpath('//name');//返回数组
foreach($data as $v){
echo $v.'<hr>';
}
/*
*如果路径以双斜线 // 开头, 则表示选择文档中所有满足双斜线//之后规则的元素(无论层级关系)
*/
3.使用*来匹配所有节点
$xml = simplexml_load_file('user.xml');
//匹配man节点下的所有元素节点。
$data = $xml->xpath('//man/*');//返回数组
foreach($data as $v){
echo $v.'<hr>';
}
4.使用[]方括号的形式来实现数据查询
$xml = simplexml_load_file('user.xml');
//匹配man节点下的最后一个节点。
$data = $xml->xpath('//man[last()]');//返回数组
var_dump($data);
echo $data[0]->name;
//man[1] : 获取第一个man元素
//man[last()]:获取最后一个man元素
//man[age > 200] :获取age>200的man节点
/*
*方块号里的表达式可以进一步的指定元素, 其中数字表示元素在选择集里的位置
*默认从1开始,而last()函数则表示选择集中的最后一个元素,括号内还可以放置表达式
*/
5.使用属性来获取元素
$xml = simplexml_load_file('user.xml');
//匹配man节点下含有sex属性的节点。
$data = $xml->xpath('//man[@sex]');//返回数组
var_dump($data);
echo $data[0]->name;

参考资料

W3school
菜鸟教程
XML编程与应用教程(第2版)

相关推荐