ahnuzfm 2019-12-18
第五章
5.2常见的Web应用安全漏洞
5.2.1SQL注入漏洞
SQL注入漏洞形成的原因:用户输入的数据被SQL解释器执行
防护手段:
5.2.2文件上传漏洞
原理:文件上传能实现代码没有严格限制用户上传的文件后缀以及文件类型,导致允许攻击者向某个可通过Web访问的目录上传任意PHP文件
原因:文件上传检查不严格;文件上传后修改文件名处理不当;使用第三方插件时引入
防护手段:
5.2.3XSS
定义:攻击者利用网站程序对用户输入过滤的不足,输入可以显示在页面上对其它用户造成影响的HTML代码,从而盗取用户资料
分类:
防护手段:过滤特殊字符;使用实体化编码
5.2.4CSRF
理解:攻击者盗用了你的身份,以你的名义进行非法操作
原理:受害者必须完成两个步骤,1.登陆受信任的网站A,并本地生成Cookie;2.在不登出A的情况西,访问危险网站B
不同的危害方式:论坛等可交互的地方;Web攻击者;网络攻击者
常见防护手段:添加验证码;验证referer;利用token
5.2.5远程代码执行漏洞
防范方法:禁用高位系统函数;严格过滤关键字符;严格限制允许的参数类型
5.3恶意代码
恶意代码又称恶意程序,是能够在计算机系统中进行非授权操作的代码。
特点:1.能够在很隐蔽的情况下嵌入另一程序中,通过运行别的程序而自动运行
2.是攻击者通过危害他人而达到获取利益的目的
分类:1.独立的恶意代码是指具备一个完整程序所具有的全部功能
2.非独立恶意代码必须嵌入某个完整的程序
危害:破化数据;占用磁盘存储空间;抢占系统资源;影响计算机运行速度
Webshell通常是可执行的脚本文件,可以理解为是一种Web脚本形式编写的木马后门,一般用于远程操控Web服务器
防范方法:服务器安全设置(加强对脚本文件的代码审计;Web服务器通过正则表达式);应用安全防护(Web软件开发的安全;FTP文件尚上载安全;文件系统的存储权限;不要使用超级用户运行Web服务器);控制文件上传(加强对脚本文件的代码审计;将应用系统的重要文件放在不同的文件夹中)
5.4
中间件: 是一种独立的系统软件或服务程序,分布式应用程序将借助这种软件在不同的技术之间共享资源
中间件的优势:屏蔽了底层操作系统的复杂性;减少了系统的维护,运行和管理的工作量,减少了计算机总体费用的投入;将不同时期,在不同操作系统上开发应用程序集中起来
分类:应用服务类中间件:为应用系统提供一个综合的计算环境和支撑平台
应用集成类中间件:提供各种不同网络应用系统之间的信息通信,服务集成和数据集成的功能
业务架构类中间件:包括业务流程(对业务对象的建模和业务规则的定义);业务交互(提供组织的合作伙伴,员工和客户通过Web与移动设备等交互工具)
5.5数据库
数据库是存储数据的仓库,是长期存放在计算机内,有组织可共享的大量数据的集合
SQL是用于对存放在计算机数据库中的数据进行组织,管理和检索的一种工具
数据可得防护方法:加强像SA这样账号的密码;对扩展存储过程进行处理;组织非授权用户的访问;加强对数据库登陆的日志记录;用管理员账号定期检查所有账号
第八章
舆情作为一种重要的社会精神现象,很早就收到了政治家和哲学家的关注。
舆论是舆情的近亲,很多余情的研究都是以舆论为起点。
舆情从字面上可以理解为舆论的总体情况。民众是政府公共决策的重要基础。
舆情包括网络舆情和社会舆情,两者相互映射,存在互动关系。
网络舆情是社会舆情的一部分,是媒体或网民借助互联网,对某一焦点问题,社会公共事务所变现出的具有一定社会影响力,带有倾向性的意见或言论,是社会舆情在互联网上的一种特殊反映。
网络舆情是指在网络空间内,民众围绕舆情因变事项的发生,发展和变化,通过互联网表达出来的对公共政策及其制定者的意见。
舆情分析的重要意义:
网络舆情的特点:
8.2网络舆情的分析方法
检索方法主要包括机器检索和人工检索两类
机器检索是借助信息检索工具在网络上抓取与给定关键词相关的信息,借助累加器,网址指向判断等简单的程序给出信息的来源和浏览量,并按照用户的要求进行筛选和排序。
机器检索的基本理论来自信息管理科学,典型的应用就是网络搜索引擎。搜索引擎包括索引处理和查询处理,核心是索引,即目录。
人工搜索是借助开放性工具完成网络舆情的分析工作。
检索方法的特点:
网络舆情的研判主要关注舆情发生的动因,核心诉求,传播路径和传播影响力,并判断舆情的传播走势的影响。需要完成两个任务:分析思路和理论支持。
人民网舆情监测室一般列举舆情事件的传播路径和关键节点,通过人工采样分析的方法分析网民的意见倾向,并通过简单的评书提供舆情引导策略
新华网:舆情解码是典型的例案研究,通过对单个网络舆情事件的全过程讨论,分析其特征与借鉴意义;今日舆情特点是针对单日网名的点击量,搜索量或者评论量较高的新闻做出的排行榜。
网络舆情信息的分析研判主要包括定量研判分析和定性研判分析两种
定量研判分析包括:
定性研判分析包括
典型的舆情分析方法
双层分析法:传播层分析(对传播者分析);动因层分析
语义统计分析方法:现在基于语义分析的研究成果基本上是以词为研究单元,适当人工参与,有一定的主观性。
情感倾向分析方法:文本的情感倾向性分析关注的不是文本本身内容,而是能否主动分析出文本内容所表达的情感和态度。倾向性分类主要有基于语义词典的方法和基于机器学习的无监督方法
基于Web的文本挖掘技术的分析方法:该技术主要包括:关联规则挖掘,序列模式挖掘,聚类分析和自动分类技术:
8.3网络舆情分析系统
网络舆情分析系统通常具有一下功能:热点话题,敏感话题分析;倾向性分析;主题跟踪;趋势分析;突发事件分析;报警系统;统计报告。
大数据环境下舆情系统一般有网络舆情数据采集,数据预处理,数据聚类,舆情分析,结果呈现等模块组成
网络爬虫是相对成熟的一种自动采集网页信息的方式,适用于网络舆情监控与分析系统。
网络爬虫技术可以作为搜索引擎在互联网上下载所需网页,它只需要访问网页URL与分析Web页面。
话题是舆情的关注点,根据话题检测与跟踪评测会议对话题的定义,话题是一个核心事件或活动以及与之直接相关的事件或活动。
一般话题发现的研究方法可分为两类:寻找合适话题发现的聚类算法或者对已有的据类算法进行改造;挖掘新的话题特征来提高检测的效果
舆情分析的另一个任务是感知人们的官邸啊,态度倾向等主管信息。
情感倾向性分析可以分为两步:首先对文章中的词语进行倾向判断,提取情感词语并得出个情感词语的倾向权值;然后根据情感词语的倾向权值计算出句子或文章的语义倾向性
信息过滤技术是根据用户的设定在抓取网页内容中过滤不掉的部分,留下有用信息并将其保存到指定的位置。
Web信息挖掘主要由四个步骤构成
数据存储是整个舆情监控与分析系统中所有数据和功能的基础
数据存储功能主要体现在设计并创建良好数据库表
系统数据库表中一般分为5个数据表:站点信息表;文档信息表;话题信息表;话题发现结果表;情感分析结果表
8.4网络舆情监测系统
网络舆情监控要做到:
网络舆情监测系统可分为以下几个模块:
网络舆情监测系统的作用: