学习记录内容内容之动态网页动态更新的应用与应用

花享团 次浏览

摘要:伪静态技术是指展示出来的是以html一类的静态页面形式,但其实是用ASP一类的动态脚本来处理的。备注:伪静态只是改变了URL的表现形式,实际上还是动态页面为什么伪静态网页容易被收录

以下为学习记录内容

目录

1. 定义 1.1 动态网页

动态网页是所有动态生成和动态更新的网页的统称。 与传统的静态网页相反,它会因变量的变化而生成不同的网页。 这可以是服务器生成的网页、客户端生成的网页或两者的混合。

服务器端动态网页是指服务器通过应用服务器处理服务器端脚本生成的网页。 服务器传递给脚本的参数决定了每个网页的生成方式,有时还包括如何生成进一步的客户端脚本。 常见的实现方法包括PHP、Active Server Pages (Asp) 和通用网关接口(CGI)。 服务器端脚本执行后,生成的网页是标准的HTML页面,所有服务器端脚本都不会传递给客户端。

当浏览器加载网页时,就会处理客户端的动态网页。 和其他脚本语言决定如何将接收到的 HTML 嵌入到文档对象模型 (DOM) 中。 这些脚本语言还可以动态更新或改变原始文档对象模型。

总结:动态网页是随着操作而变化的网页,由脚本生成,可能是服务器端和用户端的混合体。

1.2 伪静态网页

伪静态是相对于真静态而言的。 通常,为了增强搜索引擎的友好性,我们都会将文章内容生成静态页面,但有些朋友希望实时显示一些信息。 或者你想使用动态脚本来解决一些问题。 网站内容不能以静态方式展示。 但这就失去了对搜索引擎的友好性。 如何找到两者之间的中间方法,这就催生了伪静态技术。 伪静态技术是指显示的页面是HTML等静态页面的形式,但实际上是使用ASP等动态脚本进行处理的。

总结:使用动态脚本处理静态页面后生成的页面。

注意:伪静态只是改变了URL的表达方式,但实际上是一个动态页面。

1.3 静态网页

静态页面,即静态网页,是真实存在的,不经过服务器编译,直接加载到客户端浏览器中显示。 静态页面需要一定的服务器空间,并且无法独立管理和发布更新的页面。 如果要更新网页内容,必须通过FTP软件下载文件,并用网页制作软件进行修改(通过fso等技术的除外)。 常见静态页面示例:.html 扩展名、.htm 扩展名。

总结:我们在下载的时候,经常会看到以html结尾的静态网页。 她们从出生起就没有整容过,一直都是这个样子。

2.各种网页的优缺点和特点 2.1 动态网页

优点:维护方便、数据查询方便、存储资源占用小

百度收录的网页数量_百度收录网址显示网站名称_如何在网站上显示百度收录数

缺点:不利于搜索引擎收录、制作成本高、需要人员维护

不利于包含:通常动态脚本需要某些信息来返回页面内容,最常见的是Cookie数据、SessionID或环境变量。 但对于搜索引擎蜘蛛程序来说,它们不可能知道如何使用你的搜索功能或者要问什么问题。 正因为如此,Spider对网站的搜索常常不得不在动态网站之前停下来。 此外,动态页面 URL 包含问号 (?) 和百分号 (%)。 还有动态页面 URL 中常见的 &、%、+ 和 $ 等符号。 此类 URL 称为“环境变量”(查询字符串)。 然而,大多数 SPIDER 无法解释符号“?”后面的字符。 显然,由于该 URL 实际上并不存在,因此他们什么也得不到。 因此,如果您的整个网站或您网站上的大部分网页都是动态生成的,您需要对您的网站进行一定的修改,以便于SPIDER轻松读取您网站上的内容。 还有一些搜索引擎在检索页面时,经常拒绝检索cgi-bin目录下的静态页面(即保存为静态页面的动态页面)的URL。

特点:将数据库存储的内容以动态的形式展示在客户面前,并将客户数据存储在数据库中以备将来使用。 因此,网站后台运行的数据库中存储的信息更新相对较快。

2.2 伪静态网页

优点:容易包含

缺点:占用大量CPU

特点:静态页面的地址是真实的,不包含在路径中吗? &%等变量符号对搜索引擎更加友好,更容易获得信任。 为了追求动态页面和静态页面的优点,同时避免缺点,就产生了“伪静态”,在动态页面的基础上进行URL重写。 技术在URL地址中插入传输参数来迷惑蜘蛛。

2.3 静态网页

优点:速度快,可以跨平台、跨服务器,可以将数据库和后端系统与前端分离,从而提高网站的安全性。

缺点:资源消耗高、交互性差、内容更新维护复杂

由于静态页面存储在服务器中,占用空间和内存,可以想象一下,如果一个论坛有10万个帖子,每个帖子大小100K,如果全部作为静态页面存在服务器中,则占用10G大小,不包括存储和计算成本。 浪费空间,所以消耗了大量的空间资源。

特点:每个静态网页都有一个固定的URL如何在网站上显示百度收录数,网页URL后缀为.htm、.html、.shtml等常见形式,不带“?”

3.文件格式

网页获取页面格式:

四、工作原理

静态网页的工作流程可以分为以下4个步骤:

百度收录网址显示网站名称_如何在网站上显示百度收录数_百度收录的网页数量

① 编写静态文件并发布到Web服务器上;

② 用户在浏览器地址栏中输入静态网页的URL并按回车键,浏览器向Web服务器发送访问请求;

③ Web服务器找到该静态文件的位置并将其转换为HTML并流式传输到用户的浏览器;

④ 浏览器收到HTML流后,显示该网页的内容。

动态网页的工作流程分为以下4个步骤:

①编写动态网页文件,包括程序代码,并发布到Web服务器上;

② 用户在浏览器地址栏中输入动态网页的URL并按回车键,浏览器向Web服务器发送访问请求;

③ 网络服务器找到这个动态网页的位置,并根据程序代码动态创建HTML并传输到用户的浏览器;

④ 浏览器收到HTML流后,显示该网页的内容。

5、相关问题解答 5.1 为什么搜索引擎不读后面的内容

搜索引擎的SPIDER不愿意读取放置在cgi-bin目录下的网页,或者包含“?”的URL。 特点。 原因是,如果CGI中提供了“无限”个URL,那么SPIDER往往会牢牢地陷入对这些“无限”网页的搜索之中如何在网站上显示百度收录数,陷入无限循环。 这些被称为蜘蛛陷阱。 数据库程序可以用 SPIDER 创建类似的情况。 因此,为了避免可能的陷阱,Spider不会读取“?”后面的字符。 在带有符号“?”的 URL 中。 如果蜘蛛被您的服务器困住,不仅对蜘蛛本身不利,蜘蛛对您网站页面的重复请求也会导致您的服务器系统完全瘫痪。

5.2 伪静态网页为何容易被索引

在文章列表中,将/blog/articleInfo.do?userName=zy&&blogId=1&&articleId=1等文章的链接转换成blog/a/0101002526B90C548A833416.html等URL,以便蜘蛛爬进去读取相应的内容,因为文章列表中的每篇文章都是不同的静态URL。

5.3 mod_rewrite的意义

爬虫不喜欢爬取带有问号的动态网页。 无论参数如何添加,返回的内容都不会改变。 例如,它将指向我的页面的第一页。 于是就有了mod_rewrite,它可以重新映射地址。 Web服务器收到对页面地址的请求后,对其进行重新映射,然后执行PHP程序。 (以上URL都是假设。)这样,在不改变内部URL的情况下,呈现给外部的URL就变得和没有问号的静态网页的URL一样了。

5.4 爬虫为什么要抓取伪动态网页?

百度收录网址显示网站名称_如何在网站上显示百度收录数_百度收录的网页数量

搜索引擎不会收录带有问号的网址,因为搜索引擎害怕因为问号而进入死循环(以前东网就有这样的漏洞,蜘蛛进不去),所以很多时候,带问号的地址将不包括在内。 对于搜索引擎来说,伪静态实际上是静态的,因为地址中没有问号。

静态页面的地址是真实的吗? 是不是没有包含在路径中? &%等变量符号对搜索引擎更加友好,更容易获得信任。 为了追求动态页面和静态页面的优点,同时避免缺点,就产生了“伪静态”,在动态页面的基础上进行URL重写。 技术在URL地址中插入传输参数来迷惑蜘蛛。

6.相关知识 6.1 AJAX

AJAX 的全称是“Asynchronous JavaScript and XML”(异步和XML技术),是指一组结合了多种技术的浏览器端网页开发技术。

原因:

传统的 Web 应用程序允许用户填写表单,提交表单后,会将请求发送到 Web 服务器。 服务器接收并处理传入的表单,然后发回一个新的网页,但这会浪费大量带宽,因为两个页面中的大部分 HTML 代码往往是相同的。 由于每次应用程序通信都需要向服务器发送请求,因此应用程序的响应时间取决于服务器的响应时间。 这会导致 UI 的响应速度比本机应用程序慢得多。

出现效果:

与此不同的是,AJAX 应用程序只能向服务器发送和检索必要的数据,并在客户端使用 JavaScript 来处理来自服务器的响应。 由于服务器和浏览器之间交换的数据较少,因此服务器响应速度更快。 同时,很多处理工作可以在发出请求的客户端机器上完成,因此Web服务器的负载也减轻了。

有一个问题:

使用 Ajax 的主要批评是它会破坏浏览器的后退和书签功能。 在动态更新页面的情况下,用户无法返回到之前的页面状态,因为浏览器只能记住历史中的静态页面。

总结:AJAX可以实现对网页的部分更新,并保留不需要更新的部分,从而使Web应用程序能够更快地响应用户操作。

参考:

维基百科、百度百科

网站静态化——伪静态&SEO

静态网页和动态网页有什么区别?

关于伪静电的特点和优点

随机内容