大航海时代2隐藏武器:什么是HTML文档格式?

来源:百度文库 编辑:神马品牌网 时间:2024/04/28 14:45:30

HTML,这四个垄断了整个互联网的字母,它的字面意思是,超文本标记语言(Hyper Text Markup Language)。但实际上,与其说它是一种语言,还不如说它是一种文档格式来得更准确,就和如同.doc代表一种文档格式一样。

HTML和Word文档格式(.doc)的区别,除了他们的用途不同(前者用于Web网页,后者用于桌面文字处理)之外,还有一个形式上的区别,HTML是纯文本的,用文本来标记一切,可以用任何文本编辑器来编辑,而.doc是二进制文件,必须用特定的编辑器才能阅读和编辑。

HTML采用纯文本的方式,大概由自身的特定历史原因,一来是为了跨平台的需要,记得n年前我第一次看到HTML这几个字母的时候,跟在他后面的介绍性文字就特别强调了跨平台这点。二来最开始的Web网页,也基本上只有文字,很少有图片,更没有语音和视频。

纯文本的HTML带来不少方便,例如可以随手编辑修改,不需要任何工具软件。但同时,也带来很多麻烦,例如在网页中加入图片的时候,我们得把图片单独保存,还得给图片取个名字,然后在HTML中引用。给一个图片取个名字不难,给一大堆图片取名字就麻烦了,所以我们看到很多图片的名称都是字母、下划线、数字等好长一串。很显然,这不如Word方便,在Word中只需要插入或者粘贴一张图片就行了,既不需要关心这张图片如何存储,也不需要关心它叫什么名字。

更重要的是,在Word中,如果你把这张图片删除,他就实实在在的消失了。而HTML,可能你在网页上已经看不到图片,但实际上这张图片仍然保存在某个文件夹中。事实上,全世界的网络服务器上有数不胜数的没有被任何网页使用的图片以及其他多媒体文件,原因只有一个,网页编写人员在网页上删除某个图片时,并没有找到相应的文件夹把图片真正删除。这是非常常见的情况,因为文档管理实际上是非常繁琐和复杂的事情,很难有几个人能够进行真正有效的管理,这就造成网络服务器上有大量的冗余文档。

另一个问题是,纯文本作为一种文档格式,显然不如二进制格式那样灵活,能表达各种复杂的格式。所以到目前为止,我们还没有看到任何一款HTML编辑器能够像Word那样方便,不管是久负盛名的Dreamweaver还是微软的Frontpage,也包括Word本身,因为它也可以编辑HTML文档。因此,任何优秀的网页设计人员都在会使用Dreamweaver的同时还熟记众多的HTML标签,与之相对应,即使能做出完美的Word文档的人,也根本不需要记忆任何类似的格式符号。这导致网页设计工作的技术化和高培训成本,让人很多人对网页设计望而生畏。

HTML纯文本格式的优点,我们还能在动态网页开发技术中感受到,如果你使用过ASP、PHP、JSP这样的动态网页开发语言,就一定有很深的感受。这些语言都采用和纯文本的HTML混合在一起的方式,在HTML的基础上,增加一些特殊的代码就可以方便地开发出动态网页来。从这个意义上说,HTML被称之为语言,总算是还有点名副其实。

但是,也正是这个原因,导致网页的界面和算法混淆在一起,这完全不符合软件开发的基本要求之一结构化的要求,并导致网站的维护成本大幅升高。每次我打开一个ASP脚本时就感觉特别头痛,一行接一行的密密麻麻的代码让人无所适从,我们很难在其中看到类似函数这样的结构化的代码。

HTML最让人头痛的还有Table的嵌套,如果要让网页漂亮,几乎必须要这样做,这经常让我看得头昏眼花,当然,在我慢慢熟悉Dreamweaver后,这个现象得到了改善,因为我不需要去看这些代码了。既然如此,干吗不干脆让我们看不到代码呢?就像Word那样。这时候我忍不住会想,能否有一个二进制的文档格式取代HTML呢?这好像有点逆历史潮流而动,因为我们看到,另一个纯文本的文档格式XML,目前正越来越火,完全有超级女声的派头。

哎呀,就是用html语言描述的网页啦!又叫纯文本网页。诺,看看百度的网址,大部分是HTML结尾的,表示这个文件是HTML语言编写的。

HTML,这四个垄断了整个互联网的字母,它的字面意思是,超文本标记语言(Hyper Text Markup Language)。但实际上,与其说它是一种语言,还不如说它是一种文档格式来得更准确,就和如同.doc代表一种文档格式一样。

HTML和Word文档格式(.doc)的区别,除了他们的用途不同(前者用于Web网页,后者用于桌面文字处理)之外,还有一个形式上的区别,HTML是纯文本的,用文本来标记一切,可以用任何文本编辑器来编辑,而.doc是二进制文件,必须用特定的编辑器才能阅读和编辑。

HTML采用纯文本的方式,大概由自身的特定历史原因,一来是为了跨平台的需要,记得n年前我第一次看到HTML这几个字母的时候,跟在他后面的介绍性文字就特别强调了跨平台这点。二来最开始的Web网页,也基本上只有文字,很少有图片,更没有语音和视频。

纯文本的HTML带来不少方便,例如可以随手编辑修改,不需要任何工具软件。但同时,也带来很多麻烦,例如在网页中加入图片的时候,我们得把图片单独保存,还得给图片取个名字,然后在HTML中引用。给一个图片取个名字不难,给一大堆图片取名字就麻烦了,所以我们看到很多图片的名称都是字母、下划线、数字等好长一串。很显然,这不如Word方便,在Word中只需要插入或者粘贴一张图片就行了,既不需要关心这张图片如何存储,也不需要关心它叫什么名字。

更重要的是,在Word中,如果你把这张图片删除,他就实实在在的消失了。而HTML,可能你在网页上已经看不到图片,但实际上这张图片仍然保存在某个文件夹中。事实上,全世界的网络服务器上有数不胜数的没有被任何网页使用的图片以及其他多媒体文件,原因只有一个,网页编写人员在网页上删除某个图片时,并没有找到相应的文件夹把图片真正删除。这是非常常见的情况,因为文档管理实际上是非常繁琐和复杂的事情,很难有几个人能够进行真正有效的管理,这就造成网络服务器上有大量的冗余文档。

另一个问题是,纯文本作为一种文档格式,显然不如二进制格式那样灵活,能表达各种复杂的格式。所以到目前为止,我们还没有看到任何一款HTML编辑器能够像Word那样方便,不管是久负盛名的Dreamweaver还是微软的Frontpage,也包括Word本身,因为它也可以编辑HTML文档。因此,任何优秀的网页设计人员都在会使用Dreamweaver的同时还熟记众多的HTML标签,与之相对应,即使能做出完美的Word文档的人,也根本不需要记忆任何类似的格式符号。这导致网页设计工作的技术化和高培训成本,让人很多人对网页设计望而生畏。

HTML纯文本格式的优点,我们还能在动态网页开发技术中感受到,如果你使用过ASP、PHP、JSP这样的动态网页开发语言,就一定有很深的感受。这些语言都采用和纯文本的HTML混合在一起的方式,在HTML的基础上,增加一些特殊的代码就可以方便地开发出动态网页来。从这个意义上说,HTML被称之为语言,总算是还有点名副其实。

但是,也正是这个原因,导致网页的界面和算法混淆在一起,这完全不符合软件开发的基本要求之一结构化的要求,并导致网站的维护成本大幅升高。每次我打开一个ASP脚本时就感觉特别头痛,一行接一行的密密麻麻的代码让人无所适从,我们很难在其中看到类似函数这样的结构化的代码。

HTML最让人头痛的还有Table的嵌套,如果要让网页漂亮,几乎必须要这样做,这经常让我看得头昏眼花,当然,在我慢慢熟悉Dreamweaver后,这个现象得到了改善,因为我不需要去看这些代码了。既然如此,干吗不干脆让我们看不到代码呢?就像Word那样。这时候我忍不住会想,能否有一个二进制的文档格式取代HTML呢?这好像有点逆历史潮流而动,因为我们看到,另一个纯文本的文档格式XML,目前正越来越火,完全有超级女声的派头。

你打开记事本 再点文件里面有个另从 你把文件名打好后缀是 .HTM 或 .HTML 找见那个文件 就是传说中的HTML格式文件咯

<html>
<head></head>
<body></body>
</html>