Введение в язык HTML
Автономные Web-документы используют язык HTML (HypertextMarkup
Language - язык разметки гипертекста). Гипертекст, то есть расширенный текст,
включает дополнительные элементы: иллюстрации, ссылки, вставные объекты.
Под разметкой понимается использование специальных кодов, легко отделяе-
мых от смыслового содержания документа и используемых для реализации ги-
пертекста. Применение этих кодов подчиняется строгим правилам, определяе-
мым спецификацией языка HTML.
HTML -документ - это файл, содержащий обыкновенный текст со специ-
альными командами. Такой файл может быть подготовлен в произвольном тек-
стовом редакторе (существуют, однако, специальные программы-конверторы и
HTML-редакторы).
HTML -документ состоит из содержимого, то есть собственно полезной
информации, и команд, задающих структуру.
Каждая команда (управляющая конструкция) HTML -документа (тег)
должна заключаться в угловые скобки - вот так: <тег>. Чаще всего в документе
встречаются парные теги (открывающий и соответствующий ему закрываю-
щий), так как браузеру необходимо знать область действия тега. Существуют и
одиночные теги, однако, используются они только там, где область действия
очевидна и дополнительной информации не требуется (ясно, например, что ес-
ли мы встретили тег "начало абзаца" (<Р>), то предыдущий абзац уже закон-
чился). В сомнительном же случае лучше перестраховаться и поставить закры-
вающий парный тег, иначе документ может оказаться нечитаемым. Открываю-
щий и закрывающий теги называются одинаково и отличаются друг от друга
только символом "наклонная черта" или "слэш" - "/", который ставится сразу
после открывающей угловой скобки закрывающего тега. Закрытие парных те-
гов выполняется так, чтобы соблюдались правила вложения.
<В><I>На этот текст воздействуют два тега</I></B>
Кроме того, тег может включать атрибут, дающий дополнительную ин-
формацию браузеру. Например, при помощи атрибута можно попросить брау-
зер изменить величину шрифта, ориентацию изображения по отношению к
строке следующего за ним текста, поменять цвет фона документа и т. д. В пар-
ных тегах атрибуты добавляются только к открывающему тегу. Атрибуты
представляют собой дополнительные ключевые слова, отделяемые от ключево-
го слова, определяющего тег, и от других атрибутов пробелами и размещаемые
до завершающего тег символа ">". Способ применения некоторых атрибутов
требует указания значения атрибута. Значение атрибута отделяется от ключево-
го слова атрибута символом "=" (знак равенства) и заключается в кавычки.
<Н1 ALIGN="LEFT">
Язык HTML в большинстве случаев совершено равнодушен к регистру, в
котором набираются теги. Скажем, браузеру совершенно все равно, наберете вы
тег, служащий для рисования горизонтальной линии, как <HR> или <hr> - эф-
фект будет один и тот же.
HTML не признает никакого дополнительного форматирования текста,
кроме как с помощью тегов. В результате текст, превосходно смотрящийся в
текстовом редакторе, в окне браузера сольется в единую нечитаемую массу.
Так, на месте нескольких пробелов будет лишь один пробел. Исчезнут все заго-
ловки, пустые строки, деление текста на абзацы. Без HTML -тегов браузер про-
сто игнорирует все элементы форматирования.
Определение HTML как языка разметки основывается на том, что при
удалении из документа всех тегов получается текстовый документ, совершенно
эквивалентный по содержанию исходному гипертекстовому документу. Таким
образом, при отображении документа HTML сами теги не отображаются, но
влияют на способ отображения остальной части документа.
<HTML>
<HEAD>
Структура HTML-документа
<TITLE> Моя домашняя страница </TITLE>
</HEAD>
<BODY>
</BODY>
</HTML>
Первый тег, который вы здесь видите, <HTML>, сообщает броузеру о
том, что он имеет дело именно с документом в формате HTML. Тег <HTML> и
парный ему закрывающий тег </HTML> можно считать как бы "конвертом", в
который помещается весь документ. Любой HTML -документ состоит из заго-
ловка, который задается при помощи тега <TITLE>, и тела документа, кото-
рый определяется тегом <BODY>. В заголовке документа размещается слу-
жебная информация, комментарии автора и заголовок страницы, заключаемый
в теги <TITLE>. Заголовок, вписанный между тегами <TITLE>, в основное
текстовое поле браузеру не попадает, а, как правило, размещается в заголовке
окна браузера. HTML-документ - это просто текстовый файл с расширением
*.htm (Unix-системы могут содержать файлы с расширением *.html). Боль-
шинство элементов языка HTML описывает части содержания документа и по-
мещается между тегами <BODY> и </BODY>, то есть, внутрь структурного
элемента BODY. Такие элементы делят на блочные и текстовые. Блочные эле-
менты относятся к частям текста уровня абзаца. Текстовые элементы описыва-
ют свойства отдельных фраз и еще более мелких частей текста. Теперь можно
сформулировать правила вложения элементов.
Элементы не должны пересекаться. Другими словами, если открываю-
щий тег располагается внутри элемента, то и соответствующий закрывающий
тег должен располагаться внутри этого же элемента.
Блочные элементы могут содержать вложенные блочные и текстовые
элементы.
Текстовые элементы могут содержать вложенные текстовые элементы.
Текстовые элементы не могут содержать вложенные блочные элементы.
Строго говоря, все правила языка HTML можно рассматривать исключи-
тельно как "пожелания". Средство, используемое для отображения Web-
документа, сделает все возможное, чтобы истолковать разметку наиболее ра-
зумным образом. Тем не менее, гарантию правильного воспроизведения доку-
мента дает только неукоснительное следование требованиям спецификации
языка.