Гипертекст и гипермедиа
История WWW
Публикация в WWW
Web-браузер
URL
HTTP-сервер
Безопасность и контроль доступа
HTML, SGML, CGI
Эволюция HTML
Консорциум WWW
Форматы переносимых документов
Подходы к созданию документов
Java, VRML
Редакторы и конверторы
Гипертекст и гипермедиа.
Гипертекст представляет собой тот же
текст, что и, например, текст MS Word 6.0-7.0, но
отличается тем, что некоторые его части (символы,
слова, фразы, рисунки) являются интерактивными
ссылками на другие документы. Теперь большой
документ можно разбить на отдельные темы и
связать их через ключевые фрагменты (символы,
слова, фразы или рисунки). Эти фрагменты,
выделенные в документе особым образом для их
идентификации, служат для перехода на связанные
с ними по смыслу другие темы, или содержат в себе
вызов других приложений. Таким образом, можно
сказать, что гипертекст представляет собой
содержание, внедрённое непосредственно в
документ. Упрощая чтение, делая информацию
нагляднее и понятнее, гипертекст создаёт
комфортную работу с документом, выполняя многие
действия, которые пользователю приходилось
делать до этого, автоматически.
Термин гипертекст был введён Тедом
Нельсоном (Ted Nelson) ещё в 60-х годах.
Гипермедиа - более широкое понятие,
которым обозначают документы, включающие в себя
мультимедиа-информацию, например, звук или видео.
В современный документ можно вставить
практически любой объект из любого приложения и
это делает его самого интерактивной средой.
Фактически можно прийти к тому, что скоро граница
между документом и приложением может стать очень
тонкой.
История World Wide Web.
Проект WWW был начат в 1989 году Тимом
Бернерс-Ли (Tim Berners-Lee) в лаборатории физики
высоких энергий CERN. Целью проекта являлась
разработка метода обмена исследовательскими
данными и идеями с учёными, разбросанными по
всему миру. В первоначальном варианте Web
называлась “гипертекстовым проектом”.
Понятие WWW относится к абстрактному
информационному киберпространству. Под словом
Internet обычно подразумевают физический уровень
сети, то есть аппаратное обеспечение, состоящее
из компьютеров и кабелей. Основой WWW и Internet
является использование протоколов, то есть
языка и правил, посредством которых компьютеры
“общаются” между собой. Например, TCP/IP (Transmission
Control Protocol/ Internet Protocol), представляет собой набор
сетевых протоколов, которые позволяют
компьютерам различной архитектуры соединяться
друг с другом. Он является базовым протоколом
сети Internet. WWW - это больше, чем просто один из
протоколов. Подобно мозаике, Web объединяет
несколько протоколов, в том числе FTP (File Transfer
Protocol), telnet, WAIS (Wide-Area Information Servers) и другие.
Telnet, File Transfer Protocol, E-Mail, HyperText Transfer Protocol,
Gopher, Wide-Area Information Servers, USENET News - протоколы,
предназначенные для предоставления доступа к
информации и обмена ею. Поскольку WWW использует
стандартные протоколы Internet для передачи файлов и
документов, термин Web часто используется как
синоним понятия Internet и относится как к всемирной
сети компьютеров, так и собственно к информации.
Создание в ноябре 1992 г. Национальным
центром суперкомпьютеров (NCSA) первой программы
просмотра (браузера) Web под названием Mosaic
ознаменовало собой начало популярности WWW. В
начале 1993 года в мире насчитывалось всего лишь 130
узлов Web, а уже через полгода после появления Mosaic
их число возросло более чем до 10 000. Сеть Internet
последние годы росла экспоненциально,
приблизительно удваивая свои размеры ежегодно.
Публикации в WWW.
Web - публикации работают по технологии
клиент-сервер. Web - сервер - это программа,
запущенная на компьютере, предназначенном для
предоставления документов другим машинам,
которые посылают соответствующие запросы. Web -
клиент - это программа, которая позволяет
пользователю запрашивать документы с сервера.
Поскольку сервер задействуется только тогда,
когда запрашивается документ, такая технология
является весьма эффективной, поскольку требует
незначительных ресурсов сервера.
Чтобы опубликовать документы в Web, Вы
должны расположить их на постоянно доступном
сервере. При этом постоянное подключение к Internet
стоит дорого, а скорости модема явно
недостаточно для поддержания трафика. Однако для
публикаций в Internet совсем необязательно иметь
свой собственный Web - сервер с постоянным
подключением к сети. Многие провайдеры Internet
включают возможность публикации Web - документов в
основной набор своих услуг или предлагает это за
небольшую дополнительную плату. Стоимость таких
публикаций зависит от поставщика и, конечно же,
от того, что именно Вы хотите опубликовать. Сумма
может варьироваться от нескольких десятков
долларов в месяц за простую домашнюю страницу до
нескольких тысяч - за интерактивный
“виртуальный магазин”.
Web - браузер.
Запуская программу “Web
- клиент” (обычно она называется Web
- браузером или программой
просмотра Web), пользователь может устанавливать
соединение с другими компьютерами сети и
посылать работающим на них Web - серверами
запросы на Web - документы. Для
установления соединения используется сетевой
адрес компьютера, который называется
универсальным указателем ресурса - URL (Uniform Resource
Locator). Сервер в ответ на запрос посылает
клиентскому компьютеру текст и другую
информацию (звук, изображения), на которую в
документе установлены гиперссылки. Сервер
передаёт документы в формате HTML (HyperText Markup Language -
язык разметки гипертекста). Документы на языке
HTML, также называемые Web - документами, позволяют
пользователю, указав на выделенное слово или
фразу, получить доступ к файлу или перейти в
другой HTML - документ, который связан с указанным
участком текста гиперссылкой. Такие
гипертекстовые связи между файлами и
документами, физически расположенными на
серверах по всему миру, позволяют системе
работать так, будто она представляет собой
огромную паутину информации.
На сегодняшний день наиболее известными
браузерами являются MS Internet Explorer и Netscape Communicator.
Браузеры настолько разрослись в своих
возможностях, что влияют на остальные программы
(например, MS Windows 98 по интерфейсу повторяет MS Internet
Explorer). Браузеры стали работать с большим
количеством форматов гипертекстовых файлов.
URL.
В Web - браузере можно ввести специальную
строку - URL (Uniform Resource Locator - универсальный
указатель ресурса) и соединиться с документом
или ресурсом. Когда Вы указываете на
гипертекстовую ссылку в Web - документе, на самом
деле производится запрос на открытие URL. Почти
любой файл или услугу Internet можно представить в
виде URL. Web - браузер может действовать также в
качестве клиента FTP, Gopher или telnet. Существует
возможность устанавливать гиперссылки не только
на другие Web - документы, но и на различные сетевые
услуги. Используя разные типы URL, пользователь
может получить доступ к различным ресурсам.
Примеры
URL для доступа к различным ресурсам Internet |
Ресурс |
URL |
HTTP |
http://akebono.stanford.edu/ |
FTP |
ftp://oak.oakland.edu/pub3/win3/ |
Gopher |
gopher://gopher.micro.umn.edu:70/1 |
telnet |
telnet://rs.internic.net |
Телеконференции USENET |
news://comp/infosystems.www.announce |
HTTP - сервер.
Язык, на котором общаются между собой
клиенты и серверы Web, называется HTTP (HyperText Transmission
Protocol - протокол передачи гипертекста). Все Web -
программы должны поддерживать HTTP для передачи и
приёма документов гипермедиа. Успех WWW отчасти
обусловлен именно тем, что через HTTP можно
оперировать многими протоколами. Это
обеспечивает пользователю прозрачный доступ к
другим службам Internet, например, сервером
анонимного FTP, Gopher, или WAIS. Протокол HTTP также
предоставляет возможность работы с мультимедиа,
позволяя запрашивать и отображать, текст,
графику, анимацию, воспроизводить звук.
Поскольку HTTP лежит в основе всех Web - транзакций,
Web - серверы часто называют HTTP - серверами.
Несмотря на то, что серверы WWW работают
преимущественно в ОС UNIX, соответствующие
программные продукты доступны для множества
платформ и операционных сред.
Выбор ОС и Web - браузера для публикации
документов в Internet в значительной мере зависит от
предполагаемой аудитории читателей. Если вы
хотите сделать свои публикации доступными для
всех пользователей Internet, следует
ориентироваться на многозадачную ОС типа Windows NT
или одной из версий UNIX (например, BSD UNIX или Linux)
Безопасность и контроль доступа.
Современные Web - серверы содержат
средства шифрования информации и контроля
доступа, что позволяет пользователю отправлять и
получать защищённые данные.
Появление таких Web - серверов,
несомненно, приводит к увеличению числа
коммерческих инициатив, реализуемых в Internet.
Многие компании уже организовали платные узлы WWW.
HTML, SGML и CGI.
Стандартный язык, используемый в WWW для
создания и публикации, называется HTML (HyperText Markup
Language - язык разметки гипертекста). До появления
программы Mosaic сеть Internet представляла собой
конгломерат компьютеров, работающих в различных
ОС, что делало обмен документами весьма
непростой задачей. Поиски решения этой проблемы
привели к созданию языка SGML (Standard Generalized Markup
Language - стандартный обобщённый язык разметки
документов). SGML предназначен для описания
элементов документа, не навязывая получателю его
оформление.
При чтении SGML - документов можно
изменять размеры окна просмотра, чтобы
оптимально использовать рабочее пространство
экрана, а при печати документ сохраняет свою
компоновку. Язык HTML был разработан на основе SGML
как простой формат для обмена гипертекстом, не
ограниченный возможностями конкретных платформ.
Подобно SGML, он обеспечивает простоту создания
документов и преобразования форматов.
Термин программирование на HTML
используется везде и всюду, что не совсем
правильно. HTML - это не язык программирования.
HTML был создан сравнительно недавно и сам
по себе лёгок для изучения. Web - документы
создаются на языке HTML и обычно сохраняются в
файлах с расширениями “.HTML” или “.HTM”. Они
представляют собой обычные текстовые ASCII - файлы
с командами форматирования. Содержащие
информацию о компоновке документа: стилях
текста, заголовках, абзацах, списках и
гиперссылках.
Единый шлюзовой интерфейс CGI (Common Gateway
Interface). Именно с его помощью обрабатываются
данные, введённые пользователем в интерактивные
Web - формы. Он также служит основой для создания
“графических карт”, т.е. размеченных
изображений с “горячими точками”, которые
выполняют ту же роль, что и гиперссылки в тексте.
Подробнее это будет рассмотрено далее.
Эволюция HTML
Существует несколько версий языка HTML.
Версия 1.0 содержала в основном
спецификации по созданию гиперссылок. На смену
ей пришла версия 2.0, утверждённая в 1994 г.
Международной комиссией по стандартам в Intenet (IETF
- Internet Engineering Task Force) в качестве стандарта. В этой
версии появились возможности работы со
встроенными изображениями и интерактивными
формами.
Дэйв Раггет (Dave Raggett) из организации W3C
предложил расширенный набор спецификаций HTML,
который стал известен как HTML+ (HTML 3.0).
HTML 3.0 поддерживает создание таблиц и URL в
виде адресов электронной почты, так что
гиперссылка может служить для автоматической
отправки сообщений. Третья версия также
поддерживает создание списков с произвольной
степенью вложенности, а элементы списков могут
включать горизонтальные разделители. Добавлены
новые тэги для запуска программ поиска
информации в Web. Другое нововведение -
возможность определять текст или графику как
объекты. Это позволяет перетаскивать мышью текст
или рисунки из браузера в другие приложения.
Но стандарт HTML 3.0 так и не был принят, т.к.
разработан он был без участия Netscape и Microsoft.
Тогда W3C в мае 1996 года разработал и в
январе 1997 года принял стандарт HTML 3.2 со
стандартизованным синтаксисом, в который уже
были включены многие дополнительные
дескрипторы, введённые фирмами Netscape и Microsoft.
Хотя HTML 3.2 и является относительно новым
стандартом, некоторые его ограничения уже стали
раздражать разработчиков, стремящихся к
расширению возможностей (многим из них нравились
новые нестандартные команды, даже если при их
использовании приходится преодолевать различия
между браузерами).
Требования разработчиков заставили
фирмы - изготовители браузеров принять новый
стандарт досрочно. Рабочий вариант стандарта HTML
4.0 был принят только 8 июня 1997 года, но
фирмы-изготовители уже стараются приспособиться
к новым спецификациям.
Более подробную информацию можно найти
по адресу http://www.w3.org/TR/
Консорциум WWW.
Консорциум World Wide Web (Consortium WWW) - это
некоммерческая организация, основанная в
октябре 1994 г. с целью разработки и реализации
стандартов HTML и WWW. В неё входят более 165
коммерческих и академических организаций, в том
числе такие гиганты, как Netscape и Microsoft. Этот
консорциум возглавляет создатель Web - Тим Бернерс
Ли. Проблема W3C заключается в том, что стороны
никак не могут прийти к единому мнению о том,
какими должны быть стандарты. Netscape и Microsoft, как и
другие фирмы, активно борются за принятие своих
вариантов стандарта. чтобы быть в курсе текущих
событий, посетите Web - страницу Консорциума W3C по
адресу http://www.w3.org/.
Форматы переносимых документов (гипертекстовые файлы).
Одной из наиболее актуальных проблем,
связанных с публикациями в Internet, является
создание стандартного формата документов,
который бы позволил пользователям просматривать
файлы на любом компьютере с любой ОС. Не все хотят
изучать информацию в онлайновом режиме, ведь
многие платят именно за время подключения.
Поэтому имеет смысл размещать большие документы,
такие как детальные отчёты или документация, в
отдельных файлах, которые могут быть пересланы
на локальный компьютер и затем прочитаны в
режиме “off-line”. До последнего времени
большинство документов хранилось в формате
PostScript, который, как и UNIX, был фактическим
стандартом Internet. Однако, с появлением других
форматов переносимых документов такое положение
дел начинает меняться.
Справедливости ради нужно отметить, что
каждая компания стремиться создать свой
собственный стандарт на переносимые документы.
Например, Adobe Acrobat - это набор средств для создания
и просмотра документов в формате PDF (Portable Document Format
- формат переносимых документов). В этом формате
может быть представлен практически любой
документ.
Подходы к созданию документов
Вы хотите, чтобы доступ к Вашим Web -
страницам мог получить любой пользователь при
любых условиях, или предпочтёте принести
общедоступность в жертву необычному внешнему
виду? Обе эти цели имеют свои основания и они
необязательно должны противоречить друг другу.
Ведь вполне можно сделать Web - страницу доступной
для всех пользователей, при этом отформатировав
их таким образом, чтобы они особенно
привлекательно выглядели в браузерах Netscape и
Microsoft.
Разрабатывая Web - страницы, Вы можете
столкнуться с тем, что в одном браузере некоторый
эффект будет смотреться превосходно, а в другом
его не будет вообще. Одни Web - мастера относятся к
этому философски и считают, что если у некоторых
пользователей нет программного обеспечения,
способного поддерживать все возможности их
страниц, то это их проблема. Другие Web - мастера
создают альтернативные версии страниц,
рассчитанные на пользователей самых
разнообразных браузеров.
Искусство создания хороших Web - страниц
заключается, прежде всего, в разумной
организации информации. В связи с этим Web -
мастеру необходимо хорошо разбираться в
издаваемом им материале, для того, чтобы лучше
разбить документ на темы и связать их наиболее
эффективными связями. К тому же может возникнуть
необходимость сделать какое-нибудь дополнение
типа терминологии предметной области, поиска и
т.д., что может потребовать написание программ на
Script-языке. Короче говоря, Web - мастер несёт
ответственность не только за эксплуатационную,
но и за информативную сторону документа.
Создание Web - документов требует
дизайнерской фантазии и представляет собой
отличный полигон для бурного творчества, поэтому
работа хорошего Web - мастера высоко ценится. От Web -
документа требуется чтобы он был одновременно и
красив, и удобен в пользовании, и максимально
понятен. Некоторые современные Web - документы
достойны называться произведениями искусства.
Чтобы стать профессиональным Web - мастером надо
быть одновременно и художником, и писателем, и
программистом.
Java, VRML.
Компания Sun Computer выпустила Web - браузер
под названием HotJava и создала интерпретируемый
язык программирования Java. При просмотре в HotJava Web -
страницы, содержащей новый HTML - тэг APP, браузер
загружает программный код, который называется апплет
(applet) и выполняет его. Код должен быть написан на
языке Java
Ещё одна область, к которой приковано
внимание специалистов - это VRML (Virtual Reality Markup
Language), язык разметки виртуальной реальности. VRML
поддерживает в среде WWW трёхмерные и
динамические объекты. Этот язык не является
расширением HTML. VRML позволяет описывать объекты,
содержащие различные типы информации:
изображения в формате JPEG, звуковые файлы,
видеоклипы и многое другое. VRML основан на
разработанном фирмой Silicon Graphics формате Open Inventor,
он представляет собой независимый от платформы
открытый формат для представления трёхмерной
графики в Internet. Например, можно создать страницу,
представляющую собой трёхмерную комнату, в
пределах которой можно перемещаться. Другие
примеры - полёт над виртуальными городами или
витрина с объёмными моделями товаров.
Редакторы и конвертеры.
Для написания Web - страницы подойдёт и
Notepad, однако вводить вручную скучные дескрипторы
в текстовом режиме вряд ли кому понравится. На
сегодняшний день имеется множество стандартных
редакторов.
Стандартные HTML - редакторы являются
самостоятельными приложениями. Существует две
их разновидности - текстовые и графические (типа
WYSIWYG - What You See Is What You Get, или “Что видите, то и
получите”). При работе с текстовыми
редакторами HTML - код выводится в виде обычного
текста, а HTML - дескрипторы выделяются, например,
другим цветом. Графические HTML - редакторы (типа
WYSIWYG) позволяют создавать макет страницы с
помощью мыши. При этом на экране Вы сразу же
будете видеть результат таким, каким увидят
создаваемую страницу посетители сервера. Как и
следовало ожидать, во многих HTML - редакторах
используются оба типа интерфейса, между которыми
можно легко переключаться.
|