World-Wide Web

NTT基礎研究所 高田敏弘 (takada@mdma.brl.ntt.co.jp)

"It's like the difference between the brain and the mind. Explore the Internet and you find cables and computers. Explore the Web and you find information." --- Tim Berners-Lee [NYT93]

目次


World-Wide Webとは?

World-Wide Web (通常 WWW, W3 あるいは Web などと略される) は 1989 年に CERN (European Laboratory for Particle Physics, Geneva, Switzerland) の Tim Berners-Lee により提案された広域情報システムであり, 以下のような経緯を経て, 今日極めて多くの注目を集めるようになった.

WWWの歴史

1989年3月
最初のプロジェクト・プロポーザルTim Berners-Lee により書かれる.
1990年11月
WWW の最初のプロトタイプが NeXT 上で作られる.
1991年3月
Line mode ブラウザの最初のリリース.
1991年10月
専用のメーリングリスト (www-interest と www-talk) が開設される.
1992年2月12日
Line mode ブラウザの存在が alt.hypertext, comp.infosystems, comp.mail.multi-media, comp.archives.admin などでアナウンスされる.
1993年1月
Midas, Viola, Mosaic などの X Window System 用のブラウザと, Macintosh 用のブラウザがリリースされる. この時サーバの数は50.
( The World Wide Web project <http://info.cern.ch/hypertext/WWW/History.html> より引用)


World-Wide Webの特徴

WWW は以下に挙げるような特徴を持つ. ([TBL92b]より引用)       ([TBL92b]より引用)       ([TBL92b]より引用)


WWWを理解する3つのキーワード

WWW を構成するのは以下の3つの概念である. 次節以降でこれらの概念について簡単に説明する.


HTML (HyperText Markup Language)

WWW は様々な情報を結び付ける手段としてハイパーテキストを用いる. このハイパーテキストを記述するための言語が HTML であり, 他の資源へのリンク情報と文書のフォーマットを表現する機能を持つ. HTML は SGML (Standard Generalized Markup Language) を基本としたタグ付き言語であり, SGML と HTML を表す DTD (Document Type Definition) によって定義される.

簡単な HTML 形式の文書の例を以下に示す.

	_____________________________________________

	<HEAD>
	<TITLE>HTML example page</TITLE>
	</HEAD>
	<BODY>
	<H1>Simple HTML example</H1>
	<A HREF="http://www.ntt.jp/index.html">
	<IMG SRC="/ntt/logo.gif"> このボタン
	</A>
	を押すと<B>NTT</B>のHomePageに行きます. 
	</BODY>
	_____________________________________________
上の HTML 形式の文書を表示した結果は以下のようになる.

    

HTMLに関するトピックス

HTML については, 現在, より豊富な機能を持った新しい規格である HTML+ を開発中である.


HTTP (HyperText Transfer Protocol)

HTTP は WWW のクライアントがサーバと通信する際に(主に)用いられるプロトコルであり, TCP/IP 上で実現されている.

HTTP プロトコルの中心部分は極めてシンプルであり, サーバはクライアントから来た,

	GET <要求するファイル名> [<使用するプロトコル名>]
という要求に対して, そのファイルの内容にヘッダを付加して送り返す. 例えば前節で例に示した HTML ファイルをクライアントが要求し, それが HTTP サーバから送り返される様子を以下に示す.
	[クライアントからサーバへの要求]
	GET /test.html HTTP/1.0 <CR>
	<CR>

	[サーバからクライアントへの返答]
	HTTP/1.0 200 OK^M
	Date: Tue Jan 18 16:19:48 1994 GMT^M
	Server: NCSA/1.0a^M
	MIME-version: 1.0^M
	Content-type: text/html^M
	^M
	<HEAD>^M
	<TITLE>HTML example page</TITLE>^M
	</HEAD>^M
	<BODY>^M
	<H1>Simple HTML example</H1>^M
	<A HREF="http://www.ntt.jp/index.html">^M
	<IMG SRC="/ntt/logo.gif"> このボタン^M
	</A>^M
	を押すと<B>NTT</B>のHomePageに行きます. ^M
	</BODY>^M
要求されたファイルが HTML 形式以外の場合でも同様に , ヘッダの後にそのデータが送り返される.

HTTPに関するトピックス

HTTP については, 少し前まではそのサブセットである "HTTP 0.9" と呼ばれるものが用いられていた. しかし現在ではほとんどのサーバが正式な HTTP プロトコル ("HTTP 1.0" と呼ばれる) を使用するようになった.


URL (Uniform Resource Locator)

WWW の構成する要素の中で最も重要な概念が URL である. URL は Internet 資源に対する統一的な名前付けの手法であり, その一般的な構文は,
	scheme://host.domain[:port]/path[#anchor][?keyword]
という形式をしている.

例えば前節で例に示した HTML 形式のファイルが www.ntt.jp というホストに test.html というファイル名で置かれており, それを HTTP プロトコルを用いて要求することが可能な場合は,

	http://www.ntt.jp/test.html
という URL で, その資源を特定することができる.

URL は scheme 部で様々なプロトコルを指定することができ, これにより WWW は, Internet 上の様々なサービスから得られる情報を統一的に取り扱うことが可能になる. 以下に利用可能なアクセスプロトコルと, それを用いた URL の例を示す.

HTTP
http://info.cern.ch/hypertext/WWW/TheProject.html
File/FTP
file://ftp.ntt.jp/sound/voice.au
Gopher
gopher://gopher.micro.umn.edu:70/1
WAIS
wais://quake.think.com/weather?surface
NetNews
news:comp.infosystems.www
Telnet
telnet://www@info.cern.ch
上の例からも分かるように, WWW とは単に WWW 内に閉じたシステムではなく, Gopher, WAIS, FTP, Archie, WHOIS, NetNews などの Internet 上の様々な情報システムを連続した形で内包する概念である. この最も重要な特徴を可能にしている一つのポイントが URL である.

URLに関するトピックス

URL 関連では, 現在 IETF の URI WG で, URI (Uniform Resource Idenifier), URN (Uniform Resource Name), URC (Uniform Resource Citation) などの, URL より更に高レベルな Internet 資源への名前付けの手法が検討されている.


WWWでどのような情報が得られるのか?

CERN で作成している The World-Wide Web Virtual Library: Subject Catalogue <http://info.cern.ch/hypertext/DataSources/bySubject/Overview.html> というリストには以下の項目が挙げられている.
Aeronautics, Agriculture, Archaeology, Astronomy and Astrophysics, Bio Sciences, Chemistry, Computing, Earth Science, Economics, Education, Electronic Journals, Engineering, Environment, Finance, Fortune-telling, Geography, History, Languages, Law, Libraries, Literature & Art, Mathematics, Meteorology, Movies, Music, Philosophy, Psychology, Physics, Politics and Economics, Recipes, Reference, Religion, Social Sciences
しかし実際どれだけの情報が今現在世界にあるかは, WWW が日に日に成長を続けている今日では, 誰も把握のしようがないであろう.

WWW の世界にどのようなものが存在するかを知りたければ, 上のリストを手掛かりにして, 実際に自分で WWW の世界を歩いてみるのが最も良いと思う.


WWWの爆発的成長

WWW は 1993 年の一年間で飛躍的な成長を遂げた. その成長の様子を, サーバの数と Internet 中を流れるデータの量の2つの側面から紹介する.

HTTPDサーバ数

以下の表は HTTPD サーバの数の様子を示したものである.
	                Number of
	Date         Server Sites
	_________________________
	
	Jun  5, 1993          130
	Sep  ?, 1993          204
	Oct 15, 1993          212
	Oct 25, 1993          228
	Nov 18, 1993          272
	Dec 13, 1993          623
( <http://www.mit.edu:8001/afs/sipb/user/mkgray/ht/web-growth.html> より引用)

HTTPプロトコルのパケット数

以下のグラフは NSFNET バックボーン・トラフィックの去年一年間のプロトコル別統計より, 全体のトラフィックに対する HTTP プロトコルが占める割合 (括弧内はその順位を表す) が増加していく様子を示したものである.

     


WWWのクライアント・ソフトウェア

WWW のクライアント・ソフトウェアを紹介する.

Terminal based browsers

CERN Line Mode Browser
Dumb terminal 上で動作するクライアント.
Lynx
UNIX の curses ライブラリを用いて動作する. 「日本語 curses」に類するものがあれば, 日本語の表示が可能.
Emacs W3-mode
GNU Emacs 用. Mule 上で使用すれば多国語の取扱いが可能.

X Window System

NCSA Mosaic for X
非常に強力で魅力的なプログラムであり, 現時点での WWW の代表的なクライアントとなっている. Motif を用いて書かれている.
tkWWW
Tcl/Tk で書かれている. 日本語 Tcl/Tk を用いれば日本語の表示が可能.
Chimera
Athena Widget のみを利用するクライアント.
MidasWWW
Motif を用いている. 中国語の表示も可能.
ViolaWWW

Macintosh

NCSA Mosaic for Macintosh
Mosaic の Macintosh 版. X 版の後を追いかけて開発される形になっているので, X 版よりはやや機能が劣る.
Samba

NeXTStep

Browser-Editor on the NeXT
NeXTStep 用のクライアント.

Microsoft Windows

NCSA Mosaic for Windows
Mosaic の MS-Windows 版. Mac 版と同様, X 版よりはやや機能が劣る.
Cello
以上に挙げた以外にも多数のクライアントが存在する. 現時点で最も広く使われているのは Mosaic である. Lynx, W3-mode なども利用者が多い.


HTTPサーバ・ソフトウェア

WWW (正確には HTTP) のサーバ・ソフトウェアを紹介する.
CERN server
CERN で書かれたオリジナルのサーバ
NCSA httpd
NCSA で書かれたサーバ. PDS に置かれている.
Plexus
Perl で書かれたサーバ. サーバ自身の拡張が容易である.
MacHTTP
Macintosh 上で動くサーバ.
GN
基本的には Gopher のサーバであるが, HTTP プロトコルも取り扱うことができる.


日本におけるWWWの状況

1994 年 1 月 20 日の時点で, 日本では以下の 14 の機関でサーバが立ち上がっている. この数は今年一年でかなり増えていくものと思われる.

 


NTTのWWWサーバについて

NTT でも有志が中心となって WWW サーバの立ち上げを行った. 1993 年の 9 月の末にサーバを開設し, 10 月 7 日に日本国内に対して, 12 月 2 日に全世界に対してアナウンスを行った.

現在では NTT のサーバに対して, 一日平均 3000 から 5000 件のアクセスがある. サーバの開設から現在までの, 一週間毎のアクセス件数の推移を以下のグラフに示す.

     

また, NTT のサーバへのアクセスあった国を, そのアクセス回数順に並べると以下のようになる. Internet に接続されている全 69ヶ国 (1994年1月1日現在) 中, 40ヶ国からのアクセスがあった.

Japan, United States, Germany, United Kingdom, Switzerland Canada, Netherlands, Sweden, Australia, France, Finland, Italy, Norway, Hong Kong, Denmark, Poland, Spain, Austria, Israel, Taiwan, Belgium, Korea (South), Slovenia, Hungary, Ireland, Chile, Singapore, Portugal, Turkey, New Zealand, Greece, Mexico, Iceland, Costa Rica, Brazil, Czechoslovakia, Soviet Union, Slovak Republic, Malaysia, Croatia

現在 NTT のサーバには, NTT に関する情報の他に, Japanese Information と銘打ったコーナーを設けている. これは, 今日までの海外からの情報の輸入超過傾向を鑑み, 「日本発の情報への入り口」という面の積極的なアピールを試みたものである.

この Japanese Information のコーナーには, 日本の文化や日本での生活の紹介, 音声を用いた簡単な日本語講座, WWW における日本語の取扱いに関する説明 などが置かれている. また, 新しい形態の情報提供サービスという観点から, 国際観光振興会 などと共同で WWW による 情報提供実験 を行っている.

また実際に NTT サーバ内に置かれた情報の他に, NTT 以外で提供している日本に関する情報や国内の他の WWW サーバなどへのリンクを維持している.

最後に参考までに, NTT のサーバ上にある各ページ毎のアクセス数上位 10 件を以下に示す.

                                      Number Of Percent Of
      Document Title                 Files Sent Files Sent
      ------------------------------ ---------- ----------
    1 NTT Home Page                       13533     5.96
    2 Japanese Information                 8439     3.72
    3 NTT Home Page (in Japanese)          2739     1.21
    3 Note on Japanese Documents           2739     1.21
    5 What's New                           1990     0.88
    6 TAKADA Toshihiro                     1756     0.77
    7 WWW Servers in Japan                 1652     0.73
    8 NTT INFORMATION                      1539     0.68
    9 YOUR TRAVELING COMPANION -JAPAN-     1422     0.63
   10 Japanese Information (in Japanese)   1408     0.62


WWWの日本語化あるいは国際化

日本語化されたクライアント

現在, LineMode ブラウザ, Lynx, tkWWW などのクライアントは日本語のテキストを表示することが可能である. また, Mosaic for Mac, Mosaic for Windows では Shift-JIS で書かれたデータの場合のみ, 日本語の表示が可能であることが確認されている.

国際化されたクライアント

Emacs W3-mode を Mule 上で動かすことにより, 多国語の表示が可能である. また, Mosaic for X には, 限定された形ではあるが, 日本語, 中国語, 韓国語, ロシア語, ヘブライ語などの各国語の表示を可能にするバージョンが存在する.

WWWの国際化

WWW 自体の国際化については, その文字コードの取扱いや, 同一内容の情報を複数の言語で提供する際のインタフェースなど, はっきりと決まっていない点がほとんどであり, 全てこれからの課題である.


WWWの将来と課題: 技術的観点から

WWW の技術的な面に関しては, などの問題が今後の課題として残されている.

しかし逆の言い方をすれば, WWW は今までの Internet と同様に, 誰かが作るものではなく我々が作るものである. WWW はまさしく今, その開発が進められている最中であり, 誰でも参加する機会が与えられている.

また研究的な観点から見ると,

といった問題は, 今後の社会と密接に関わってくる重要な研究課題であると考えられる.


WWWの将来と課題: 人間的観点から

このような状況下で, 広範囲に渡って情報がより容易にかつシームレスにやりとりされるようになっていく過程においては, 以下のような点が問題となるであろう.


謝辞

NTT の WWW のサーバの立ち上げなどを一緒に行ってきた, NTT 交換システム研究所の坂本仁明, 佐藤進也の両氏に深く感謝致します.

また WWW のようなシステムは現在のネットワークの環境なくしては成立しないということを, 今回改めて痛感しました. これまでネットワークの創設や維持/管理などに関わってこられた全ての方々に深く感謝致します.

そして最後に, WWW の創始者である Tim Berners-Lee 氏, Mosaic の作者である Marc Andreessen, Eric Bina の両氏をはじめとする WWW に関わってきた全ての人々に, 絶大なる感謝を!


参考文献

[TBL92a]
Berners-Lee, Tim, et. al., World-Wide Web: The Information Universe, In Electronic Networking: Research, Applications and Policy, Vol. 1, No. 2, Meckler Publishing, Westport, CT, USA, 1992. Also available at <http://info.cern.ch/pub/www/doc/ENRAP_9202.ps>.

[TBL92b]
Berners-Lee, Tim and Cailliau, R., The World-Wide Web, In proceedings of the conference Computing in High Energy Physics, Annecy, France, 1992. To be published as a CERN yellow report. Also available at <http://info.cern.ch/pub/www/doc/chep92www.ps>.

[TBL93]
Berners-Lee, Tim, et. al., The World Wide Web Initiative, In proceedings of INET '93, Internet Society, 1993. Also available at <http://info.cern.ch/pub/www/doc/INET93.ps.Z>.

[KH93]
Hughes, Kevin, Entering the World-Wide Web: A Guide to Cyberspace, <http://www.hcc.hawaii.edu/guide/www.guide.html>, 1993.

[NYT93]
Markoff, John, A Free and Simple Computer Link, In The New York Times, December 8, 1993, Wednesday, Late Edition - Final. Also available at <http://www.ugcs.caltech.edu/~kluster/markoff.html>.


第1版: 1994年1月19日, NTT COREnet オープニング・コンファレンス配布資料.
第2版: 1994年1月21日, World-Wide Web 公開版.

Copyright (C) 1994, TAKADA Toshihiro


[index]