「そろそろ忘れてしまいそうなので、少しまとめておこう。」
HTMLの元になったGMLは、もともとはIBM GMLとして社内の文書作成用に使われていたもので、SCRIPT/VSというタグ言語のマクロとして、文書整形ソフトウェア製品DCFの主要部分として提供されていたものです。大型機種のVM/CMSというOS上で稼働していました。その頃はワードプロセッサが出る前のことで、エディターでマークアップしたテキストファイルをフォーマッターにかけて出力ファイルを作成し、大型レーザープリンタなどに出力するのが主流でした。DCFはその後社内ではマクロなどが拡張されてISILという名になって、製品版はBookMasterという名前で提供されました。
現在使われているHTMLも、この最初のGMLが定義した文書構造をタグで記述するという基準はそのまま踏襲しています。当時は大型機で動作するソフトウェアでもあったことから、とても高価だったので日本ではほとんどIBM社内以外では使われていなかったと思います。あっても一部研究機関や大手印刷会社ぐらいではないでしょうか。GMLは製品として日本語化がされていなかったのも使われていなかった一因です。日本語化はBookMasterが発表された後に、何度めかのリリースでダブルバイト言語対応になり、その後多くのハードやソフトウェアのマニュアル制作に使われました。
日本語化やダブルバイト言語対応にする際に一番のネックとなったのが、シングルバイト言語での「スペースで改行される仕組み」です。ダブルバイト言語は文字がスペースで区切られていないので、そのままシングルバイト用のフォーマッターを使うと、改行がうまく行われずに「1行がすべて1単語」のような扱いになってはみ出してしまいます。そこで「各文字間に目に見えない最小スペースを入れる」という方法で先程の問題を回避することで、ダブルバイト対応が可能になりました。また禁則処理も入れることで、ようやく日本語が出力できるようになったのです。その後BookMasterは出力先を印刷物だけではなく、オンライン文書やヘルプなどにも出力できるようになり、徐々にマルチデバイス対応の流れができました。GMLはその後標準化されてSGMLが規程されました。
現在はHTMLでコーディングしておけば、ブラウザーが整形をして限りなくリアルタイムに近い状態で表示してくれるようになりました。スマホやタブレットなど、マルチデバイス対応もほぼ自動的に行なってくれます。「文書構造を記述しておけばいつまでも元の文書は使える」という基本原則はそのまま残っています。最近はタグの元の意味も分からずにコーディングされているサイトも多々ありますが、長く残って欲しいコンテンツは、なるべく文書構造に沿った形で記載するように心がけると良いのではないかと思います。(すべてがそれで上手くいくわけでも無いのですが。)
参考:最初のURL http://info.cern.ch/hypertext/WWW/TheProject.html