目次


第3章 全てのTEI文書で利用できる要素第5章 文字・字体・書き方ホーム

 本章ではTEI文書におけるデフォルトの上位構造について記述する。完全なTEI文書では、文書を記述するメタデータ(teiHeader要素によって表現される)と文書自体(1つ以上のtext要素またはmodel.resourceクラスから取得したその他の要素によって表現される)からなる。つまり、TEI要素は、符号化されたリソースとそれに関するメタデータ(teiHeaderheaderモジュールによって指定。第2章TEIヘッダー参照)が一緒に扱える。符号化されたリソースには以下のようなものがありうる:

  • text要素における元文書の論理構造の転写 (logical transcription); text要素はtextstructureモジュールにおいてその上位構成要素と共に指定される(本章において詳細を後述)。
  • sourceDoc要素における元文書の忠実な転写(diplomatic transcription); transcrモジュールで指定される (第11章一次情報源の表現参照)。
  • facsimile要素におけるテキストを画像として持つオブジェクトの符号化表現; transcrモジュールで指定される (第11章一次情報源の表現参照)。
  • standOff要素において他の符号化されたリソース(同じTEI文書であれ異なる文書であれ)についてより詳しく記述された文脈情報やアノテーションの集合; linkingモジュールで指定される(16.10節standOffコンテナ参照)。
  • [fsdDecl要素においてなされる]*その後の当該文書のfs要素を使用するための素性体系の宣言 (feature system declaration); iso-fsモジュールで指定される(18.11節素性体系の宣言参照)。

*[]は訳者による補足。以下同様。

 同じ元文書に関する2つ以上のリソースが同じメタデータを共有している場合に 、唯一のteiHeaderに続く単一のTEI要素としてこのリソース群をまとめることができる。

 TEI要素はそれ自身の子になることができるので、一群の文書は一番外側のTEI要素(転写の一群全体に対して適用されるメタデータを含むteiHeaderを持つ)によって表現し、一群の文書の中の個々の文書に対する完備したTEI要素によっても表現することができる。この個々のTEI要素が、個々の文書あるいはmode.resourceクラス由来の文書に適用されるメタデータを含むteiHeaderを持つ。

 この基本構造の変種であるteiCorpusも、言語コーパスやその他の符号化されたテキストの集合を表現するために定義されている。teiCorpusは、自分自身のメタデータ(teiHeader)と、1つ以上の完備した要素によって構成され、このTEI要素1つ1つがteiHeadermodel.resourceクラスの1つ以上の要素と組み合わされている。これによってエンコーダーがテキスト全体のメタデータ(一番外側のteiHeaderによって表現されている)と、コーパス内の個々のTEI要素のメタデータを区別することができる。言語コーパスの構造化と符号化についてのさらなる情報は第15章言語コーパスを参照。

 代替案として、コーパスはteiCorpusと同じようにTEI要素(@typeの‘corpus’を用いるなどして)によって表現しても良い。

まとめると、デフォルトの構造モジュールがスキーマに含まれているとき、以下の要素をTEI文書の最も外側の構造を表現するのに使うことができる:

  • TEI (TEI文書) 一つ以上のmodel.resourceクラスを持つ一つのTEIヘッダを持つ、単一のTEI準拠文書を含む.teiCorpusエレメントには複数のTEI要素が含まれてもよい.
@version 当該文書が妥当(に符号化される)TEIスキームの版を示す.
  • teiCorpus はTEIで符号化されたコーパス全体を含み、1つのコーパスヘッダと1つ以上の TEI 要素からなる。それぞれが1つのテキストヘッダとテキストを含む。
  • teiHeader (TEI header) はデジタルリソース1つだけあるいはそのまとまりに関連付けられた、記述的・宣言的なメタデータである。
  • text は、単一のものであれ複合的なものであれ、あらゆる種類の1つのテキストからなる。例えば詩や戯曲、エッセイ・小説・辞書のシリーズ、あるいはコーパスのサンプルなどである。

 上述のように、 teiHeader 要素は header モジュールにおいて形式的に宣言される。 (第 2章 The TEI Header参照)。1つのTEI文書は、適切なモジュールがスキーマに含まれているなら、(facsimile 画像や素性体系の宣言など) model.resource クラスの要素を含んでいても良い  (詳しくは 11.1 Digital Facsimiles 、 18.11 Feature System Declaration をそれぞれ参照)。しかしデフォルトでは、このクラスは含まれておらず、したがって TEItext,  teiCorpus 要素のみがTEI文書の主な部分として利用可能である。この3つの要素は textstructure モジュールにより提供されており、本章で説明している。

TEIテキストは単一の構成体(unitary)と見なすこともできるし、複数の要素からなり互いに意味のある仕方で独立している複合体 (composite) と見なすこともできる。この区別は必ずしも自明ではない: 例えばエッセイのシリーズはある状況では単一のものと見なすこともできるだろうが、別の状況では別々のものと見なすこともできるだろう。このような境界事例では、エンコーダは単一と捉えるか複合体と捉えるかを選ばなければならない。いずれの状況でも良い点と悪い点があるだろう。

単一であれ複合であれ、テキストは text タグでマークされ、前付け、本体、後付けを含みうる。単一のテキストでは、テキスト本体は bodyでタグ付けされる。複合テキストの場合、つまりテキスト本体が下位のテキストやまとまりを含んでいる場合は、 groupとタグ付けされる。あらゆるテキストの全体構造は、単一でも複合でも、以下の要素によって定義される:

  • front (前付け) : 本文に先行するものすべてを含む (ヘッダ、要旨、タイトルページ、まえがき、献辞、など)。
  • body (テキスト本文) : 前付け、後付けを除く単一のテキストの本文全体を含む。
  • group : 複数のテキスト本文からなり、その一連の独立のテキストがまとめられたもの。ある基準で1まとまりであるとみなされるもの。例えば1人の著者の著作集、散文的エッセイのシリーズなど。
  • back (後付け): 付録など、本文に後続するものを含む。

単一テキストの全体的な構造は以下の通りである:

<TEI xmlns=”http://www.tei-c.org/ns/1.0″>
 <teiHeader>
<!– … –>
 </teiHeader>
 <text>
  <front>
<!– front matter of copy text, if any, goes here –>
  </front>
  <body>
<!– body of copy text goes here –>
  </body>
  <back>
<!– back matter of copy text, if any, goes here –>
  </back>
 </text>
</TEI>
bibliography 

2つの単一テキストによって構成されている複合体テキストの全体的な構造は以下の通りである:

<TEI xmlns=”http://www.tei-c.org/ns/1.0″>
 <teiHeader>
<!– … –>
 </teiHeader>
 <text>
  <front>
<!– front matter for composite text –>
  </front>
  <group>
   <text>
    <front>
<!– front matter of first unitary text, if any –>
    </front>
    <body>
<!– body of first unitary text –>
    </body>
    <back>
<!– back matter of first unitary text, if any –>
    </back>
   </text>
   <text>
    <body>
<!– body of second unitary text –>
    </body>
   </text>
  </group>
  <back>
<!– back matter for composite text, if any –>
  </back>
 </text>
</TEI>
bibliography 

 floatingText 要素は、1つのテキストが他のテキストに埋め込まれているがテキストの階層構造には影響していない場合のために用意されている。例えば、別のテキストが割り込んでいる場合や、引用されている場合などがある。この要素は、劇中劇や語り手が別の語り手に割り込まれている場合(しばしば深く入れ子になっている)などのよくある文学的テキストで有用である。

 これら要素の1つ1つを本章の残りで詳しく説明する。 front と back 要素に関しては 4.5 Front Matter と 4.7 Back Matterで詳説する。より複雑あるいは複合的なテキスト構造で用いられる group と floatingText 要素は 4.3 Grouped and Floating Textsで解説する。段落、リスト、句など、この主要なテキスト要素の下位要素は 3章 Elements Available in All TEI Documentsであらゆる種類の文書に現れうる要素に関して、また他の章では特定の種類の文書に使える要素について解説する。

4.1 本文の区分

 テキストの中には、単純に本文が一連の下位レベルの構造でできているものがある。ここではこれを構成素 ( components ) とか構成素レベルの要素 ( component-level elements) などと呼ぶ。 ( 1.3 The TEI Class System参照)。例えば散文では段落やリストが含まれ、戯曲ではセリフやト書きなど、辞書では項目が構成素となる。他の場合では、構成素は階層的にまとめてテキストの区分、あるいは下位区分ができ、章や節を構成する。このテキストの下位区分の呼び名はテキストのジャンルや時代によって、あるいは著者、編者、出版社の気まぐれによって様々に異なる。例えば、叙事詩や聖書の下位区分は ‘book’ (書)、報告書の下位区分は ‘part’ (部), ‘section’ (節)、小説の下位区分は ‘chapter’ (章) などと呼ばれる (書簡小説の場合は ‘letter’ (手紙) かもしれない)。一連の語りとして、あるいは全く語りとして組織化されていないようなテキストでも、同じような方法で下位区分ができる。戯曲は ‘act’ (幕) や ‘scene’ (場面)、参考書は ‘section’ (節)、日記や日誌は ‘entry’ (項目)、新聞は ‘issue’ (号) や ‘section’ (欄) に区分できる。

 テキストはこのように多様であるので、本ガイドラインはすべてのテキストの区分を同じ中立的な呼び名の要素が現れているものとして捉え、その要素がそのテキストの階層とは独立に要素を分類するための属性タイプを持つとする。この中立的な区分をマークアップするために、番号ありと番号なしの2つのスタイルの選択肢が用意されている。番号あり区分は div1div2, …のような名前で、この番号は階層における当該の区分の深さを表す; 最上位は ‘div1’ で、これに含まれるどんな下位区分も ‘div2’ であり、これの更なる下位区分は ‘div3’ となる (以下続く)。番号なし区分は単に div という名前で、自分の階層の深度を示すために再帰的に入れ子にできる。この2つのスタイルは1つの frontbody, または back 要素の中で混在してはならない。

4.1.1 番号を用いない区分付け

番号を用いない場合、テキストの下位区分を識別するために以下の要素を用いる:

  • <div> (text division, テキスト区分) :テキストの前付け、本文、後付けの下位区分を示す。

att.typedクラスに属するため、この要素は以下の属性をさらに持っている:

  • att.typed : どんな方法であれ、要素を区分、下位区分するのに使う属性
@type: 何かの分類スキーマや類型を用いて、何らかの観点でその要素の特徴を示す。
@subtype: 必要があればその要素の下位分類を示す。

このタグ付け方法では、1部ごとに2章ある2部構成のテキスト本文は以下のように表現できる:

<body>
 <div type=”part” n=”1″>
  <div type=”chapter” n=”1″>
<!– text of part 1, chapter 1 –>
  </div>
  <div type=”chapter” n=”2″>
<!– text of part 1, chapter 2 –>
  </div>
 </div>
 <div type=”part” n=”2″>
  <div n=”1″ type=”chapter”>
<!– text of part 2, chapter 1 –>
  </div>
  <div n=”2″ type=”chapter”>
<!– text of part 2, chapter 2 –>
  </div>
 </div>
</body>
bibliography 

4.1.2 番号付きの区分付け

番号付きの区分の場合、テキストの下位区分を識別するために以下の要素を用いる:

  • <div1> (level-1 text division): 前付,本文,後付中の第1位のテキスト部分を示す。
  • <div2> (level-2 text division): 前付,本文,後付中の第2位のテキスト部分を示す。
  • <div3> (level-3 text division): 前付,本文,後付中の第3位のテキスト部分を示す。
  • <div4> (level-4 text division): 前付,本文,後付中の第4位のテキスト部分を示す。
  • <div5> (level-5 text division): 前付,本文,後付中の第5位のテキスト部分を示す。
  • <div6> (level-6 text division): 前付,本文,後付中の第6位のテキスト部分を示す。
  • <div7> (level-7 text division): 前付,本文,後付中の一番小さいレベルのテキスト部分を示す。

att.typed クラスに属するため、この全ての要素はさらに以下の属性も持つ。

att.typed : どんな方法であれ、要素を区分、下位区分するのに使う属性

@type 何かの分類スキーマや類型を用いて、何らかの観点でその要素の特徴を示す。
@subtype 必要があればその要素の下位分類を示す。

最も上位の区分はdiv1 要素で、深さは div7まであり得る。番号つきの区分が用いられるときは、あるレベルはその直下のレベルしか直接に含むことができない。例えば div3の直下にはdiv4を含むことしかできない。

このタグ付け方法では、1部ごとに2章ある2部構成のテキスト本文は以下のように表現できる:

<body>
 <div1 type=”part” n=”1″>
  <div2 type=”chapter” n=”1″>
<!– text of part 1, chapter 1 –>
  </div2>
  <div2 type=”chapter” n=”2″>
<!– text of part 1, chapter 2 –>
  </div2>
 </div1>
 <div1 type=”part” n=”2″>
  <div2 n=”1″ type=”chapter”>
<!– text of part 2, chapter 1 –>
  </div2>
  <div2 n=”2″ type=”chapter”>
<!– text of part 2, chapter 2 –>
  </div2>
 </div1>
</body>
bibliography 

4.1.3 番号付きの区分を用いるべきか、番号なしの区分を用いるべきか?

 同じ front (前付け), body (本文), あるいは back (後付け) 要素内で、全ての階層的な下位区分は div あるいは div1div2 などで適切に入れ子になっていなければならず、番号ありと番号なしの2つの区分方法を併用してはならない。

番号あり区分と番号なし区分のどちらを選ぶかは、テキストの複雑さによる:

 番号なし区分はあらゆる深さの入れ子を許すが、番号あり区分は構築できる深さが限られる。異なるレベルの区分を区別して処理すべき場合、番号あり区分はそれぞれのレベルの処理の定義を少しだけ単純化してくれる。(例えば節 (div3) ではなく章 (div2) の始まりだけ改ページしたいときなどに有効である。) ただしこの区別は番号なし区分の div の@type属性でも実現できる。番号あり区分を用いた場合、ある区分がどの階層にあるかを知るために文書の全体構造の情報を保持する必要がない。そのためソフトウェアによっては番号あり区分のほうが処理が簡単なこともある。しかしそのようなソフトウェアはTEIスキーマの他の側面をうまく扱えないかも知れない。一方、大量の作品群からなる著作集では、番号あり区分が常に同じテキストのレベルに対応することを保障するのはかなり難しいか不可能であろう。ある作品では「章」はレベル1かもしれないし、別の作品ではレベル3かもしれない。

 どちらの区分方法を用いる場合でも、テキストのそれぞれの区分を表す参照文字列(ラベル)としてグローバルな n 属性と xml:id 属性 (section 1.3.1.1 Global Attributes) の値を用いることもできる。このようなラベルは参照のために重要だと考えるそれぞれの区分で使うべきである (参照システムに関しては 3.11 Reference Systems を参照)。

 上述したように、 att.typed クラスの@typeと@subtype属性を区分の名前や説明を提供するために用いることもできる。この属性の典型的な値は、‘book’ (書・巻・編), ‘chapter’ (章), ‘section’ (節), ‘part’ (部), あるいは (詩においては) ‘book’ (巻), ‘canto’ (編・篇), ‘stanza’ (連), あるいは (戯曲においては) ‘act’ (幕), ‘scene’ (場) である。以下の拡張例では、番号あり区分が小説の構造を示すために使われており、上述した属性の記述例となっている。さらに、 4.2 Elements Common to All Divisions で議論する要素や、 3.1 Paragraphs で議論する p 要素なども使われている。

<div1 type=”book” n=”I” xml:id=”JA0100″>
 <head>Book I.</head>
 <div2 type=”chapter” n=”1″ xml:id=”JA0101″>
  <head>Of writing lives in general, and particularly of Pamela, with a word
     by the bye of Colley Cibber and others.</head>
  <p>It is a trite but true observation, that examples work more forcibly on
     the mind than precepts: … </p>
<!– remainder of chapter 1 here –>
 </div2>
 <div2 type=”chapter” n=”2″ xml:id=”JA0102″>
  <head>Of Mr. Joseph Andrews, his birth, parentage, education, and great
     endowments; with a word or two concerning ancestors.</head>
  <p>Mr. Joseph Andrews, the hero of our ensuing history, was esteemed to
     be the only son of Gaffar and Gammar Andrews, and brother to the
     illustrious Pamela, whose virtue is at present so famous … </p>
<!– remainder of chapter 2 here –>
 </div2>
<!– remaining chapters of Book 1 here –>
 <trailer>The end of the first Book</trailer>
</div1>
<div1 type=”book” n=”II” xml:id=”JA0200″>
 <head>Book II</head>
 <div2 type=”chapter” n=”1″ xml:id=”JA0201″>
  <head>Of divisions in authors</head>
  <p>There are certain mysteries or secrets in all trades, from the highest
     to the lowest, from that of <term>prime-ministering</term>, to this of
  <term>authoring</term>, which are seldom discovered unless to members of
     the same calling … </p>
  <p>I will dismiss this chapter with the following observation: that it
     becomes an author generally to divide a book, as it does a butcher to
     joint his meat, for such assistance is of great help to both the reader
     and the carver. And now having indulged myself a little I will endeavour
     to indulge the curiosity of my reader, who is no doubt impatient to know
     what he will find in the subsequent chapters of this book.</p>
 </div2>
 <div2 type=”chapter” n=”2″ xml:id=”JA0202″>
  <head>A surprising instance of Mr. Adams’s short memory, with the
     unfortunate consequences which it brought on Joseph.
  </head>
  <p>Mr. Adams and Joseph were now ready to depart different ways … </p>
 </div2>
</div1>
bibliography 

 「区分 (division)」という中立的な名前の要素(<div>要素)をtype属性によって特徴づける方法の代わりあるいは補うものとして、カスタマイズの仕組み ( 23.3 Customization で議論される) を新しい要素の定義に使っても良い ( <chapter>, <part>, など)。

カスタマイズを簡潔にするために、単一の要素を持つモデル・クラスがそれぞれの中立的な呼び方の区分要素のために定義されている: model.divLike ( divを含む)、 model.div1Like (div1を含む)、 model.div2Like ( div2を含む) など。例えば、テキスト本文が日記の一連のエントリーで、それぞれが午前と午後に分かれる場合を考えよう。これは以下のいずれでも表現しうる。まず番号なしスタイルの場合は以下のようになる。

<body>
 <div type=”entry” n=”1″>
  <div type=”morning” n=”1.1″>
   <p>[…]</p>
  </div>
  <div type=”afternoon” n=”1.2″>
   <p>[…]</p>
  </div>
 </div>
 <div type=”entry” n=”2″>
  <div type=”morning” n=”2.1″>
   <p>[…]</p>
  </div>
  <div type=”afternoon” n=”2.2″>
   <p>[…]</p>
  </div>
 </div>
<!– …–>
</body>

同様に、番号付けしたスタイルを用いた場合:

<body>
 <div1 type=”entry” n=”1″>
  <div2 type=”morning” n=”1.1″>
   <p>[…]</p>
  </div2>
  <div2 type=”afternoon” n=”1.2″>
   <p>[…]</p>
  </div2>
 </div1>
 <div1 type=”entry” n=”2″>
  <div2 type=”morning” n=”2.1″>
   <p>[…]</p>
  </div2>
  <div2 type=”afternoon” n=”2.2″>
   <p>[…]</p>
  </div2>
 </div1>
<!– …–>
</body>

新しい要素<diaryEntry>をmodel.divLikeクラスに追加するというカスタマイズを行っていると想定した場合:

<body>
 <my:diaryEntry type=”entry” n=”1″>
  <my:diaryEntry type=”morning” n=”1.1″>
   <p>[…]</p>
  </my:diaryEntry>
  <my:diaryEntry type=”afternoon” n=”1.2″>
   <p>[…]</p>
  </my:diaryEntry>
 </my:diaryEntry>
 <my:diaryEntry type=”entry” n=”1″>
  <my:diaryEntry type=”morning” n=”1.1″>
   <p>[…]</p>
  </my:diaryEntry>
  <my:diaryEntry type=”afternoon” n=”1.2″>
   <p>[…]</p>
  </my:diaryEntry>
 </my:diaryEntry>
<!– …–>
</body>

最後に、<diaryEntry>をmodel.div1Likeクラスに追加し、<amEntry>と<pmEntry>の両方をmodel.div2Likeクラスに追加するという、3つの新しい要素を追加するカスタマイズを行っていると想定した場合:

<body>
 <p>
<!– … –>
 </p>
 <my:diaryEntry type=”entry” n=”1″>
  <my:amEntry type=”morning” n=”1.1″>
   <p>[…]</p>
  </my:amEntry>
  <my:pmEntry type=”afternoon” n=”1.2″>
   <p>[…]</p>
  </my:pmEntry>
 </my:diaryEntry>
 <my:diaryEntry type=”entry” n=”1″>
  <my:amEntry type=”morning” n=”1.1″>
   <p>[…]</p>
  </my:amEntry>
  <my:pmEntry type=”afternoon” n=”1.1″>
   <p>[…]</p>
  </my:pmEntry>
 </my:diaryEntry>
<!– … –>
</body>

ここで示したカスタマイズの方法に関する詳しい情報は23.3 カスタム化で提供している。

4.1.4 不完全な区分と複合的区分

 ほとんどの場合では、 div or div1 などとマークアップされたテキストの下位区分は完結していてしかも元資料と同じ構造を保っている。しかし何らかの目的で(特にかなり長文あるいは逆にかなり短文の場合)、元テキストに照らすと不完全な一連のテキストを、あるいは短文のアドホックな集まりを1区分としたほうが良いと考えることもあるかも知れない。さらに、以下で述べる通り、ある種のテキストでは個々の区分の順番を決めるのが困難、あるいは不可能なことがある。
この問題を解決するため、以下の属性が att.divLike クラスにおけるすべての要素について追加で定義されている:

  • att.divLike : 区分と同じように振る舞う全ての要素に共通の属性を提供する。
@org (organization): 区分の内容がどのように構造化されているかを指定
@sample : 当該の区分が元資料のサンプルであるかどうか、もしそうならどの部分のサンプルなのかを指定
  • att.fragmentable : 構造化された要素の断片であること(典型的には重複した階層が原因)を示す属性を提供する。
@part 自分の親要素が、何らかの点で(典型的には重複した構造のせいで)断片化されているかどうかを指定。例えば、2連以上の詩文に分割された1発話、ページ境界をまたいだ1段落、2人の話者によって分けて発話された1行の詩文など。

例えば、ある小説の中の各章から冒頭の2000語だけ転写することにしたとしよう。このような場合には便宜的に各章を不完全な区分として見なし、以下の形式で div 要素でタグ付けできる。

<div n=”xx” sample=”initial” part=”Y”
 type=”chapter”>

 <p></p>
</div>

ここで xx は章番号を表しており、 @part 属性が値 Y をとってこの区分がある点で不完全であることを示している。この属性のとり得る値は他にも、区分の最初 (I), 最後 (F), あるいは途中 (M) で省略されているか否かを示すものや、あるいは gap 要素 (3.4.3 Additions, Deletions, and Omissions) を使って正確にどこで文が省略されているかを示したりできる。

<div n=”xx” part=”M” type=”chapter”>
 <p></p>
 <gap extent=”2″ reason=”sampling”/>
 <p></p>
</div>

TEIヘッダの samplingDecl 要素も、不完全なサンプル選択のための原則を記録するのに使うべきである( 2.3.2 The Sampling Declarationで詳述)。
以下の例は、ごく短い、お互い関連のない文章が集まった新聞の欄がこの属性を使ってどのように符号化されうるかを例示している。:

<div1 type=”storylist” org=”composite”>
 <head>News in brief</head>
 <div2 type=”story”>
  <head>Police deny <soCalled>losing</soCalled> bomb</head>
  <p>Scotland Yard yesterday denied claims in the Sunday
     Express that anti-terrorist officers trailing an IRA van
     loaded with explosives in north London had lost track of
     it 10 days ago.</p>
 </div2>
 <div2 type=”story”>
  <head>Hotel blaze</head>
  <p>Nearly 200 guests were evacuated before dawn
     yesterday after fire broke out at the Scandic
     Crown hotel in the Royal Mile, Edinburgh.</p>
 </div2>
 <div2 type=”story”>
  <head>Test match split</head>
  <p>Test Match Special next summer will be split
     between Radio 5 and Radio 3, after protests this
     year that it disrupted Radio 3’s music schedule.</p>
 </div2>
</div1>
bibliography 

個々の記事 ( div2として符号化されている) は、[div1] の下位区分としてすべてが符号化されているにも関わらず、ここでは div1 要素で [compositeという値を持つ] @org  属性が用いられることで、お互い独立であることを示している。記事をどのような順序で読んでも個々の意味には影響しない。実際のところ、このような性質の区分は意図された読み順を決めることが不可能なように表示されている場合もある。個々の記事は既存の記事 [の内容] に影響することなく加えたり除いたりすることができる。

このように、テキストの集まりを複合区分として符号化する方法は、より一般的で強力なやり方( 4.3.1 Grouped Texts) に比べると限界がある。しかし、特に個々のテキストが短いなど、こちらのほうが望ましい場合もあるだろう。

4.2 全ての区分に共通する要素

 どのようなテキストでも、その区分が簡潔な見出しや内容を表すタイトルによって始まることがあり、文責や題辞(つまり短い引用)、あるいは手紙の冒頭にあるような挨拶を伴う場合と伴わない場合がある。また、テキストは短trailer、文責、追記・追伸、あるいは署名によって結ばれていることもある。これらの多く(例えば文責)はテキスト区分の最初または最後にのみ現れうる。

このような不揃いな要素をうまく処理するために、TEIのアーキテクチャでは5つのクラスを定義しており、その全てがこのモジュールによって設定されている:

  • model.divTop テキスト区分の始まりに現れる要素をまとめる.
model.divTopPart テキスト区分の最初にのみ現れる要素をまとめる.
model.divWrapper テキスト区分の最初または最後に現れる要素をまとめる.
model.divBottomPart テキスト区分の最後にのみ出現できる要素をまとめる.
model.divWrapper テキスト区分の最初また最後に現れる要素をまとめる.
  • model.divTopPart テキスト区分の始まりにのみ現れることができる要素をまとめる.
model.headLike テキスト区分の始まりにあるタイトルや見出しを示す要素をまとめる.
opener テキスト区分の始まりに、日付欄、署名欄、挨拶文言など、前置き的な部分としてあるものをまとめる。特に手紙の場合。
signed (signature)はしがき、献辞、その他の区分が続く結びの挨拶などを含む。
  • model.divBottomPart テキスト区分の終わりにのみ出現できる要素をまとめる.
closer 挨拶文言、日付欄など、ある区分の終わり、特に手紙の終わりにある一連の文言をまとめる.
postscript 追伸を示す.例えば、手紙の場合など.
signed (signature)はしがき、献辞、その他の区分が続く結びの挨拶などを含む。
trailer テキスト部分の最後にある、クレジットや脚注を示す.
  • model.divWrapper テキスト部分の上部または下部に現れる要素をまとめる.
argument 下位部分にある、テキストのトピックに関する形式に沿ったリストまたは文章
byline タイトルページ、冒頭、あるいは最後にある、作品の責任者を表す主要な記述
dateline 手紙や新聞記事などの前後に付加されている、場所、日付、時間などの簡単な記述
docAuthor (document author) タイトルページにある(いつもではないがしばしば署名欄にある)当該文書の著者名
docDate (document date) 文書の日付を示す.一般にはタイトルページあるいは日付欄に書かれている.
epigraph 匿名であれ記名であれ、タイトルページや節などの前後にある引用・警句
meeting 会議のための、あるいは会議から得られた項目の書誌情報記述に使うための、あるいは会議から生じる出版物の前付けや後付けとしての、形式化されて内容を表す見出し
salute (salutation) 序文や献辞などに先行する文言、手紙やまえがきを閉じる文言

4.2.1 見出しと後書き

 head 要素は、レベルを問わず、あらゆる本文の前に現れる見出しを明示するために使われる。以下の例のように、1つのdiv関連要素にはこの種の要素が複数含まれていることがある:

<div1 n=”Etym”>
 <head>Etymology</head>
 <head>(Supplied by a late consumptive usher to a
   grammar school)</head>
 <p>The pale Usher — threadbare in coat, heart,
   body and brain; I see him now. He was ever
   dusting his old lexicons and grammars, …</p>
</div1>
bibliography 

他のマークアップのスキームとは異なり、TEIのスキームでは異なる階層におけるテキストの下位区分に付けている見出しに、異なる識別子を持たせる必要はない

あらゆる種類の見出しはheadタグを使って区別することなくマークされる。そして、どの種類やレベルの見出しを意図しているかは、head要素のすぐ上の親要素(例えばdiv1div2などや番号なしのdiv、あるいはmodel.listLikeクラスのメンバーなど)によって示される。

ただし、div関連要素のときと同様に、必要であれば、headを唯一のメンバーとして含むmodel.headLikeクラスを拡張して他の同種の要素を含めても良い。

特定の種類のテキスト(主に新聞)では、区分の最初の個別の見出しを分類していく必要が生じる場合があり、例えばメインの見出しや詳細の見出しなどが考えられる。これはすでに用意されている@type属性や@subtype属性を用いることで実現できる。

ある種の見出しのような機能を持ったものについては、専用の要素が用意されている(主にbylinedateline、およびsalute; 詳しくは4.2.2節書き出しと結びを参照すること) が、その他の見出しの形式を識別するためには@typeまたは@subtype属性を使わなければならない。他でもそうであるように、これらの属性は、head要素がそのメンバーであるatt.typed属性によって提供されている。

以下の例はイギリスの新聞から取得したものであるが、トップ記事と関連する見出しをdiv要素として符号化し、適切なmodel.divTopに含まれる要素が添付されている:

<div type=”story”>
 <head rend=”underlined” type=”sub”>President pledges safeguards for 2,400 British
   troops in Bosnia</head>
 <head rend=”scream” type=”main”>Major agrees to enforced no-fly zone</head>
 <byline>By George Jones, Political Editor, in Washington</byline>
 <p>Greater Western intervention in the conflict in
   former Yugoslavia was pledged by President Bush …</p>
</div>
bibliography 

古い文章では、見出しつまりインキピット (incipits) が現代の作品よりも長いことがある。テキストの途中で見出しのような (heading-like) ものが現れた場合、それを新しい区分の始まりとして扱うかどうかを決める必要がある。当該の語句がその前の文よりも後続の文とより密接につながっているように見えるのであれば、それを見出しとして捉え、新しいdiv要素のheadとしてタグ付けできる。新聞や雑誌でよく見られる「抜粋見出し」などのように、単に挿入されているだけであったり付け足さ れているように見える場合は、quoteqcitなどの要素の方が適切である。

区分の末尾においてのみ現れることができるtrailer要素はこの位置において現れる見出しのような (heading-like) 特徴を符号化するために用いられる。以下にその一例を示している:

<div type=”book” n=”I”>
 <head>In the name of Christ here begins the
   first book of the ecclesiastical history of Georgius Florentinus,
   known as Gregory, Bishop of Tours.</head>
 <div>
  <head>Chapter Headings</head>
  <list>
   <item>
<!– chapter head –>
   </item>
<!– further chapter heads omitted –>
  </list>
 </div>
 <div>
  <head>In the name of Christ here begins Book I of the history.</head>
  <p>Proposing as I do …</p>
  <p>From the Passion of our Lord until the death of Saint Martin four
     hundred and twelve years passed.</p>
  <trailer>Here ends the first Book, which covers five thousand, five
     hundred and ninety-six years from the beginning of the world down
     to the death of Saint Martin.</trailer>
 </div>
</div>
bibliography 

4.2.2 書き出しと結び

 様々な種類の見出しに加えて、多かれ少なかれ定型的な書き出しや結びの一節が区分の中に含まれることもある。例えば、宛てられた個人の名前や住所、書いた場所と日付、読み手への挨拶や説諭などの情報が典型的である。書簡形式の区分はそのような特徴を持っている可能性が特に高い。個人名や日付、場所に関するさらなる詳細な符号化用の追加の要素については第13章名前、日付、人、場所で記述している。単純なケースについては、以下の要素で充分であると思われる:

  • byline タイトルページ、作品の冒頭や最後にある、作品の責任者を表す基本的な記述
  • dateline 見出しやクレジットとして手紙や新聞記事などの前後に付加されている、場所、日付、時間など
  • salute (salutation) 序文や献呈書簡などのテキスト区分に先行挨拶文言、または手紙の締めの挨拶、まえがきの終わりの文言など
  • signed (signature) 序文や献呈書簡などのテキスト区分にある、結びの挨拶など

bylinedateline要素は区分の著作者や来歴を識別する見出しの符号化に用いる。この用語は新聞用語から派生しているものの、datelinebyline要素が新聞のテキストにしか該当しないということはない。以下の例では小説の序文の末尾におけるdatelinesigned要素の使用を示している:

<div type=”preface”>
 <head>To Henry Hope.</head>
 <p>It is not because this volume was conceived and partly
   executed amid the glades and galleries of the Deepdene,
   that I have inscribed it with your name. … I shall find a
   reflex to their efforts in your own generous spirit and
   enlightened mind.
 </p>
 <closer>
  <signed xml:lang=”el”>D.</signed>
  <dateline>Grosvenor Gate, May-Day, 1844</dateline>
 </closer>
</div>
bibliography 

要素の始まりや終わりにおいてこのような一連の要素がまとめて現れる場合は、以下の要素のいずれかを用いてグループ化しておくと便利である:

  • opener テキスト部分の始まりに、日付欄、署名欄、挨拶文言など、前置き的な部分 としてあるものをまとめる.典型例は、手紙の場合である.
  • closer 挨拶文言、日付欄など、ある区分の終わり、特に手紙の終わりにある一連の 文言をまとめる.

以下の例では要素をグループ化するopenercloserの使い方を示している:

<div type=”narrative” n=”6″>
 <head>Sixth Narrative</head>
 <head>contributed by Sergeant Cuff</head>
 <div type=”fragment” n=”6.1″>
  <opener>
   <dateline>
    <name type=”place”>Dorking, Surrey,</name>
    <date>July 30th, 1849</date>
   </dateline>
   <salute>To <name>Franklin Blake, Esq.</name> Sir, —</salute>
  </opener>
  <p>I beg to apologize for the delay that has occurred in the
     production of the Report, with which I engaged to furnish you.
     I have waited to make it a complete Report …</p>
  <closer>
   <salute>I have the honour to remain, dear sir, your
       obedient servant </salute>
   <signed>
    <name>RICHARD CUFF</name> (late sergeant in the
       Detective Force, Scotland Yard, London). </signed>
  </closer>
 </div>
</div>
bibliography 
<div type=”letter” n=”14″>
 <head>Letter XIV: Miss Clarissa Harlowe to Miss Howe</head>
 <opener>
  <dateline>Thursday evening, March 2.</dateline>
 </opener>
 <p>On Hannah’s depositing my long letter …</p>
 <p>An interruption obliges me to conclude myself
   in some hurry, as well as fright, what I must ever be,</p>
 <closer>
  <salute>Yours more than my own,</salute>
  <signed>Clarissa Harlowe</signed>
 </closer>
</div>
bibliography 

 日付や人名・地名の符号化に関する詳しい説明については3.6.4.節日付と時間と第13章名前、日付、人、場所を参照すること。

4.2.3 論題、題辞、および追伸(追記)

 argument要素は章などの区分の始まりにある、前置き的なトピックのリストの符号化に用いることができる。各項目を区別できることから<list>として符号化することが最も有用性が高いが、単に<p>などで表現することも可能である。以下は、同じ論題(argument)についての例としていずれも有効である:

<div type=”chap” n=”6″>
 <argument>
  <p>Kingston — Instructive remarks on early English history
     — Instructive observations on carved oak and life in general
     — Sad case of Stivvings, junior — Musings on antiquity
     — I forget that I am steering — Interesting result
     — Hampton Court Maze — Harris as a guide.</p>
 </argument>
 <p>It was a glorious morning, late spring or early summer, as you
   care to take it …</p>
</div>
bibliography 

<div type=”chap” n=”6″>
 <argument>
  <list type=”inline”>
   <item>Kingston</item>
   <item>Instructive remarks on early English history</item>
   <item>Instructive observations on carved oak and life in
       general</item>
   <item>Sad case of Stivvings, junior</item>
   <item>Musings on antiquity</item>
   <item>I forget that I am steering</item>
   <item>Interesting result</item>
   <item>Hampton Court Maze</item>
   <item>Harris as a guide.</item>
  </list>
 </argument>
 <p>It was a glorious morning, late spring or early summer, as you
   care to take it …</p>
</div>
bibliography 

 題辞は別の作品や格言、標語などからの引用であり、題名のページや区分の始まりに登場する。以下の例の通り、題辞用の要素であるepigraphを用いて符号化できる:

<titlePage>
 <docAuthor>E. M. Forster</docAuthor>
 <docTitle>
  <titlePart>Howards End</titlePart>
 </docTitle>
 <epigraph>
  <q>Only connect…</q>
 </epigraph>
</titlePage>
bibliography 

 引用が含まれている題辞は、多くの場合それに関する参考文献がある。そのような場合では、以下の例の通り、cit要素を用いて引用した文と引用元をさらにグループ化することを勧める:

<div n=”19″ type=”chap”>
 <head>Chapter 19</head>
 <epigraph>
  <cit>
   <quote>I pity the man who can travel
       from Dan to Beersheba, and say <q>‘Tis all
         barren;</q> and so is all the world to him
       who will not cultivate the fruits it offers.
   </quote>
   <bibl>Sterne: Sentimental Journey.</bibl>
  </cit>
 </epigraph>
 <p>To say that Deronda was romantic would be to
   misrepresent him: but under his calm and somewhat
   self-repressed exterior …</p>
</div>
bibliography 

 題辞以外の引用に関する説明については3.3.3節引用を参照すること。

 追伸(追記)は手紙の署名の後や、手紙ほど頻繁には見られないものの書籍や記事、エッセイの本文の後に追加される一節のことである。英語では、追伸のことをP.S.またPSと略すことが多く、以下の例のようにこれらの略語のいずれかを用いたラベルによって導入されることが多い。

<div type=”letter”>
 <opener>
  <dateline>
   <placeName>Newport</placeName>
   <date when=”1761-05-27″>May ye 27th 1761</date>
  </dateline>
  <salute>Gentlemen</salute>
 </opener>
 <p>Capt Stoddard’s Business
 <lb/>calling him to Providence, have
 <lb/>got him to look at Hopkins brigantine
 <lb/>& if can agree to Purchase her, shall
 <lb/>be much oblig’d for your further
 <lb/>assistance herein, & will acquiesce with
 <lb/>whatever you & he shall Contract
 <lb/>for — I Thank you for your
 <lb/>
  <unclear>Line</unclear> respecting the brigantine & Beg
 <lb/>leave to Recommend the Bearer
 <lb/>to you for your advice & Friendship
 <lb/>in this matter</p>
 <closer>
  <salute>I am your most humble servant</salute>
  <signed>Joseph Wanton Jr</signed>
 </closer>
 <postscript>
  <label>P.S.</label>
  <p>I have Mollases, Sugar,
  <lb/>Coffee & Rum, which
  <lb/>will Exchange with you
  <lb/>for Candles or Oyl</p>
 </postscript>
</div>
bibliography 

4.2.4 テキスト区分の内容

model.divWrappermodel.divTop、またはmodel.divBottomクラスの要素以外にも、番号付きであれ番号なしであれ、どのテキスト区分も一連のグループ化されていないmacro.component要素によって構成されている(1.3節TEIクラスシステム)。実際に利用可能な要素は使用されているモジュールによる;全ての場合において、少なくともコア・モジュールにおいて定義した構成要素レベルの構造要素は利用可能である(段落、リスト、戯曲の台詞、韻文、韻律詩など)。

戯曲のモジュールを選択したのであれば、戯曲に特化した他の構成要素レベル、あるいはフレーズレベルの要素など(第7章 戯曲で定義しているような、例えばキャストの一覧やカメラの角度)が利用可能になる。辞書のモジュールを用いるのであれば、辞書の項目、関連語など(第9章辞書で定義されている通り)が利用可能である。発話の書き起こしのためのモジュールを用いているのであれば、発声、ポーズ、音声、身振りなど、8.3節 発話テキスト固有の要素で定義されている通りに利用可能になるということである。

テキストに複数モジュールに属する下位要素が含まれている場合、これらは文のどこで現れてもよい。同じモジュールごとに要素をまとめなくてはいけないという決まりはない。

4.3 テキストのグループ化とフローティングテキスト

 処理などの目的でひとまとまりとして扱う、独立したテキストの集まりを表現するためには、4.3.1 テキストのグループ化で述べるgroup要素を用いるべきである。また、テキスト中に割って入るような、独立して挿入されたテキストを表すためには4.3.2 フローティングテキストで述べるfloatingText要素を用いるべきである。

  • group ある単位として独立している個別テキストをまとめた複合テキストを示す。例えば、ある著者の作品集やエッセイ集など.
  • floatingText あらゆる種類のひとまとまりのテキストで、それ自体を含むテキストを中断して挿入されているもの。下位構造はあってもよい。

4.3.1 テキストのグループ化

 group要素を用いて表現すべき複合テキストとして、選集やその他の集成が例としてあげられる。個別のテキストの前付けに加えて、集成全体についての共通の前付けがあれば、当該テキストをgroup要素を用いて有用に符号化できるという良い指標になる。他の状況でもこの構造が有用であり得る。

例えば、短編集の全体的な構造は次の通り符号化できる:

<text>
 <front>
  <docTitle>
   <titlePart> The Adventures of Sherlock Holmes
   </titlePart>
  </docTitle>
  <docImprint>First published in <title>The Strand</title>
     between July 1891 and December 1892</docImprint>
<!– any other front matter specific to this collection –>
 </front>
 <group>
  <text>
   <front>
    <head rend=”italic”>Adventures of Sherlock
         Holmes</head>
    <docTitle>
     <titlePart>Adventure I. —</titlePart>
     <titlePart>A Scandal in Bohemia</titlePart>
    </docTitle>
    <byline>By A. Conan Doyle.</byline>
   </front>
   <body>
    <p>To Sherlock Holmes she is always
    <emph>the</emph> woman. … </p>
<!– remainder of A Scandal in Bohemia here –>
   </body>
  </text>
  <text>
   <front>
    <head rend=”italic”>Adventures of Sherlock Holmes</head>
    <docTitle>
     <titlePart>Adventure II. —</titlePart>
     <titlePart>The Red-Headed League</titlePart>
    </docTitle>
    <byline>By A. Conan Doyle.</byline>
   </front>
   <body>
    <p>I had called upon my friend, Mr. Sherlock Holmes, one day
         in the autumn of last year and found him in deep conversation
         with a very stout, florid-faced, elderly gentleman with fiery red hair …
    </p>
<!– remainder of The Red Headed League here –>
   </body>
  </text>
  <text>
   <front>
    <head rend=”italic”>Adventures of Sherlock Holmes</head>
    <docTitle>
     <titlePart>Adventure XII. —</titlePart>
     <titlePart>The Adventure of the Copper Beeches</titlePart>
    </docTitle>
    <byline>By A. Conan Doyle.</byline>
   </front>
   <body>
    <p>
     <q>To the man who loves art for its
           own sake,</q> remarked Sherlock Holmes …
        
    
<!– remainder of The Copper Beeches here –>
        
         … she is now the head of a private school
         at Walsall, where I believe that she has
         met with considerable success.</p>
   </body>
  </text>
<!– end of The Copper Beeches –>
 </group>
</text>
<!– end of the Adventures of Sherlock Holmes –>
bibliography 

 グループに含まれるテキスト自体がグループを包含していることもある。これは韻文の集成においては極めて一般的であるが、どのような種類のテキストにおいても起こりえる。例として、クラショー (Richard Crashaw) の詩のMuses’ Library版のような典型的な集成の全体構造について考えてみたい。解題と目次に続いて、本書には大きく分けて以下に分かれる:

  • Steps to the Temple (1648年に出版された1番目の詩集)
  • Carmen deo Nostro (1652年に出版された2巻目の詩集)
  • The Delights of the Muses (1648年に出版された3巻目の詩集)
  • Posthumous Poems, I (1つの下書きから取られた断片的な詩集)
  • Posthumous Poems, II (別の下書きから収集した断片的な詩集)

クラショーの存命中に出版された3つの詩集はそれぞれ独自のテキストとして見なすことが妥当であり、そのように符号化できる。クラショーの2つの遺作集を、Muses’ Library版がそうするように2つのグループとして扱うべきかどうかは、より恣意的である。両者を単一のグループとしてまとめても良いし、各断片をグループ化していない単体テキストとして扱うことにしても良い。

Muses’ Library版では3つの元の詩集を、元の前付け(タイトルページ、献呈の辞など)も含めてそれぞれの全体を複製している。これらはfront要素やその構成要素を用いて符号化すべきであり(これについては4.5節前付けを参照すること)、一方で各詩集の本文は単一のgroup要素として符号化すべきである。詩集に収録されているそれぞれの詩は別々のtext要素として符号化すべきである。まとめると、詩集全体の始まりは以下の通りとなる(韻文のテキストの下位区分におけるdivlgなどの要素の使用に関するさらなる説明については3.12.1節韻文のコアタグと第6章韻文を参照すること):

<text>
 <front>
  <titlePage>
   <docTitle>
    <titlePart>The poems of Richard Crashaw</titlePart>
   </docTitle>
   <byline>Edited by J.R. Tutin</byline>
  </titlePage>
  <div type=”preface”>
   <head>Editor’s Note</head>
   <p>A few words are necessary … </p>
  </div>
 </front>
 <group>
  <text>
   <front>
    <titlePage>
     <docTitle>
      <titlePart>Steps to the Temple, Sacred Poems</titlePart>
     </docTitle>
    </titlePage>
    <div type=”address”>
     <head>The Preface to the Reader</head>
     <p>Learned Reader, The Author’s friend will not usurp much
           upon thy eye … </p>
    </div>
   </front>
   <group>
    <text>
     <front>
      <docTitle>
       <titlePart>Sospetto D’Herode</titlePart>
      </docTitle>
     </front>
     <body>
      <div1 type=”book” n=”Herod I”>
       <head>Libro Primo</head>
       <epigraph>
        <l>Casting the times with their strong signs</l>
       </epigraph>
       <lg n=”I.1″ type=”stanza”>
        <l>Muse! now the servant of soft loves no more</l>
        <l>Hate is thy theme and Herod whose unblest</l>
        <l>Hand (O, what dares not jealous greatness?) tore</l>
        <l>A thousand sweet babes from their mothers’ breast,</l>
        <l>The blooms of martyrdom …</l>
       </lg>
      </div1>
     </body>
    </text>
    <text>
     <front>
      <docTitle>
       <titlePart>The Tear</titlePart>
      </docTitle>
     </front>
     <body>
      <lg n=”I”>
       <l>What bright soft thing is this</l>
       <l>Sweet Mary, thy fair eyes’ expense?</l>
      </lg>
     </body>
    </text>
<!– remaining poems of the Steps to the Temple appear here, each tagged as a distinct text element –>
   </group>
   <back>
<!– back matter for the Steps to the Temple –>
   </back>
  </text>
  <text>
<!– start of Carmen deo Nostro –>
   <front/>
   <group>
    <text/>
    <text/>
<!– more texts here –>
   </group>
  </text>
  <text>
<!– start of The Delights of the Muses –>
   <group>
    <text/>
    <text/>
<!– more texts here –>
   </group>
  </text>
 </group>
 <back>
<!– back matter for the whole collection –>
 </back>
</text>
bibliography 

 group要素はこのように用いて、構成要素が独立したテキストとして見なされるようなコレクションを符号化できる。例えば、複数の著者による詩や散文のコレクション、詞華集、またはコモンプレイス・ブック、日誌、日記帳などが挙げられる。典型例として、ここではポール・フッセルが編集しW・W・ノートンが1987年に出版した選集であるThe Norton Book of Travelを検討する。本作品は以下の主なセクションによって構成されている:

  1. 前付:タイトルページ、謝辞、序論
  2. 始まり(The Beginnings)
  3. 18世紀とグランド・ツアー(The Eighteenth Century and the Grand Tour)
  4. 全盛期(The Heyday)
  5. 観光業の傾向(Touristic Tendencies)
  6. ポスト・ツーリズム(Post Tourism)
  7. 後付:転載許可の一覧、索引

 タイトルが付いた上述の各セクションは、紹介文に続きそれぞれの時代の著者によるテキスト全体や抜粋によって構成されている。例えば、上述の2つ目のグループには、以下のテキストなどが含まれている:

  1. 導入文
  2. メアリー・ウォートリー・モンターギュ婦人が執筆した5通の手紙
  3. スウィフトの「ガリヴァー旅行記」の抜粋
  4. アレクサンダー・ポープによる2編の詩
  5. ボスウェルの日誌からの2つの抜粋
  6. ウィリアム・ブレイクによる詩

 それぞれの文章のグループの前にはその著者の簡潔な紹介がある。抜粋の中には、非常に長く、複数の章などの区分が含まれているものもあるが、極めて短いものもある。上述のリストが示している通り、含まれているテキストは詩や散文、日誌、手紙など様々な種類の文章である。

 そのような選集を符号化する最も簡単な方法は、抜粋した個別のテキストをそれぞれ独立したものとして扱うことである。1人の著者による一連のテキストとその前にある著者紹介は1つにまとめることで、より大きな区分け(部)であるgroup要素内の1つのgroup要素として扱うことができるのである。1つの部をなす一連のテキストも同様に扱って、その部の導入文と合わせて作品内の単一のgroup要素として捉えることができる。概略的には以下の通りである:

<text>
<!– the whole anthology –>
 <front>
<!– title page, acknowledgments, introductory essay –>
 </front>
 <group>
<!– body of anthology starts here –>
  <group>
   <head>The Beginnings</head>
<!– sequence of texts or groups –>
  </group>
  <group>
<!– The Eighteenth Century and the Grand Tour –>
   <text>
<!– prefatory essay by editor –>
   </text>
   <group>
<!– Section on Lady Mary Wortley Montagu starts –>
    <text>
<!– biographical notice by editor –>
    </text>
    <text>
<!– first letter –>
    </text>
    <text>
<!– second letter –>
    </text>
<!– … –>
   </group>
<!– end of Montagu section –>
   <text>
<!– single text by Jonathan Swift starts –>
    <front>
<!– biographical notice by editor –>
    </front>
    <body/>
   </text>
<!– end of Swift section –>
   <group>
<!– Section on Alexander Pope starts –>
    <text>
<!– biographical notice by editor –>
    </text>
    <text>
<!– first poem –>
    </text>
    <text>
<!– second poem –>
    </text>
   </group>
<!– end of Pope section –>
<!– … –>
  </group>
<!– end of 18th century section –>
  <group>
   <head>The Heyday</head>
<!– texts and subgroups –>
  </group>
<!– … –>
 </group>
<!– end of the anthology proper –>
 <back>
<!– back matter for anthology –>
 </back>
</text>
bibliography 

 編者による各著者に関する紹介文は、独自のテキストとして扱っても良いし(上の例のメアリー・ウォートリー・モンターギュ婦人やアレクサンダー・ポープに関するエッセイなどのように)、スウィフトに関するエッセイがそうであったように埋め込まれたテキストの前付として扱っても良い。本例における処理は意図的に一貫性に欠けるようになっており、両者のアプローチを比較できるようにしている。スウィフトの節を、スウィフトによるテキストと編者によるテキストを含んだgroupとして扱うか、編者による紹介文を前付けとして含んだtext要素としてモンターギュやポープの節を扱うことで、一貫性を達成できる。後者の方法により符号化すると、ポープの節は以下のようになる:

<text>
<!– Section on Alexander Pope starts –>
 <front>
<!– biographical notice by editor –>
 </front>
 <group>
  <text>
<!– first poem –>
  </text>
  <text>
<!– second poem –>
  </text>
 </group>
</text>
<!– end of Pope section–>
bibliography 

 「18世紀とグランド・ツアー(The Eighteenth Century and the Grand Tour)」などの大きなセクションの導入エッセイも、同じように、大きなセクションをgroup要素としてではなくtext要素として扱うことで、前付 (`front’ matter) として符号化できる。

 この場合のように、選集に異なる種類のテキスト(例えば、散文と劇、文字起こししたスピーチと辞書の項目、または手紙と詩など)が含まれる場合は、当然のことながら符号化に用いる要素は複数のモジュールに属するものを使うことになる。第3章全TEI文書で利用可能な要素で記述されたコア・モジュールの提供する要素は、1つの集成に散文、劇、および韻文がまとめられているような、ほとんどの単純な目的においては充分なはずである。

 コモンプレイス・ブックなどの短い抜き書きの寄せ集めについては、各々の抜粋を単独のテキストではなく単純な引用やcit要素として捉える方が望ましいことも多い。この種の引用を符号化するためには以下の構成素レベルの要素を用いることができる:

  • cit (cited quotation) 書誌参照を伴い、他の文書からの引用であること示す.例えば、辞書の場合には、当該単語が、説明されている意味で使われている例文を示したり、翻訳や用例を示したりする.
  • quote (quotation) 語り手や著者が、当該テキスト外のものであるとした一節を示す.

 例えば、メルヴィルのモービー・ディックの前付に現れる「抜粋 (Extracts)」の章は以下のように符号化できる:

<div n=”2″ type=”chap”>
 <head>Extracts</head>
 <head>(Supplied by a sub-sub-Librarian)</head>
 <p>It will be seen that this mere painstaking burrower and
   grubworm of a poor devil of a Sub-Sub appears to have gone
   through the long Vaticans and street-stalls of the earth,
   picking up whatever random allusions to whales he could
   anyways find …
   Here ye strike but splintered hearts together — there,
   ye shall strike unsplinterable glasses!</p>
 <p>
  <cit>
   <quote>And God created great whales.</quote>
   <bibl>Genesis</bibl>
  </cit>
  <cit>
   <quote>
    <l>Leviathan maketh a path to shine after him;</l>
    <l>One would think the deep to be hoary.</l>
   </quote>
   <bibl>Job</bibl>
  </cit>
  <cit>
   <quote>By art is created that great Leviathan,
       called a Commonwealth or State — (in Latin,
   <mentioned xml:lang=”la”>civitas</mentioned>), which
       is but an artificial man.</quote>
   <bibl>Opening sentence of Hobbes’s Leviathan</bibl>
  </cit>
 </p>
</div>
bibliography 

quotebibl要素の使用に関する詳しい情報についてはそれぞれ3.3.3節引用と3.11節引用文献と参考文献を参照すること。

4.3.2 フローティングテキスト

これまで述べてきた単体テキスト構造や複合体テキスト構造の重要な特性として、これらの構造が、数学で平面充填(テッセレーション、タイル貼り)として知られる、各階層において符号化対象のテキスト全体を(または区分を)埋め尽くすものを形成していると捉えられる点がある。XML文書が単一のツリーを含む1つのルート要素を有し、各ノードが適切に入れ子になっているサブツリーを形成しているのと同様に、テキストの内部構造を階層的に分解可能な下位区分として捉え、それぞれが適切に入れ子になったサブツリーであると考えることは自然のように思われる。これは大部分の文書については間違いなく正しいが、全てに当てはまるわけではない。特に、当該レベルで部分的にしか平面充填していないテキストについては該当しない。例えば、部分Bが部分Aの前後に来るような形でテキストAがテキストBに含まれている場合、B全体を平面充填することはできない。そのような場合、テキストAのことを「フローティングテキスト」と呼ぶ。

floatingText要素はmodel.divPartクラスのメンバーであり、そのため段落と同じようにどの区分レベルの要素においても現れることができる。例えば、『デカメロン』や『アラビアンナイト』などのテキストは、多くのフローティングテキストが別の1つのテキスト(つまり枠物語)に埋め込まれていると捉えるほうが、枠物語を前付あるいは後付と考えてバラバラのテキストの集まりと捉えるよりも良いだろう。

例として、ジェーン・バーカーによる18世紀のテキストであるThe Lining to the Patch-Work Screen(1726、「パッチワーク屏風への裏地」)を検討する。この長ったらしい語りは(作品のタイトルが示すように)1つのパッチワークのなかで100近い個別の「物語」を埋め込んでいる。本作品は中心人物ガレシアの紹介から始まるが、数ページ後には全く別の語りとしてマンリー船長の物語に入る:

<p>Galecia one Evening setting alone in her Chamber by a clear Fire,
and a clean Hearth […] reflected on the Providence of our
All-wise and Gracious Creator […] </p>
<p>She was thus ruminating, when a Gentleman enter’d the Room, the
Door being a jar […] calling for a Candle, she beg’d a thousand
Pardons, engaged him to sit down, and let her know, what had so long
conceal’d him from her Correspondence.
</p>
<pb n=”5″/>
<floatingText>
 <body>
  <head>The Story of <hi>Captain Manly</hi>
  </head>
  <p>Dear Galecia, said he, though you partly know the loose, or rather
     lewd Life that I led in my Youth; yet I can’t forbear relating part of
     it to you by way of Abhorrence…
  
<!– Captain Manly’s story here –>
     I had lost and spent all I had in the World; in which I verified the
     Old Proverb, That a Rolling Stone never gathers Moss,
  </p>
 </body>
</floatingText>
<pb n=”37″/>
bibliography 

 マンリー船長の物語が終わると我々はガレシアの話題に戻るが、すぐさまさらなる2つの物語に突入する。しかし、ガレシアの語りが各テキストの間に差し挟まれるのであり、そのためこれらの物語をfloatingTextsとして表現する:

<p>The Gentleman having finish’d his Story, Galecia waited on him to
the Stairs-head; and at her return, casting her Eyes on the Table, she
saw lying there an old dirty rumpled Book, and found in it the
following story: </p>
<floatingText>
 <body>
  <p> IN the time of the Holy War when
     Christians from all parts went into the Holy Land to oppose the Turks;
     Amongst these there was a certain English Knight…</p>
<!– rest of story here –>
  <p>The King graciously pardoned the Knight; Richard was kindly receiv’d
     into his Convent, and all things went on in good order: But from hence
     came the Proverb, We must not strike <hi>Robert</hi> for
  <hi>Richard.</hi>
  </p>
 </body>
</floatingText>
<pb n=”43″/>
<p>By this time Galecia’s Maid brought up her Supper; after which she
cast her Eyes again on the foresaid little Book, where she found the
following Story, which she read through before she went to bed.
</p>
<floatingText>
 <body>
  <head>The Cause of the Moors Overrunning
  <hi>Spain</hi>
  </head>
  <p>King ———— of Spain at his Death, committed the Government of his
     Kingdom to his Brother Don ——— till his little Son should come of
     Age …</p>
  <p>Thus the little Story ended, without telling what Misery
     befel the King and Kingdom, by the Moors, who over ran the Country for
     many Years after. To which, we may well apply the Proverb,
  <quote>
    <l>Who drives the Devil’s Stages,</l>
    <l>Deserves the Devil’s Wages</l>
   </quote>
  </p>
 </body>
</floatingText>
<p>The reading this Trifle of a Story detained Galecia from her Rest
beyond her usual Hour; for she slept so sound the next Morning, that
she did not rise, till a Lady’s Footman came to tell her, that his
Lady and another or two were coming to breakfast with her…
</p>
bibliography 

これ以外の複数の語りの混在するテキストでは、入れ子になった個々の物語が枠物語よりも大きな意味合いを持っていることがあり、そのため枠物語の断片をそれぞれの入れ子になった物語と関係する前付または後付として扱う方が望ましい場合がある。これはよく見られるもので、例えばチョーサーの『カンタベリー物語』などのテキストなどがこれに当てはまる。カンタベリー物語では、語り手が紹介されている前付と(話を聞いた)巡礼者たちがコメントする後付とが、それぞれの物語に伴っている。

floatingTextquoteの使用法を区別することは重要である。quoteのセマンティクスはその内容が現行のテキストの外部にある出典から来ていることを示しているのに対し、floatingTextはそのような意味合いを持たず、不連続な「取り込み」として表現されるテキストの部分を符号化するために、FloatingTextが提供するより豊かなコンテンツモデルを必要とするときに使われるに過ぎない。場合によっては、そのような「取り込み」を外的なもの(例えば同封物、付録など)であると見なせばよいが、上述の例のように、含まれているテキストが外来のものであるという印を持たないことも多い。

floatingTextquoteは組み合わせて使用することもできる。長い引用を伴う豊かな内部構造を持つテキストでは、floatingTextquoteの中で用いることも考えられる。また、単体テキストのように、floatingTextもそれぞれがquote要素で符号化された複数の引用セクションを含む場合もある。

4.4 バーチャルな区分

当該文書の別の部分や別の文書から取り出せるなどの理由で1つの区分全体を自動的に生成できる場合、この区分を明示的に記述せず、代わりに処理命令か、それ専用のdivGen要素を用いることでその場所に単にタグを書くだけでこと足りる:

  • divGen (自動生成されたテキスト区分) ソフトウェアで自動生成されたテキスト部分の場所を示す.

本要素はmodel.divGenLikeクラスから提供されており、同クラスの唯一の要素である。divGen要素はatt.typedクラスのメンバーであり、@type属性や@subtype属性を継承している。divdiv1 (やdiv2などの) 要素が現れうる箇所に現れることができる。

例えば、ある作品の目次(toc)がテキスト内の各div要素から最初のhead要素を複製するだけで簡単に取り出せるのであれば、次の通り符号化したほうが簡単かもしれない:

<divGen type=”toc”/>
bibliography 

同様に、何らかの転写のテキストとその翻訳を組み合わせたデジタル版では、転写テキストとその翻訳文、および両者を対照させたバージョンを3つの別々の区分として表すことが望ましいかもしれない。これは以下のように符号化することで表現できる:

<div>
<!– transcript here–>
</div>
<div>
<!– translation here –>
</div>
<divGen type=”alignment”/>
bibliography 

divGen要素をレンダリングした場合に実施する処理は使用しているアプリケーション・プログラムやスタイルシートによって決まる。このようなTEIマークアップの機能は単にバーチャルな区分を生成する場所を特定し、生成される区分の種類についていくぶんかの情報を与えることにすぎない。その意味ではある種の特殊な処理命令ともみなせ、また適当な処理命令で置き換えうるものである。

4.5 前付

ここで言う前付とは、(必須ではないが、通常は印刷された)テキスト中の独立したセクションであり、その成果物の一部として導入や説明のためにテキストの前に置かれている。タイトルページや序文などがわかりやすい例である。また、比較的分かりにくい例としては演劇のプロローグなどがある。符号化テキストの前付はTEIヘッダーと混同すべきではない。これに関しては第2章TEIヘッダーで記述されており、符号化しているテキストではなくコンピューターファイルの前付のようなものとして機能している。

作品の元のかたちに関心がないなどの理由により、単純にテキストの前付けを無視することも選択しても良いし、あるいは、前付けの一部または全てをfront要素の構成要素としてテキスト内に含める価値があると捉えても良い。1

タイトルページは例外として(これについては4.6節タイトルページを参照すること)、前付はテキスト全体で使用しているのと同じ要素を用いて符号化すべきである。本文の区分と同じく、前付内の様々な下位区分のための専用のタグはなく、番号付きか番号なしのdiv要素を用いればよい。前付特有の様々な区分を区別する上で、@type属性として以下に提案する値2を用いることができる:

preface

著者または出版者がテキストの内容や目的、あるいは起源について読者に説明する序文や前置き。

ack

テキストの作成にあたり貢献した個人や機関にたいして著者が述べる改まった謝辞。

dedication

著者による1名以上の個人や1つ以上の機関にテキストを捧げる改まった献辞。

abstract

テキストの内容に関するひとまとまりの要約文。

contents

作品の構造を示しその構成要素を列挙する目次。この構造をマークする際にはlist要素を用いる。

frontispiece

口絵。何らかのテキストを含むこともある。

以下の長めの例ではテキストの前付における様々な部分をどのように符号化すればよいのかを示している。最初の部分はタイトルページから始まる(4.6節タイトルページ)。その後に献呈の辞と序文が続き、それぞれが別々のdivとして符号化されている:

<div type=”dedication”>
 <p>To my parents, Ida and Max Fish</p>
</div>
<div type=”preface”>
 <head>Preface</head>
 <p>The answer this book gives to its title question is <q>there is
     and there isn’t</q>.</p>
 <p>Chapters 1–12 have been previously published in the
   following journals and collections:
 <list>
   <item>chapters 1 and 3 in <title>New literary History</title>
   </item>
   <item>chapter 10 in <title>Boundary II</title> (1980)</item>
  </list>.
   I am grateful for permission to reprint.</p>
 <signed>S.F.</signed>
</div>
bibliography 

この前付は続けて以下の例のようなdiv要素で締めくくられており、それはlist要素(3.8節リスト参照)を用いた目次を含んでいる。ここで、該当箇所の参照をするためにptr要素を使用している点に注目していただきたい。目標 (target) となる識別子(fish1、fish2など)がテキストの章を含むdiv要素の識別子と対応しているということである。(ptr要素については3.7節単純なリンクとクロスリファレンスを参照すること。)

<div type=”contents”>
 <head>Contents</head>
 <list>
  <item>Introduction, or How I stopped Worrying and Learned to Love
     Interpretation <ptr target=”#fish1″/>
  </item>
  <item>
   <list>
    <head>Part One: Literature in the Reader</head>
    <item n=”1″>Literature in the Reader: Affective Stylistics
    <ptr target=”#fish2″/>
    </item>
    <item n=”2″>What is Stylistics and Why Are They Saying Such
         Terrible Things About It? <ptr target=”#fish3″/>
    </item>
   </list>
  </item>
 </list>
</div>
<div xml:id=”fish1″>
 <head>Introduction</head>
<!– … –>
</div>
<div xml:id=”fish2″>
 <head>Literature in the Reader</head>
<!– … –>
</div>
<div xml:id=”fish3″>
 <head>What is stylistics?</head>
<!– … –>
</div>
bibliography 

あるいは、文書内に章の始まりに対応するページ区切り要素が含まれていれば、目次内の参照要素はそこへリンクすることもできる:

<!– … –><item n=”1″>Literature in the Reader: Affective Stylistics
<ref target=”#fish-p24″>24</ref>
</item>
<!– … –>
<div type=”chapter”>
 <head>Literature in the Reader</head>
 <pb xml:id=”fish-p24″/>
<!– … –>
</div>
<!– … –>

以下の例では番号付きの区分を用いて中世のテキストの前付を符号化している。この場合では現代で言うところのタイトルページが存在しておらず、タイトルは単純に前付の先頭にある見出しとして与えられている点に注意していただきたい。また、div要素に@type属性を用いることで、現代的な書籍では比較的珍しい巻頭の祈祷文などの文書要素を明示できる点も注目しておきたい:

<front>
 <div1 type=”incipit”>
  <p>Here bygynniþ a book of contemplacyon, þe whiche
     is clepyd <title>þE CLOWDE OF VNKNOWYNG</title>,
     in þe whiche a soule is onyd wiþ GOD.</p>
 </div1>
 <div1 type=”prayer”>
  <head>Here biginneþ þe preyer on þe prologe.</head>
  <p>God, unto whom alle hertes ben open, & unto whome alle wille
     spekiþ, & unto whom no priue þing is hid: I beseche
     þee so for to clense þe entent of myn hert wiþ þe
     unspekable 3ift of þi grace, þat I may parfiteliche
     loue þee & worþilich preise þee. Amen.</p>
 </div1>
 <div1 type=”preface”>
  <head>Here biginneþ þe prolog.</head>
  <p>In þe name of þe Fader & of þe Sone &
     of þe Holy Goost.</p>
  <p>I charge þee & I beseeche þee, wiþ as moche
     power & vertewe as þe bonde of charite is sufficient
     to suffre, what-so-euer þou be þat þis book schalt
     haue in possession …</p>
 </div1>
 <div1 type=”contents”>
  <head>Here biginneþ a table of þe chapitres.</head>
  <list>
   <label>þe first chapitre </label>
   <item>Of foure degrees of Cristen mens leuing; & of þe
       cours of his cleping þat þis book was maad vnto.</item>
   <label>þe secound chapitre</label>
   <item>A schort stering to meeknes & to þe werk of þis
       book</item>
   <label>þe fiue and seuenti chapitre</label>
   <item>Of somme certein tokenes bi þe whiche a man may proue
       wheþer he be clepid of God to worche in þis werk.</item>
  </list>
  <trailer>& here eendeþ þe table of þe chapitres.</trailer>
 </div1>
</front>
bibliography

ただし、テキストの他の部分から目次を自動的に生成できる場合、空のdivGen要素を用いるか適切な処理命令を用いることにより、そこに目次があるということだけを符号化する方が望ましいこともある。

4.6 タイトルページ

記述的書誌や版本の目録作成において、古い版本や写本のタイトルページや前付など (preliminaries) の詳細な分析は大いに重要であるが、そのような分析はここで提案しているモジュールよりもさらに専門的なモジュールが必要となることがある。ここでは、タイトルページに主に含まれるものを符号化する手段として、以下の要素を提案する:

  • titlePage (title page) 前付けや後付け中にある、テキストのタイトルページを示す.
  • docTitle (document title) 当該文書のタイトルを示す.タイトルページにあるタイトルの全情報を含む.
  • titlePart タイトルページに示されている、作品タイトルの下位部分を示す.
@type 当該タイトルにおける、当該下位部分の役割を示す. 提案する値は以下の通り: 1] main; 2] sub (subordinate); 3] alt (alternate); 4] short; 5] desc (descriptive)
  • argument 下位部分におけるテキストのトピックの形式的なリストまたは文章での説明を含む.
  • byline タイトルページや作品の冒頭や最後にある、作品の責任者を表す主要な記述.
  • docAuthor (document author) タイトルページにある当該文書の著者名を示す (いつもではないがしばしばbylineに含まれる).
  • epigraph 章や節の始め、タイトルページなどにある引用(題辞)を示す.
  • imprimatur 作品の出版に関する公式の情報を示す.場合によっては、タイトルページや その左ページに出現する必要がある.
  • docEdition (document edition) タイトルページにある当該文書の版を示す.
  • docImprint (document imprint) 刊記にある出版関連情報を示す.例えば、出版日、出版者名など.一般には タイトルページの下にある.
  • docDate (document date) 文書の日付を示す.一般にはタイトルページに書かれている.
  • graphic テキスト列中にある図、絵、図表の場所を示す.

第14章表、数式、画像、楽譜で記述しているfigure要素とともに、これらの要素はmodel.titlepagePartクラスを形成している [訳注:この記述は間違いで、figure要素はmodel.titlepagePartクラスのメンバーではない]。このクラスの要素はいくつでもtitlePage要素内にまとめて現れることができる。figure要素はタイトルページにおける複雑な非テキスト型の構成要素があることを記録できるようにするために含まれている、印刷者の花形(ornament)や挿絵などの簡単なケースについては、3.10節図とその他の非テキスト型の構成要素で述べたgraphic要素で充分対応できるはずである。

上述の要素とhead要素はmodel.pLike.frontクラスにも含まれる。このクラスの要素は親要素で囲む必要がなくfront要素の直下で使用し、タイトルページを最小限で完全に記述できる。

どちらかのクラスに新規要素を追加したい場合は、23.3節カスタム化で説明している方法を使うことができる。これらの要素を使った例を、以下に2つあげる。まず、本節で既に触れた作品のタイトルページである:

<front>
 <titlePage>
  <docTitle>
   <titlePart type=”main”>Is There a Text in This Class?</titlePart>
   <titlePart type=”sub”>The Authority of Interpretive Communities</titlePart>
  </docTitle>
  <docAuthor>Stanley Fish</docAuthor>
  <docImprint>
   <publisher>Harvard University Press</publisher>
   <pubPlace>Cambridge, Massachusetts</pubPlace>
   <pubPlace>London, England</pubPlace>
  </docImprint>
 </titlePage>
</front>
bibliography 

次に、特徴的なほどくどい17世紀の例を示す。ここで、元のテキストに対しlbタグを使用して改行を符号化する必要があった点に注目していただきたい:

<titlePage>
 <docTitle>
  <titlePart type=”main”>THE
  <lb/>Pilgrim’s Progress
  <lb/>FROM
  <lb/>THIS WORLD,
  <lb/>TO
  <lb/>That which is to come:</titlePart>
  <titlePart type=”sub”>Delivered under the Similitude of a
  <lb/>DREAM</titlePart>
  <titlePart type=”desc”>Wherein is Discovered,
  <lb/>The manner of his setting out,
  <lb/>His Dangerous Journey; And safe
  <lb/>Arrival at the Desired Countrey.</titlePart>
 </docTitle>
 <epigraph>
  <cit>
   <quote>I have used Similitudes,</quote>
   <bibl>Hos. 12.10</bibl>
  </cit>
 </epigraph>
 <byline>By <docAuthor>John Bunyan</docAuthor>.</byline>
 <imprimatur>Licensed and Entred according to Order.</imprimatur>
 <docImprint>
  <pubPlace>LONDON,</pubPlace>
   Printed for <name>Nath. Ponder</name>
  <lb/>at the <name>Peacock</name> in the <name>Poultrey</name>
  <lb/>near <name>Cornhil</name>, <docDate>1678</docDate>.
 </docImprint>
</titlePage>
bibliography 

ここで示しているように、元々のタイトルページの際立った特徴を符号化することも重要であると考えられる場合、2.3.4 タグ付け宣言で示した技法も役に立つ。

タイトルページを符号化している場合、その物理的な描出 (rendition) は極めて重要であることが多い。これを解決する1つの方法は第16章リンク付け、分割、整列で記述しているsegタグの使用であり、タイトルページの各部分の印刷に関する内容を分割し、その描出を指定するためにグローバルな@rend属性を用いる。

もう1つのアプローチはページ、行、罫線などの印刷面の記述に向けて特化し、行間や行送り、字詰めの程度、フォントなどを記述するための専用の属性を備えているモジュールを活用することである。これらの問題に関するさらなる説明は第11章一次情報源の表現で提供している。

4.7 後付

どの要素が後付としてグループ化され、どれが前付にグループ化されるのかという慣習は様々に異なる。例えば、目次を前の方に配置している書籍もあれば、後ろの方に配置している書籍もある。タイトルページでさえ書籍の表紙としても裏表紙としても現れることがある。そのため、backfrontの両要素はコンテンツモデルが同一である。

後付における様々な区分の特性を区別するため、以下の値は全ての区分要素の@type属性に用いることができる:

‘appendix’

作品の補助的で自己完結型のセクションであり、ふつう本文に対する追加ではあるが、ある意味で本文に含まれないテキスト。

‘glossary’

用語とその定義の一覧。これは<list type=”gloss”>として符号化すべきである(3.7節リストを参照すること)。

‘notes’

テキストやその他の種類の注記を一か所にまとめたセクション。

‘bibliogr’

参考文献の一覧。これはlistBiblとして符号化すべきである(3.11節引用文献と参考文献を参照すること)。

‘index’

作品への形式を問わない索引。

‘colophon’ 書籍の巻末に記載されている、成立状況を記述した文言。コロフォン。

現時点では後付の符号化について追加の要素は提案されていない。以下にいくつかの特徴的な例を示す。まずは索引 (index) である(転写に値するほど、印字されている索引に充分関心がある場合):

<back>
 <div type=”index”>
  <head>Index</head>
  <list type=”index”>
   <item>Actors, public, paid for the contempt attending
       their profession, <ref>263</ref>
   </item>
   <item>Africa, cause assigned for the barbarous state of
       the interior parts of that continent, <ref>125</ref>
   </item>
   <item>Agriculture
   <list type=”indexentry”>
     <item>ancient policy of Europe unfavourable to, <ref>371</ref>
     </item>
     <item>artificers necessary to carry it on, <ref>481</ref>
     </item>
     <item>cattle and tillage mutually improve each other, <ref>325</ref>
     </item>
     <item>wealth arising from more solid than that which proceeds
           from commerce <ref>520</ref>
     </item>
    </list>
   </item>
   <item>Alehouses, the number of, not the efficient cause of drunkenness, <ref>461</ref>
   </item>
  </list>
 </div>
</back>
bibliography 

ここで、元資料における頁区切りが明示的に符号化され識別子が与えられている場合、上述の元資料における頁数への参照はリンクとして記録でき、より便利になる。例えば、元資料の461頁の符号化が以下の通り始まるとする:

<pb xml:id=”P461″/>
bibliography 

この場合、上述の最後の項目 (<item>) を以下のいずれかの形式で符号化することでより有用になる:

<item>Alehouses, the number of, not
the efficient cause of drunkenness, <ref target=”#P461″>461</ref>
</item>
<item>Alehouses, the number of, not the efficient cause of drunkenness, <ptr target=”#P461″/>
</item>
bibliography 

次に、書簡形式の後付区分を示す:

<back>
 <div type=”letter”>
  <head>A letter written to his wife, founde with this booke
     after his death.</head>
  <p>The remembrance of the many wrongs offred thee, and thy
     unreproued vertues, adde greater sorrow to my miserable state,
     than I can utter or thou conceiue. …
     … yet trust I in the world to come to find mercie, by the
     merites of my Saiuour to whom I commend thee, and commit
     my soule.</p>
  <signed>Thy repentant husband for his disloyaltie,
  <name>Robert Greene.</name>
  </signed>
  <epigraph xml:lang=”la”>
   <p>Faelicem fuisse infaustum</p>
  </epigraph>
  <trailer>FINIS</trailer>
 </div>
</back>
bibliography 

そして最後に、疑似書簡的な特徴を有する正誤表と補遺のリスト:

<back>
 <div type=”corrigenda”>
  <head>Addenda</head>
  <salute xml:lang=”la”>M. Scriblerus Lectori</salute>
  <p>Once more, gentle reader I appeal unto thee, from the shameful
     ignorance of the Editor, by whom Our own Specimen of
  <name>Virgil</name> hath been mangled in such miserable manner, that
     scarce without tears can we behold it. At the very entrance, Instead
     of <q xml:lang=”grc”>προλεγομενα</q>, lo!
  <q xml:lang=”grc”>προλεγωμενα</q> with an Omega!
     and in the same line <q xml:lang=”la”>consulâs</q> with a circumflex!
     In the next page thou findest <q xml:lang=”la”>leviter perlabere</q>,
     which his ignorance took to be the infinitive mood of
  <q xml:lang=”la”>perlabor</q> but ought to be
  <q xml:lang=”la”>perlabi</q> … Wipe away all these
     monsters, Reader, with thy quill.</p>
 </div>
</back>
bibliography 

4.8 デフォルトのテキスト構造のモジュール

本章で記述したモジュールには以下の構成要素が含まれている:

Module textstructure: Default text structure

TEIスキーマを形成するモジュールの選定と組み合わせについては1.2 TEIスキーマの定義で記述している。

↑ TEI P5ガイドライン « 3 全TEI文書で利用可能な要素 » 5 文字、グリフ、書字モード


この章の訳者

中川奈津子(国立国語研究所)
永﨑研宣(一般財団法人 人文情報学研究所)
岡田一祐(北海学園大学)
石田友梨(岡山大学)
宮川創(京都大学)
小川潤(東京大学)
王一凡(東京大学)
ほか
TEI協会 東アジア/日本語分科会


注釈

  1. この判断はヘッダーのsamplingDecl要素に記録すべきである
  2. 属性に関する全ての「提案値」のリストと同じく、TEIに準拠したテキストを扱うように書かれたソフトウェアが本リスト内の値にユーザーを限定させることなく、これらの値が生起した際に値を認識し扱えるようにソフトウェアを準備することを推奨する。