講義

基礎科目

人文情報学概論Ⅰ (S1+S2)

担当|下田正弘 / 大向一輝 / 永崎研宣

日時|水曜日5限(16:50-18:35)

座学と実習を軸として、人文情報学の基礎的な考え方と実際に必要な技術の学び方について学ぶ。

⇒授業の成果物「デジタル・ヒューマニティーズ入門」日本語訳(2012年度)

2021年度シラバス(抜粋)

長らく紙媒体に依拠してきた人文学は、今や様々な面でデジタル媒体に依拠せざるを得なくなりつつある。人文学の基礎である資料批判の手法は主に紙媒体に対して培ってきたものであり、人文学が学問としての基礎を維持し続けるためには、デジタル媒体の普及という新たな状況に対して資料批判の手法を再構築しなければならない。そして、この過程を通じて、人文学は、資料とそこから得られる情報の意義を再考するとともに、デジタル媒体の示す広汎な可能性に沿って自己を再規定する必要がある。人文情報学(Digital Humanities)は、こうした課題解決のため、人文学研究者と情報学研究者が協働する場として世界で展開しつつある新しい枠組みである。

本授業では、デジタル媒体をも対象とする新たな資料批判の力を身につけることを目指し、この人文情報学の中心的課題である、デジタル媒体時代における人文学にとっての資料と情報に関する問題系の理解を深めるとともに、国内外で取り組まれつつある種々の具体的事例を通して人文情報学の現状を把握し、デジタル媒体に適切に向き合う構えを自律的に形成できる人文学研究者としての素地を涵養する。

各回のテーマは以下の通りである。個々の技術の理解・習得だけでなく、これらの技術が内包する課題や限界、普及の経緯についても触れる。履修者自身が人文学と情報技術の関わりを批判的に捉えつつ、研究活動に生かせるようになることが目的である。なお、各回で紹介するツール・システム等のうち主なものについても挙げているので参考にされたい。

  1. イントロダクション

  2. 人文情報学の歴史

  3. テキスト分析(Voyant Tools・KH Coder・Google ngram viewer)

  4. テキスト構造化(TEIガイドライン)

  5. メタデータ(書誌情報・Zotero)

  6. ネットワーク分析(Palladio・Cytoscape)

  7. マルチメディア情報処理(IIIF)

  8. 時空間情報処理(GIS・HuTime)

  9. デジタルアーカイブ(Omeka)

  10. コラボレーション(みんなで翻刻)

  11. AI(くずし字OCR)

  12. 人文情報学を支えるコミュニティ(学協会・財団・基金等)

  13. まとめ

人文情報学概論Ⅱ (A1+A2)

担当|下田正弘 / 大向一輝 / 永崎研宣

日時|水曜日5限(16:50-18:35)

「人文情報学概論I」の内容をベースとして、より実践的な実習と相互のディスカッションを通じて、受講生が個人プロジェクトを遂行し、最終的には外部の人文情報学関連の研究発表会等で発表できることを目指す。

受講生の感想

⇒授業の成果物

「歴史研究のための財務記録史料マークアップ手法」日本語訳(2014年度)

テキスト分析ツールVoyant-toolsの日本語インターフェイス(2016年度)

欧州DARIAHによるDHのMOOCへの日本語字幕 (2018年度)

⇒授業から発展したDH活動報告

小風尚樹「歴史研究とデジタル・ヒューマニティーズの相関」

2021年度シラバス(抜粋)

本授業では、Sセメスターの人文情報学概論Ⅰの内容を前提としつつ、方法論的共有地(Methodological Commons)としての人文情報学(Digital Humanities)の理解を深めると同時に、人文学そのものに対する俯瞰的な視点を獲得することを目指す。

各回のテーマは以下の通りである。Sセメスターの人文情報学概論Ⅰを踏まえ、人文情報学を取り巻く領域の理解や社会との関わりについて議論する。履修者自身が人文学と情報技術の関わりを批判的に捉えつつ、研究活動に生かせるようになることが目的である。

  1. イントロダクション

  2. 人文情報学への批判的視座(Methodological Commons・Scholarly Primitives)

  3. コンピュータの理解(アーキテクチャ・プログラムの原理)

  4. インターネットの理解(ウェブ)

  5. 文字コードと人文情報学(Unicode)

  6. 知識の表現と利活用(RDF・語彙・固有表現)

  7. 知的財産権の理解(著作権・Creative Commons・パブリックドメイン)

  8. 技術標準と人文情報学

  9. デジタル化と長期保存

  10. 大規模情報インフラの事例1(SAT大蔵経テキストデータベース)

  11. 大規模情報インフラの事例2(CiNii)

  12. 人文情報学の研究事例レビュー

  13. まとめ

デジタル・ヒューマニティーズ入門 (S1+S2)

担当|下田正弘 / 大向一輝 / ゲスト講師

日時|火曜日5限(16:50-18:35)

ゲスト講師による人文情報学の最先端の取り組みに関するオムニバス形式での講義。

2021年度シラバス(抜粋)

デジタル技術は、人類の知的資源の保存、研究、発信の方法を大きく変えて、情報社会の新しい知識基盤を形成している。この変化に対応すべく、デジタル媒体による学術資料のアーカイビング、文化コンテンツの分析、学術成果の公開や展示の方法などを、文系・理系の枠組みを横断して研究する「デジタル・ヒューマニティーズ」の動きが世界的に拡がっている。

本講義では、このような世界的な動向を踏まえて、デジタル技術を批判的に用いた「知」の形成をどのように実践していくか、大学院横断型教育プログラム「デジタル・ヒューマニティーズ」に関わる講師がオムニバス形式で講義を展開する。

一講義につき一人の講師が登壇し、各講師の研究テーマを中心に、様々なトピックを紹介していく。

主な講義内容としては、文化資源のアーカイブ構築、映像や音響の分析、知識の構造化や可視化の技術、デジタル・メディアによる表現や展示の方法、人文学における情報技術の活用などがあり、受講生がデジタル・ヒューマニティーズに関する基礎的な知識を習得することを目的とする。

応用科目

人文情報学研究Ⅰ (S1+S2)

担当|高橋晃一 / 大向一輝 / 永崎研宣

日時|金曜日2限(10:25-12:10)

人文学のためのテキスト・知識の構造化

本授業では、まず、欧米におけるこの種の一連の取り組み、とりわけ、その中心となってきたTEI (Text Encoding Initiative) Guidelinesを通じて人文学がこれまで積み重ねてきたデジタル技術による暗黙知の明示的構造化の状況について理解する。また、関連する知識構造化に関わる他の技術や規格についても受講生の関心に応じて取り扱う。

2021年度シラバス(抜粋)

人文学におけるこれまでの研究は、紙媒体を前提として長く育まれてきた膨大な暗黙知によって成立し発展してきた。この暗黙知を意識する必要が出てきたのはデジタル媒体を避けて通れない状況が現出したからに他ならない。欧米ではすでに30年にわたるTEI(Text Encoding Initiative)ガイドラインへの取り組みにより、西洋中世写本研究から言語コーパスに至るまで、テキストに内在する暗黙的な構造を明らかにしてデジタル媒体へと還元してきており、欧米で発展するデジタル・ヒューマニティーズにおける「方法論の共有地(Methodological Commons)」という基本理念を体現してきた。一方、日本をはじめとする非欧米文化圏の人文学は未だこの動向への参画が決して十分とは言えず、ここから学び得ることは少なくない。

また、ウェブを中心としたデジタル学術情報基盤の世界では、研究データや資料を相互に接続し知識基盤を構築する枠組みとしてRDF(Resource Description Framework)が浸透しつつあり、さらに、専門分野における概念同士の関係性や人物・地名の関係といった知識の記述自体にもこれを用いようとする動きが広まりつつある。

そこで、本授業では、二つの柱を立てる。まず、TEIガイドラインを通じて人文学がこれまで積み重ねてきたデジタル技術による暗黙知の明示的構造化の状況について理解する。次に、RDFを扱うことで、資料を接続し知識を構造化する枠組みへの取り組み方を習得する。そのようにして、洋の東西を問わず、取り組む研究課題を素材としてその可能性について検討し、デジタル媒体を前提とした研究環境へと適切に対応できるようになるための基礎を涵養することを目指す。

本授業では、まず、データの構造化の基本的な考え方について学び、マークアップ言語として広く用いられているXMLの基本を習得した上で、TEIガイドラインの学習に進む。

当初のTEIは大きな技術的な制約の下で取り組みが進められ、その過程では多くを捨象せざるを得ず、日本語を含む多言語対応も非常に困難なものであった。技術の発展とともに、TEIは多言語対応のみならず様々な複雑な構造にも対応できる形で発展を遂げつつある。一方、これはこのことに取り組む人文学のコミュニティの発展の歴史でもあり、研究者コミュニティのあり方の展開でもある。西洋において発展したこのあり方が東洋では未だ途上にあることについて、とりわけ、2021年のルビの導入に至る議論も踏まえつつ、技術の発展という観点のみならず、国際的な人文学コミュニティの様態という側面にも触れる。

TEIは、実践を通じて理解をより深めることが可能である。したがって、その概要の講義に入った段階から、構造化の実践も含める形で授業を展開する。

もう一つのテーマであるRDFに関しては、その国際的な受容の状況を踏まえつつ、ウェブ上の知識世界への結びつけかたの基本的な考え方とその実際について学ぶ。とりわけ、RDFによる人文知の構造的記述に関しては、現在は実験的な段階であり、理論・実践ともに積極的な取り組みは受講生自身にとっても知的に刺激されることが多いだろう。

TEIにおいてもRDFにおいても、他の様々な人文学向けの情報の構造化に関わる技術・規格とも密接に関連しており、それらについては、受講生の関心に応じて適宜採り上げる。

また、構造化資料は視覚化技術と密接に結びついており、視覚化は構造化の意義を明らかにする手段の一つでもある。視覚化技術の詳細についてはAセメスターの授業で扱うが、本授業においても、構造化の意義を確認することを目指し、簡便に活用可能ないくつかの視覚化手法を扱う。

  1. イントロダクション

  2. XML入門(ツリー構造・タグ・属性・名前空間)

  3. TEI準拠テキストの基本

  4. 人文学のために必要な要素とその付与

  5. テキストの外部要素とのリンク

  6. 作成したテキストの利活用

  7. TEIの処理(XSLT)

  8. その他のマークアップ言語(ドメインごとのマークアップ言語・JSON)

  9. RDF基礎(グラフ構造・トリプル・URI)

  10. RDFの表現と問い合わせ(語彙・SPARQL)

  11. RDFによる知識の構造化(制約・スキーマ言語)

  12. RDFの利活用(Linked Open Data・知識グラフ)

  13. まとめ

人文情報学研究Ⅱ (A1+A2)

担当|高橋晃一 / 大向一輝 / 永崎研宣

日時|金曜日2限(10:25-12:10)

TEIの実践

夏学期の授業に続き、デジタル環境における人文学のための資料の扱いに関する講義と実習を行い、デジタル媒体を前提とした研究環境へと適切に対応できるようになるための基礎を涵養することを目指す。

2021年度シラバス(抜粋)

Sセメスターの授業に続き、デジタル環境における人文学のためのテキスト資料の扱いに関する講義と実習を行い、デジタル媒体を前提とした研究環境へと適切に対応できるようになるための基礎を涵養することを目指す。

ここでは、基本的には実習を中心に行い、受講生は、これまでに習得したテキスト構造化をさらに深めるのみならず、デジタル技術を用いて人文学の構造化資料を視覚的に描画し、それを通じて発見性を高める技法を学ぶ。そして、同時にそのことを批判的に把握する視点をも学ぶことで、多様化するグラフ表現を適切に理解し評価できる知見を涵養する。

本授業では、Sセメスターで習得した人文学資料の構造化の概念を踏まえ、主にTEIガイドラインに関してテキスト資料のより深い構造化の理念と視点について理解することを目指し、講義と実習を行う。特に、校訂テキスト及び言語コーパスについては実例を通じた理解を目指すが、扱う事例はこれに限らず、受講生の関心にも可能な限り配慮する。

また、人文学のために構造化された資料を踏まえ、それを人文学の成果として視覚的に把握するための技術の実習を行う。可視化には静的・動的な手法が可能であり、受講生の関心の方向性に応じて注力する。そして、これを通じて、視覚的に把握することによる問題点や、視覚的な把握の困難さに対する配慮についての講義を実施する。

  1. イントロダクション

  2. テキスト資料の構造とデジタル化

  3. 書簡と地図・年表の紐付け

  4. 書簡と地図・年表の紐付け

  5. 書簡における固有表現の記述

  6. 構造化データの処理・分析

  7. 古典籍と写本情報の記述手法

  8. 古典籍と写本情報の記述手法

  9. 辞書の構造化

  10. 引用・注釈関係の構造化

  11. 構造化データの処理・分析

  12. 構造化データの処理・分析

  13. まとめ

人文情報学の諸相 (A1)

担当|鉄野昌弘 / 高橋典幸 / 祐成保志 / 大向一輝

日時|水曜日5・6限(16:50-20:30)

この授業では、人文社会系諸学における人文情報学的なアプローチの展開、そこでの課題や展望を、複数の専門分野の教員によるリレー形式で考える。本年度は、国文学、社会学、日本史学の3分野を取り上げる。

言語研究における情報処理 (A1+A2)

担当|小林正人

日時|金曜日3限(13:00-14:45)

言語データの検索や分析、さらには言語学の論文作成に役立つ情報処理能力を、Pythonの課題によって習得することを目指す。

人文情報学演習Ⅰ (S1+S2)

担当|大向一輝

日時|月曜日5限(16:50-18:35)

個別の人文学研究に対するデジタル技術の組み込みについてゼミ形式で実践を行う。

2021年度シラバス(抜粋)

人文学研究に対する情報技術の導入にあたっては、各専門分野が受容可能な手続きが求められるとともに、情報学的に妥当な手法でなければならない。これまで人文情報学(Digital Humanities)の分野では両者を総合する議論が行われており、さまざまな知見が蓄積されてきた。一方で、個別具体の研究に対して情報技術が貢献可能な範囲やその方法はケースバイケースであり、事例ごとに詳細に検討すべきである。

本演習では、人文学の修士研究および博士研究に情報技術を取り入れることを希望する参加者同士で議論を行い、共通性の発見や知見の相互補完による課題解決の場を提供する。参加者が習得すべき技術については詳細に解説する。また関連分野の文献や技術のサーベイを通じて人文情報学の最新動向や方法論を把握し、個々の研究の遂行に役立てる。

技術の例:

  • テキスト構造化(XML・TEI)・テキストマイニング・自然言語処理

  • ネットワーク分析

  • 知識の構造化(RDF・知識グラフ)

  • データベース・デジタルアーカイブ

  • マルチメディア・時空間情報処理

本授業の目的は人文情報学の観点からの修士研究・博士研究の支援であるが、希望者には中間目標として研究成果の一部を人文情報学関連の研究会あるいは学会にて発表できるよう論文指導を行う。

研究会・学会の例:

  • 情報処理学会人文科学とコンピュータ研究会(年3回開催)

  • 情報処理学会人文科学とコンピュータシンポジウム(年1回開催)

  • Japanese Association for Digital Humanities(年1回開催)

  • Digital Humanities(年1回開催)

人文情報学演習Ⅱ (A1+A2)

担当|大向一輝

日時|月曜日5限(16:50-18:35)

個別の人文学研究に対するデジタル技術の組み込みについてゼミ形式で実践を行う。

2021年度シラバス(抜粋)

(Sセメスターの人文情報学演習Ⅰと同じ形式で実施します)

人文学研究に対する情報技術の導入にあたっては、各専門分野が受容可能な手続きが求められるとともに、情報学的に妥当な手法でなければならない。これまで人文情報学(Digital Humanities)の分野では両者を総合する議論が行われており、さまざまな知見が蓄積されてきた。一方で、個別具体の研究に対して情報技術が貢献可能な範囲やその方法はケースバイケースであり、事例ごとに詳細に検討すべきである。

本演習では、人文学の修士研究および博士研究に情報技術を取り入れることを希望する参加者同士で議論を行い、共通性の発見や知見の相互補完による課題解決の場を提供する。参加者が習得すべき技術については詳細に解説する。また関連分野の文献や技術のサーベイを通じて人文情報学の最新動向や方法論を把握し、個々の研究の遂行に役立てる。

技術の例:

  • テキスト構造化(XML・TEI)・テキストマイニング・自然言語処理

  • ネットワーク分析

  • 知識の構造化(RDF・知識グラフ)

  • データベース・デジタルアーカイブ

  • マルチメディア・時空間情報処理

本授業の目的は人文情報学の観点からの修士研究・博士研究の支援であるが、希望者には中間目標として研究成果の一部を人文情報学関連の研究会あるいは学会にて発表できるよう論文指導を行う。

研究会・学会の例:

  • 情報処理学会人文科学とコンピュータ研究会(年3回開催)

  • 情報処理学会人文科学とコンピュータシンポジウム(年1回開催)

  • Japanese Association for Digital Humanities(年1回開催)

  • Digital Humanities(年1回開催)

デジタル・ヒューマニティーズ教育プログラム

「デジタル・ヒューマニティーズ教育プログラム」は、東京大学の大学院横断型教育プログラムのひとつです。研究科の枠組みを超えて異なる分野の授業を履修し、所定の単位を修得すると、大学から正式な修了証が授与されます。詳しくは、デジタル・ヒューマニティーズ教育プログラムのページをご覧ください。