研究成果

訓点資料データベースのための画像処理

人文科学研究院/上山あゆみ 教授

研究概要
本研究の目的は、訓点資料における訓点のデータベースを構築することにある。訓点資料とは、漢文を訓読する際に付された「訓点(仮名点、ヲコト点など)」をもつ資料群のことである。訓点資料は、ヲコト点やカナ点によって語彙や語法を、声点から字音声調やアクセントを、返り点などから統語構造を、仮名点の字体から仮名字体の変遷などを知ることができる、情報量の多い資料である。後世の写本でしか残っていない和文資料とは異なり、加点時の原本が残っているため、当時の言語資料としての信頼性が高い。しかし訓点資料は、データ化はおろか、出版・公開されているものすら少なく、研究利用しにくい。そこで、訓点資料に示される様々な情報を兼ね備えた訓点データベースを構築したいと考えた。訓点データベースを構築するために、本研究では、訓点資料の画像処理を通じて、ヲコト点情報の収集方法についての検討を試みた。

続きを読む

本研究の資料には、九大附属図書館蔵『金光明最勝王経』10巻を使用した。ヲコト点の、漢字にみたてた四角(壺という)の位置ごとの読みは、おおよそが解読されている。その図を基に、点の位置を座標化し、また、点の形にも共通の記号を与えることでヲコト点を弁別していくことにした。画像との対象に先んじて、そもそものヲコト点の位置の情報を人の目で弁別しておかなければ、画像上の座標と、ヲコト点の座標の紐づけができないため、まずは人力によるヲコト点のデータ収集を始めた。

しかし、実際は字形によって加点位置はまちまちとなるため、ヲコト点の位置を解読するには、文脈から読みの確かさを検討する必要も生じる。また、一字に複数の加点がある場合、位置の調整がおこなわれることもあり、加点位置が一定でないこともわかった。これらの読みを検討、確定させることを優先したため、画像データとの照合までは至らなかったが、訓点情報の作成とそれによる成果は、今後の研究に対して大きく役立つものとなった。

今後の展望
訓点を一通りデータ化することができたので、これらを使った次の研究が可能となった。画像処理を通じて、ヲコト点の位置を取り出す検討を続けていきたい。また、作成したデータを基に、返り点情報などから、訓読文の作成もある程度自動化できないかも検討していきたい。使用した資料はIIIFによって公開もされているので、画像に訓点情報を貼り付けていくことも可能であるし、訓点情報のほうにもタグ付けなどをして、日本語研究へより利用しやすい形へと作り変えていくことも計画している。

融合分野
人文学、情報学

 

研究キーワード
訓点資料、データベース、画像処理

 

ポスターはこちら

関連する研究者情報
人文科学研究院 教授 上山 あゆみ
人文科学研究院 助教 蛭沼 芽衣
福岡女子短期大学 文化教養学科 講師 藤田 優子
システム情報科学 研究院 教授 内田 誠一
関連リンク
点図(左)と資料の「訓読」例
ヲコト点の座標
訓点のデータ化(一部)