National Institute for Japanese Language and Linguistics
(Ogiso Toshinobu,Takada Tomokazu)
国立国語研究所は日本語研究の中核的拠点として、様々な研究資料や言語資源を整備・公開しています。それらの多くはウェブ上で利用可能となっています。代表的なものとして以下のようなものがあります。
■現代日本語書き言葉均衡コーパス(BCCWJ)
https://pj.ninjal.ac.jp/corpus_center/bccwj/
現代日本語の書き言葉の多様性を把握するために構築したコーパスで、書籍、雑誌、新聞、白書、ウェブ、法律などから無作為に抽出した約1億語のテキストに形態論情報、文書構造タグを付与し、オンラインおよびDVDで公開しています。
■日本語歴史コーパス(CHJ)
https://pj.ninjal.ac.jp/corpus_center/chj/
日本語の歴史を研究するための資料を集めたコーパスです。上代から近代までをカバーする通時コーパスとして開発が進められており、現在は構築済みの部分を公開中です。
■日本語研究・日本語教育文献データベース
https://bibdb.ninjal.ac.jp/bunken/
学術雑誌、論文集等に掲載された日本語関係の論文等のデータベースです。データは定期的に追加され、23万件以上(2019年現在)のデータから文献を検索することが可能です。
■『日本言語地図』(全300図)
https://mmsrv.ninjal.ac.jp/laj_map/
■『方言文法全国地図』(全350図)
https://www2.ninjal.ac.jp/hogen/dp/gaj-pdf/gaj-pdf_index.html
全国の方言の地理的分布を一望することが可能な、方言研究における基礎資料です。
■大英図書館所蔵 天草版『平家物語』『伊曽保物語』『金句集』画像
https://dglb01.ninjal.ac.jp/BL_amakusa/
大英図書館提供の天草版『平家物語』『伊曽保物語』『金句集』(「言葉の和らげ」「難語句解」を含む)のカラー画像(JPEG形式)をパブリックドメインにて公開しています。
ここに挙げたものの他にも多数の資料・資源を公開していますので、どうぞ御活用ください。
https://www.ninjal.ac.jp/
The National Institute for Japanese Language and Linguistics (NINJAL) develops a variety of large-scale resources (corpora and databases) and makes them available to the general public.
https://www.ninjal.ac.jp/english/
■Balanced Corpus of Contemporary Written Japanese (BCCWJ)
https://pj.ninjal.ac.jp/corpus_center/bccwj/en/
This is a corpus created for the purpose of attempting to grasp the diversity of contemporary written Japanese. The data comprises 104.3 million words covering various genres. Morphological information and document structure were annotated to randomly taken samples. BCCWJ is available to the public online as well as a DVD set.
■Corpus of Historical Japanese (CHJ)
https://pj.ninjal.ac.jp/corpus_center/chj/overview-en.html
This corpus collects materials to research the history of the Japanese language. The development of this corpus is ongoing, with a view to producing a diachronic corpus that covers the period from the ancient to the modern times. What is already built is currently available.
■Bibliographic Database of Japanese Language Research
https://bibdb.ninjal.ac.jp/bunken/
This is a database of articles dealing with the Japanese language that have appeared in academic journals and anthologies. New entries are constantly added and the approximately 230,000 articles can be searched for online.
■Linguistic Atlas of Japan
https://mmsrv.ninjal.ac.jp/laj_map/
■Grammar Atlas of Japanese Dialects
https://www2.ninjal.ac.jp/hogen/dp/gaj-pdf/gaj-pdf_index.html
All image data from these two linguistic atlas series, which are compiled and published by NINJAL, can be browsed online.
■Images of the Amakusa edition of Heike monogatari, Isoho monogatari and Kinkushū in the British Library collection
https://dglb01.ninjal.ac.jp/BL_amakusa/en.php
In collaboration with the British Library, this website makes available in the public domain colour JPEG images of Heike monogatari, Isoho monogatari and Kinkushū and the accompanying glossary and vocabulary.