NBDC RDF Portal

NBDC RDF Portal

NBDC RDF Portalは、RDF形式の生命科学データベースを集積したポータルサイトです。RDF形式のデータは相互に参照したり連結することが容易であるため、多種多様な生命科学のデータベースを統合的に活用することが可能となります。本サイトでは、さまざまな研究機関から提供されたRDFデータセットをダウンロードしたり、SPARQL言語による検索を行うことができます。

The NBDC RDF Portal provides a collection of life science datasets in RDF (Resource Description Framework). The portal aims to accelerate integrative utilization of the heterogeneous datasets deposited by various research institutions and groups. In this portal, each dataset comes with a summary, downloadable files and a SPARQL endpoint.

Statistics

Update notes

Views

Datasets

List of RDF datasets with sorting and filtering optionsRDFデータセットのリスト

Statistics

Table of sortable statistics of RDF datasetsRDFデータセットの統計情報

Datasets

Detail

Detail

Detail

Detail

Detailed information of RDF datasets with download links and a SPARQL endpoint各RDFデータセットの詳細とダウンロード、SPARQL検索

Life science databases生命科学データベース

マニュアルManual

Submitting a RDF dataset

Currently, the NBDC RDF portal only accepts submissions from research groups in Japan due to the limitations of human and mechanical resources.

The requirements are RDF file(s), a metadata entry sheet, schema diagram(s) and sample SPARQL queries. Only openly available RDF dataset is accepted. In addition, it is necessary to correspond to NBDC's RDF review process. First of all, if you want to submit the RDF dataset, please contact rdf-portal @ integbio.jp.

Useful links

Datasets

Datasets view shows the list of the RDF datasets sorted by date last updated by default. Each database icon is linked to the corresponding detailed view. User can sort the datasets by alphabetical order, the number of triples or data provider in ascending or descending order by using the control panel in the bottom of the view. User can also filter the datasets by selecting the database categories.

Statistics

Statistics view shows the summary table of statistics of all datasets in this portal.

Links

Links view shows the networks consisting of the links among the RDF datasets in this portal and external datasets, which are listed in the Statistics section of each Details view.

SPARQL

SPARQL endpoint is available against all RDF datasets in this portal. User can execute a SPAQL query written in the query form by clicking the Run Query button. A number of prefixes for major ontologies such as dublin core, dcterms, skos, foaf, xsd, obo are predefined and user can user those prefixes without defining prefixes with @prefix notations. Predefined prefixes are listed in >https://integbio.jp/rdf/sparql?nsdecl< .

Details

Each dataset has its Details view. Details consists of five subsections: Specification, Linked datasets, Statistics, Schema, SPARQL examples and Stanzas.

Specification

Specification section shows meta-data of the dataset: the database categories, the provider, the creators, the latest version, the date issued and the license. The RDF files are also available in this section.

Linked datasets

Linked datasets section shows the statistics of the external links from the dataset. The links in th< form of '>an resource in the dataset< rdfs:seeAlso >an external URI registered in identifiers.org<' are enumerated

Statistics

Statistics section shows the detailed statistics such as the number of each class and property used.

Schema

Schema section shows the schematic image of the RDF model.

SPARQL examples

SPARQL examples section shows example SPARQL queries against the dataset. By clicking the SPARQL button below each query new browser window of the NBDC SPARQL endpoints service will be opened with the example query filled in the query from. User can directly execute the query by clicking the Run Query button below the query form.

Stanzas

Stanza is a web application querying SPRQL endpoints, which is developed by the TogoStanza framework. Stanzas section shows the stanzas using the RDF dataset.

SPARQL samples

Here are some SPARQL query samples against the NBDC RDF portal.

Sample 1

Sample 2

Counts the number of PubMed document citations in each dataset

Sample 3

Retrieve a sample exposed to doxorubicin and the blood test result

Sample 4

Count peptide spectrum matches of a protein

sample 5

Retrieve PDB entries having a secondary structure with beta-sheet to loop to beta-sheet and forming hairpin structure

Sample 6

Retrieve UniProt URIs, ligands, organisms and references from wwPDB/RDF

Datasets

Datasets ページでは、RDFデータセットの一覧が、デフォルトでは更新日順に表示されます。それぞれのデータセットのアイコンは、各データセットのDetailsページにリンクされています。画面下部にある表示設定パネルで、更新日以外にも、アルファベット順、RDFトリプル数順、データ提供者順に、降順または昇順で並べ替えることができます。また、各データセットのデータベースカタログ分類を選ぶことで、表示されるデータセットを絞り込むこともできます。

Statistics

Statistics ページでは、本ポータルサイトに収録された全てのデータセットの統計情報を要約したテーブルが表示されます。

Links

Links ページでは、本ポータルに収録されたRDFデータセットおよび、外部のデータセットの間のリンクから構成されるネットーワーク図が表示されます。リンク情報は、各データセットのDetailsページのStatisticsに一覧されているものを利用しています。

SPARQL

全てのRDFデータセットに大して、SPARQLクエリを実行するためのエンドポイントを提供しています。Query: フォームに記述したSPARQLクエリを、Run Queryボタンをクリックすることで実行することができます。dublin core, dcterms, skos, foaf, xsd, obo 等の主要なオントロジーについては本ポータルにもロードされており、@prefix 記法で定義することなく、予め定義された接頭辞を利用することができます。利用できる接頭辞は、>https://integbio.jp/rdf/sparql?nsdecl< で参照できます。

Details

Details ページでは、各データセットの詳細情報が表示されます。Specification, Linked datasets, Statistics, SPARQL examples, Stanzas の5つのセクションから構成されています。

Specification

Specification セクションには、各データセットに関する、データベースカテゴリー、データ提供者、データ構築者、最新バージョン、構築日、ライセンス等のメタ情報が表示されます。RDFファイルそのものも、このセクションからダウンロードすることができます。

Linked datasets

Linked datasets セクションには、外部リンクへの数が表示されています。次の形式のトリプル '>本データセットのURI< rdfs:seeAlso >identifiers.orgのURI<' の数を利用しています。

Statistics

Statistics セクションには、各クラス、各プロパティ毎のトリプル数等の詳細な統計情報が表示されます。

Schema

Schema セクションには、各データセットのRDFモデルのスキーマ図が表示されます。

SPARQL examples

SPARQL examples セクションでは、各データセットに関するSPARQLクエリの例が表示されます。各SPARQLクエリの下にあるSPARQLボタンを押すことで、SPARQLエンドポイントサービスのページが新しいウインドウで表示されます。query フォームには、SPARQL exmaple が記述されいるので、Run Query ボタンを押すことで、直接クエリを実行することができます。

Stanzas

スタンザとは、TogoStanza を用いて作られたSPARQLを利用するウェブアプリケーションのことです。
Stanzas セクションでは、各RDFデータセットを利用した、スタンザアプリケーションが表示されています。

RDF化 データベースガイドラインRDFizing Database Guideline

更新履歴Change Log