WordNet
現在、広く利用されているPrinceton WordNetは、語を類義関係のセット (synset)でグループ化している点に特徴があり、一つのsynsetが一つの概念に対 応します。また、各synsetは上位下位関係などの多様な関係で 結ばれています。
シソーラスデータ WordNet では個々の言葉 wordを重複無しに管理するために synset ID と呼ばれる識別子を振り, 概念接続 Sense, 概念 Synset, 概念間の関係 Synlink などのデータから成っており, 概念間はその link で接続されており, Synonims(同義語), Hypernims (上位概念), Hyponims (下位概念), Instances(実例)などといった 25 種類の決められた関係を構築している(多段自然言語処理における NLP, シソーラス, オントロジー辞書データ統合の提案 3.3)