NLTKは元もとペンシルバニア大学で作成されたPythonによる自然言語処理ライブラリー。 バイグラムは単語のペアである。コロケーションは頻繁に共起するバイグラム:例 red wine。 テキストコーパス 語彙資源:語彙項目(見出し語+品詞+語彙定義などで構成する)のリスト、語彙リストコーパス。ストップワードコーパス、発音辞書(単語+音素リスト)、比較語彙リスト(約200の単語をいくつかの言語で記す) WordNet:シソーラスに似ているがよりリッチ。階層構造(概念として上位、下位、最上位語は一般的概念)、メロニムはある要素からそれを含む構成要素への関係(木を構成するのは幹、枝)、ホロニムは構…