Articles

単語の説明

Describing Words

Describing Words エンジンのアイデアは、関連単語 (類語辞典のようなものですが、単なる同義語ではなく、より幅広い関連単語のセットを提供します) のエンジンを構築していたときに思いつきました。 単語ベクトルとconceptnetの「HasProperty」APIで遊んでいるときに、ある単語を一般的に説明する形容詞を取得しようとしたのが面白かったんです。 最終的に、これを行うにはもっと良い方法があることに気づきました:本を解析する!

Project Gutenberg が最初のコーパスでしたが、パーサーはどんどん欲張りになって、最終的に約 100GB のテキスト ファイル(ほとんどがフィクションで、多くの現代作品を含む)を与えることになりました。 パーサーは単に各書籍に目を通し、名詞のさまざまな説明を引き出します。

願わくば、これが単なる目新しさではなく、実際に執筆やブレインストーミングに役立つと思う人がいることを願います。 例えば、「女」対「男」、「男」対「女」などです。 ざっと分析したところ、フィクションの作者は、(男性に対して)少なくとも4倍は女性を美に関する用語(体重、特徴、一般的な魅力に関するもの)で表現する傾向があるようです。 実際、「美しい」という表現は、世界中の文学作品の中で最も広く使われている女性表現であり、他の多くのメディアにおける女性の一般的な一面的表現と非常によく一致しています。 このことについてさらに研究したい人がいたら教えてください。もっと多くのデータを提供できます (たとえば、「woman」には約 25000 種類の項目があり、ここでは紹介しきれません)。

結果の青さは相対頻度を表します。 項目の上にカーソルを置くと、頻度のスコアが表示されます。 一意性」ソートはデフォルトで、私の複雑なアルゴリズムのおかげで、他の名詞と比較して、その特定の名詞に対する形容詞の一意性によって順序付けされます (実際にはかなり単純です)。 ご期待どおり、[Sort By Usage Frequency] ボタンをクリックすると、その名詞に対する使用頻度で形容詞を並べ替えることができます。