概要
- TinySummarizer は自動要約プログラムです。
- 詳しくは README.md をご覧ください。
特徴
- TinySummarizer は自動要約プログラム Shuca を JavaScript に移植したものです。
- HTML 文書などから本文抽出されたテキストを対象に要約を行うことを想定しています。そのため、 Shuca とは異なり、様々な文書ドメインにおいて比較的頑健であると思われる単語頻度のみを用いて重要文の抽出を行っています。
- TinySegmenter による前処理を想定しているため、品詞による内容語と機能語の選別を行っておらず、内部に保持したストップ・ワードのリストに基づいて重要文の抽出に利用する単語の選別を行います。
- TinySegmenter と TinySummarizer によって完全にクライアント・サイドのみで自動要約処理が可能です。
- 文分割用に簡単な文分割器を同梱しています。
デモ
その他
詳しくは README.md を参照してください。