wordfreqというスクリプトの例があります。
私は今でも、このスクリプトで単語を計算しています。
必要に応じてTRコマンドと併用したり、除去する記号を変更したりしています。
{
gsub(/[`'&%$-/.,:;!?^*_~=|@\\\#<>(){}0123456789\[\]"]/," ")
for (i=1;i<=NF;i++)
count[$i]++
}
END {for (w in count)
print w,count[w] | "sort -f"
}
読書状況:読み終わった
公開設定:公開
カテゴリ:
公開ソフト(open)
- 感想投稿日 : 2011年6月18日
- 読了日 : 2004年6月18日
- 本棚登録日 : 2011年6月18日
みんなの感想をみる