コメントスパム対策。
2006/05/29 月曜日 - 07:36:51 by ryoki 878ものコメント・スパムを頂戴して、そのままにしておくわけにはゆかぬ。
ということで、コメント・スパムを集めることから始めた。
つまり、コメントを削除する前に、全てExcelにコピペするのだ…。
実はこれが結構骨の折れる作業…。
878ものコメント・スパム
これがその全878コメントだ!(170kbyteのCSVファイルです。)
コメント・スパム対策用リストを作ろう!
さて、次に文字解析ソフトを使って、最もよく使われてるワードを抽出し…と、いきたいところだが、そこまでのスキルと時間を持ち合わせていないので、ざっと目視で 、よく使われているワードを抜き出した。
それからIPアドレスはExcelに貼りつけて、重複を除去した。
重複除去はExcel(2002SP3)にて、以下の操作で実現した。
IPアドレス群をExcelに縦一列に貼り付けて、その貼り付けた全てのセルを選択する
メニュー→データ→フィルター→フィルターオプションの設定を選択
OK押下
「重複するレコードは無視する」をチェック
OK押下
コメント・スパム対策用リスト、完成
これがryokinfoで受けた878コメントと、バリうら。で受けた1,014コメントから作ったコメント・スパム対策用リストだ!
いつか文字解析アルゴリズムとかで、スパム・コメントによく使われるワード・ランキングを作りたいな…。
コメント・スパム対策用リストの使い方(WordPress)
WordPressの管理画面にいく
「設定」タブを押下
「ディスカッション」タブを押下
「コメントモデレーション」に上記リストの内容をコピペする(改行コードで文字を区別するので、縦一列にペーストすること。カンマ区切り等は不可。)
「設定を更新」を押下
注意:上記リストは各自の責任のもとでお使いください。上記リストを「コメントブラックリスト」に適用することもできますが、一切のコメントを受け付けなくなりますので、あまりお勧めしません。例えば、ボットに乗っ取られてコメントスパムを出してしまったPCからのコメントや、たった一つでも禁止ワードを含んだコメントは、一切受け付けなくなります。「コメントモデレーション」なら「承認待ち」になるだけで、管理者自信が削除・採用を選択できますので、救済可能な場合があると思います。なお、英語が頻発するサイトへの適用はお勧めできません。

