スパム対策のためのベイズ理論とは?
ベイジアンフィルターの基となっているベイズ理論は、18世紀の数学者であったトーマス・ベイズ(Thomas Bayes)という英国人によって考え出された原理です。。
簡単に説明すると、 2人でじゃんけんをした場合、あいこを除外して勝つか負けるかでいうと、確率は1/2です。しかし、何度かじゃんけんをしているうちに相手の出す手は片方に絞られてきたり、相手の雰囲気や周囲の状況から一番最初よりも今まで行った経験から推測できることになります。
これを実際のメールで当てはめてみると、一度受信したメールのメッセージの中に、『広告』とか『無料』といった言葉を含んでいる事が多い。しかし、普通のメールにも『広告』や『無料』といった文字は使われることがあります。一番してはいけないことは、大事なメールをスパムとして誤認し、振り分けてしまうことです。
このようにならないためにも、一度スパムメールとして判断されたメールのメッセージの内容を解析し、スパムかどうかの判断材料を蓄積して判定の精度を上げていくことで、実際の結果に近い振り分けが可能になります。
|