Gmailなどは迷惑メールフィルタ機能を備えています。これらはどうやって迷惑メールと判定しているのでしょうか。ここでノウハウを書いてしまいますと迷惑メールが増えかねないので、公開されている判定方法について説明をします。
まずは、メールを発信しているドメイン名、サーバー、ネットワークで判定をします。過去にそのドメイン名やサーバー、またはネットワーク(例:公衆Wi-Fi)から迷惑メールを大量送信していた履歴がある場合、迷惑メールと判定されます。
続いて、メール本文内の単語での判定です。不自然な文脈、同じ言葉の頻度の高さ、特定のキーワード、スペースの数などでスコア化し、閾値を超えると迷惑メール判定となります。
傾向と分析による自動判定もあります。これは、他の人が「迷惑メールである」と手動判定したものの特徴をとらえ、その特徴が一定数出現または完全一致した場合に迷惑メール判定となります。
通常のメールでも、誤判定をされることは多々あります。それはフィルタの感度が原因であったり、メールを送信した場所(ネットワーク)が原因であったりと様々です。
自分が送ったメールは迷惑メールと自動判定されてほしくない一方で、自分に届くメールはきちんと迷惑メール判定をしてほしい(すり抜けて欲しくない)。迷惑メールフィルタは、精度を上げるためにメール本文等の情報を収集・解析し、傾向と対策を日々更新し続けているのです。
近い将来はAIがメールの内容を判断して、あなたにふさわしくない=迷惑メール判定をする時代が来ることでしょう。