[リストへもどる]
一括表示
タイトル振り分けとフィルタと優先順位
記事No188
投稿日: 2006/10/09(Mon) 17:14
投稿者kou
この2者の処理の優先順位なのですが、実験してみたところ
フィルタ>振り分け
なのでしょうか?
もしそうだとすれば、これを逆転させることは出来ないでしょうか?

タイトルRe: 振り分けとフィルタと優先順位
記事No191
投稿日: 2006/10/10(Tue) 07:57
投稿者通りすがりの...
> この2者の処理の優先順位なのですが、実験してみたところ
> フィルタ>振り分け
> なのでしょうか?
> もしそうだとすれば、これを逆転させることは出来ないでしょうか?
無理です。
フィルタはプロバイダ上のメールボックスから受信する時に動作し
振り分けは受信後のメールを処理する為のものです。

タイトルRe^2: 振り分けとフィルタと優先順位
記事No239
投稿日: 2006/10/17(Tue) 01:19
投稿者kou
ありがとうございます。
海外スパムを一撃で掃除するために文字コードでフィルタリングしようと画策したのですが、必要なメールを削除してしまわない為には面倒でも振り分けでゴミ箱なり迷惑メールフォルダなりに振り分けてチェックするしかないんですね。Thunderbirdのようなフィルタを内蔵できれば楽なんですが。

タイトルRe^3: 振り分けとフィルタと優先順位
記事No242
投稿日: 2006/10/17(Tue) 05:34
投稿者atuyso
kouさん オハヨウゴザイマス atuysoです。

>ありがとうございます。
>海外スパムを一撃で掃除するために文字コードでフィルタリングしようと画策したのですが、必要なメールを削除してしまわない為には面倒でも振り分けでゴミ箱なり迷惑メールフォルダなりに振り分けてチェックするしかないんですね。Thunderbirdのようなフィルタを内蔵できれば楽なんですが。

本文が日本語以外のメールをフィルタリングしたいということですか?

kouさんが受け取る日本語メールのcharsetを分析して、
それを含まない時サーバーからロードしない、
条件に一致しないメッセージはロードする、
これでは駄目ですか?

私が受け取るメールは ISO-2022-JP、"ISO-2022-JP"、iso-2022-jp、"shift_jis"
というところですから、

ヘッダ ![charset="*ISO-2022-JP] AND ヘッダ ![charset="*shift_jis] >>
ロードせずにサーバーに残す (正規)
となると思います。

charset=ISO-2022-JPとcharset=US-ASCIIのメールを自分宛にテスト送信してみたところ、
うまくフィルタリングしました。
正しく作動しているか、時々サーバーを見る必要はあると思いますが。
以上、参考になりますでしょうか?



~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
      atuyso
 Windows XP Home Edition SP2
    EdMax 2.85.6F

タイトルRe^4: 振り分けとフィルタと優先順位
記事No245
投稿日: 2006/10/19(Thu) 00:05
投稿者kou
ありがとうございます。

海外のサイトで買い物したりする関係上(そういった所からアドレスが漏れてスパムが押し寄せてくるのかも?)日本語文字コード以外を一律にという訳には行かず、結局まずフィルタで[ha+r+d+c+o+r+e]とか[fu+c+k+]などを削除して、振り分けで通販など既知の必要メールを振り分けて、残りのISO-8859-1文字コードのメールをSPAMフォルダに振り分け、誤振り分けが無いかチェックした後捨てるようにしました。

今Thunderbirdも試用していますがスパムフィルタが便利です〜。Gmailも同様ですね。やっぱりEdmaxにもああいうフィルタ欲しい!

タイトルRe^5: 振り分けとフィルタと優先順位
記事No255
投稿日: 2006/10/20(Fri) 01:14
投稿者ramerika
>今Thunderbirdも試用していますがスパムフィルタが便利です〜。Gmailも同様ですね。やっぱりEdmaxにもああいうフィルタ欲しい!
ベイズ理論のでしたら、外部プログラムの POPFile というもので、
できますよ。

メールの件名頭に、どういうメールかというものをつけてくれるので、
あとは edmax 側で、ふつうに振り分け設定をして振り分けます。
私はそうしています。

最初は間違えるので、popfile のコントロールセンターにいって、
間違えたものを手で分類させて学習させます。
それを繰り返していたら次第に間違わなくなってきます。
(もちろん100%とはいきませんが、、)

知られていたら、すいません。


参考:
http://popfile.sourceforge.net/cgi-bin/wiki.pl?JP_HowTos/EdMaxFree

タイトルRe^4: 振り分けとフィルタと優先順位
記事No270
投稿日: 2006/10/22(Sun) 09:44
投稿者hogesa
>> 私が受け取るメールは ISO-2022-JP、"ISO-2022-JP"、iso-2022-jp、"shift_jis"
> というところですから、
>
> ヘッダ ![charset="*ISO-2022-JP] AND ヘッダ ![charset="*shift_jis] >>
> ロードせずにサーバーに残す (正規)
> となると思います。

正規表現に関して教えて下さい.上記の記述では子文字のiso-2022-jpはカバーされてないですか?
関連して,旧掲示板の

27562. クエリーの正規表現おかしくないですか? stiffel 2006/07/15 (土) 15:13 [ 2 ]

の中に ^[\w\s]* という表現が出ているのですが,\w や \s はEdMaxで使えるのでしょうか?
Helpでは使える正規表現の中に入ってません.(v.2.85.6F)

タイトルRe^5: 振り分けとフィルタと優先順位
記事No272
投稿日: 2006/10/22(Sun) 11:09
投稿者atuyso
hogesaさん お早うございます atuysoです。

>正規表現に関して教えて下さい.上記の記述では子文字のiso-2022-jpはカバーされてないですか?

大文字小文字を区別するにチェックを入れなければ、
iso-2022-jpもカバーされると思います。


>27562. クエリーの正規表現おかしくないですか? stiffel 2006/07/15 (土) 15:13 [ 2 ]
>
>の中に ^[\w\s]* という表現が出ているのですが,\w や \s はEdMaxで使えるのでしょうか?
>Helpでは使える正規表現の中に入ってません.(v.2.85.6F)

よく検討しないで回答してしまったようです。
「EdMaxでは^と$は同時に使えない」ということと「使えるのはヘルプに出ている
正規表現のみ」ということを伝えるべきでした。



~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
      atuyso
 Windows XP Home Edition SP2
    EdMax 2.85.6F

タイトルRe^6: 振り分けとフィルタと優先順位
記事No273
投稿日: 2006/10/22(Sun) 12:51
投稿者hogesa
早速のご回答ありがとうございます.

> 大文字小文字を区別するにチェックを入れなければ、
> iso-2022-jpもカバーされると思います。

そうでしたか! 前に振分けやフィルターで条件を記述する際に
2つまでしか記述できないという制限をand/or と正規表現を両方
使って突破しようと試みたら駄目で,ヘルプをよく見たら
and/or は正規表現ONでは使えないと書いてました.
また「単語単位で検索」も正規表現ONでは無効ですね.
EdMaxで使える正規表現はそう多くないのでダイアログにあるチェックボックスは
正規表現ONのときはどれも無効になるのかと勘違いしてました.
「大文字小文字を区別」が使えるなら今使ってる条件を短くできそうです.
(例. [Dd][Aa][Tt][Aa][0-9]+→DATA[0-9]+ ,etc)

今気付きましたが,クエリーや文字列検索で「正規表現」をONにすると
「and or条件」はグレイアウトして自動的にOFFになるんですね.
振分けやフィルターの方もそうなってくれれば助かります.>作者様

> 「EdMaxでは^と$は同時に使えない」ということと「使えるのはヘルプに出ている
> 正規表現のみ」ということを伝えるべきでした。
>
こちらの方はわかりました.

タイトルRe^4: 振り分けとフィルタと優先順位
記事No329
投稿日: 2006/10/28(Sat) 09:35
投稿者hogesa
> 本文が日本語以外のメールをフィルタリングしたいということですか?
>
> kouさんが受け取る日本語メールのcharsetを分析して、
> それを含まない時サーバーからロードしない、
> 条件に一致しないメッセージはロードする、
> これでは駄目ですか?
>
> 私が受け取るメールは ISO-2022-JP、"ISO-2022-JP"、iso-2022-jp、"shift_jis"
> というところですから、
>
> ヘッダ ![charset="*ISO-2022-JP] AND ヘッダ ![charset="*shift_jis] >>
> ロードせずにサーバーに残す (正規)
> となると思います。

これに関連して質問させて下さい.EdMax 2.85.6Fを使ってます.
同様の主旨で振分けやフィルターの条件を作っている所です.
私の受ける日本語メールの中には上記の他に charset="Shift-JIS"もあったので,
少し変えて ヘッダ![charset="*shift[_\-]jis]としました.これは解決したのですが,
他にも charset="UTF-8", UTF-8,さらにもっと厄介な,charsetが書かれていない
日本語メールもあってcharsetだけでは判別できなくなりました.
これらの場合は件名や宛名,添付ファイル名など,ヘッダに日本語が使われていれば
日本語メールとして処理することを考えてます.
(日本語が本文にしかないメールは処理し切れませんがこれは諦め.実際あった.)

そこでNo.76にあった
----------(引用)
旧掲示板 27091. 本文が日本語以外を振り分け で始まるスレッド
の27098こういちろうさんの回答を引用させていただきます。

>「正規表現 (E)」をチェック on にした上で
>振り分け条件「『本文』が『[ -熙]+』を『含まないとき』」を指定すれば
>うまくいくはずです。
----------
を本文からヘッダに変えて ヘッダ![ -熙]+ としてみたのですが,どうもうまくいきません.
Q1.charset に関係なく正規表現の検索はJISコードでの範囲( -熙) でいいのでしょうか?
Q2.条件の順番を変えたり,スルーしてチェックをONにしたり考えましたが,どうにもうまく作れません.

charsetで日本語とわかるかまたはヘッダに日本語が含まれていれば日本メールと判断し,
そうでなければ外国メールと判断して,それぞれさらに続けて
振分けを行うにはどうしたらいいでしょうか?
#条件が2個しかかけないのが,記述を難しくしている原因と思われます.

なお,[ -熙]+は+をとって[ -熙]でいいように思います.

タイトルRe^5: 振り分けとフィルタと優先順位
記事No331
投稿日: 2006/10/28(Sat) 10:50
投稿者atuyso
おはようございます。

私自身は、迷惑メールをほとんど受け取りませんので、特に対策はとっていません。


No.255で紹介されているPOPFileなどの導入も検討されてはいかがですか?

タイトルRe^5: 振り分けとフィルタと優先順位
記事No332
投稿日: 2006/10/28(Sat) 11:16
投稿者atuyso
おはようございます。

種別:ローカル

○ヘッダ ![[ -熙]+] >> Account1\ごみ箱 (正規)

で振り分けたところ、ごみ箱に移動しました。

hogesaさんは、うまくいきませんか?

タイトルRe^6: 振り分けとフィルタと優先順位
記事No336
投稿日: 2006/10/29(Sun) 15:07
投稿者hogesa
> 種別:ローカル
>
> ○ヘッダ ![[ -熙]+] >> Account1\ごみ箱 (正規)
>
> で振り分けたところ、ごみ箱に移動しました。

返信が遅くなり申し訳ありません.試行錯誤してましたもので.
結論は何とか一応動作するようにできました.ただ今回追加した
条件は、フィルターで「ロードせずに削除する」にはちょっと危ないので振分けだけに設定しました.
日本語かどうかの判定は条件の最下行に持ってきて,それより前の条件にマッチしたメールを
日本語かどうかに関係なく先に振り分けてしまいます.そこまでの条件にマッチしなかったメールは
通常受信フォルダに落ちるのでそのメールだけ外国メールかどうか判定させました.

種別:受信

018 ○ ヘッダ [[ -熙]] >> Account1\受信 (正規)
019 ○ ヘッダ ![charset="*iso-2022-jp] AND ヘッダ ![charset="*shift[_\-]jis] >> Account1\foreign (正規)

18で、「ヘッダに日本語を使っているものは日本メール」と判断してます.
「何もしない」というアクションはEdMaxにないので受信フォルダへ移動でごまかしてます.
19で、ヘッダには日本語がないので外国メールらしいと考え、charsetが日本語設定でないのは
外国メールと判定してます.
移動先フォルダはほぼゴミ箱でいいのですが,たまに必要なメールもあるので念のため別にしてます.

ヘッダに日本語のないcharset=UTF-8のメールも外国メールと判定してしまいますので,
振分け条件に使うならヘッダではなく本文の方がいいでしょうかね.
でもそうすると受信時のリアルタイム自動振分けには使えない?
(前に別スレでそういうコメントがありましたが,意味がわかりません)
自分は本当はフィルター設定に使いたかった関係上ヘッダで判定してます.

タイトルRe^7: 振り分けとフィルタと優先順位
記事No338
投稿日: 2006/10/29(Sun) 16:08
投稿者atuyso
hogesaさん コンニチハ atuysoです。

017までの条件で振り分けられなかった日本語メールは、
Account1の受信フォルダに振り分けられるんですか?

ヘッダだと[ -熙]を受信時の条件に使えるんですね!
本文の場合はどうなんでしょうねぇ。



~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
      atuyso
 Windows XP Home Edition SP2
    EdMax 2.85.6F

タイトルRe^7: 振り分けとフィルタと優先順位
記事No341
投稿日: 2006/10/29(Sun) 19:12
投稿者atuyso
hogesaさん 今晩は atuysoです。

>19で、ヘッダには日本語がないので外国メールらしいと考え、charsetが日本語設定でないのは
>外国メールと判定してます.
>移動先フォルダはほぼゴミ箱でいいのですが,たまに必要なメールもあるので念のため別にしてます.
>
>ヘッダに日本語のないcharset=UTF-8のメールも外国メールと判定してしまいますので,
>振分け条件に使うならヘッダではなく本文の方がいいでしょうかね.

これをローカルで併用できそうですが。

ヘッダ ![[ -熙]] AND 本文 ![[ -熙]] >> Account1\ごみ箱 (正規)


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
      atuyso
 Windows XP Home Edition SP2
    EdMax 2.85.6F

タイトルRe^8: 振り分けとフィルタと優先順位
記事No343
投稿日: 2006/10/30(Mon) 01:46
投稿者hogesa
atuyso さん,こんばんは. 毎度お世話になっております.

まとめてレスさせていただきます.

はじめに私が書いたことのソースを明示しておきます.
>振分け条件に使うならヘッダではなく本文の方がいいでしょうかね.
>でもそうすると受信時のリアルタイム自動振分けには使えない?
>(前に別スレでそういうコメントがありましたが,意味がわかりません)

()内の部分は旧掲示板の
27091. 本文が日本語以外を振り分け たら 2006/05/12 (金) 16:28
に始まるスレでNo.27098にて,こういちろうさんが書いていた
>「正規表現 (E)」をチェック on にした上で
>振り分け条件「『本文』が『[ -熙]+』を『含まないとき』」を指>定すれば
>うまくいくはずです。

>なお、この条件は受信時のリアルタイム自動振り分けには使えません。

の最後の行を読んで「本文」は受信時自動振分けに使えないのかな?と思ったからです.
受信が既に完了した後の「種別:ローカル」に書く条件だから,という意味なのでしょうか.
私は受信した後のメールでも手動で「振分け」ボタンを押して「受信」条件で振分けしたり,
そのテストをしてます.(これは手でフォルダ移動したメールに使うと戻ってしまうので要注意ですが.)
ローカルに別の設定をするのが正しいんでしょうけど.

>ヘッダだと[ -熙]を受信時の条件に使えるんですね!
>本文の場合はどうなんでしょうねぇ。

実は上で書いたように、既に受信済みだったメールに対して「受信」条件で振分けテストを
しただけでしたので,本当に試したわけではなかったのですが,
それでは無責任な気がしたのでごく簡単な確認テストをしてみました.
EdMaxで自分宛に送信してから受信
メール1.アドレスに漢字名で 氏名 <hogesa@...>, 件名に「テスト2」,本文に「テスト」と書き,署名は半角英数
メール2.アドレスにhogesa@..., ,件名に「テスト2」,本文に「テスト2」,署名は半角英数
メール3.アドレスにhogesa@..., ,件名「test3」,本文「test3」署名はすべて半角英数,
  添付ファイルあり 名前は「新規テキスト ドキュメント.txt」

メール3はcharset=US-ASCIIになってましたが,結果はすべて問題なく
同じ指定フォルダ(仮にaaa.例えばゴミ箱)に振分けられました.

送信したメールをそのまま3つとも「待ち」フォルダに移動して,今度は1つ目の条件をヘッダではなく
本文に変えてから送信→受信のテストをしてみたら,メール1,2は同じaaaフォルダに振分けられ,
メール3は外国メールと判定されて,これも2つ目の条件(ヘッダのまま)でforerignフォルダに落ちました.

テストの結果,結局,ヘッダでなく本文にしても受信自動振分けできるようです.

> これをローカルで併用できそうですが。
>
> ヘッダ ![[ -熙]] AND 本文 ![[ -熙]] >> Account1\ごみ箱 (正規)

テスト結果から多分「種別:受信」のまま「本文」だけでいけそうです.もっとも,本文なしで件名や
添付ファイル名などにのみ日本語が入っている(メール3のような)メールもたまにはあるので
「ヘッダ」も入れておく方が,よりいいかもしれません.
charset=UTF-8で本文にしか日本語がないメールは受信後のものでしかテストしてませんが,
それではOKでした.

これには「落ち」があって外国メールなのに本文の一部が文字化けで漢字になっているものも
「日本語メール」として拾ってしまいました.(^_^;) まあ仕方ありません.

タイトルRe^9: 振り分けとフィルタと優先順位
記事No344
投稿日: 2006/10/30(Mon) 02:03
投稿者hogesa
>これには「落ち」があって外国メールなのに本文の一部が文字化けで漢字になっているものも
>「日本語メール」として拾ってしまいました.(^_^;) まあ仕方ありません.

たった一文字の化けだったのですがそれを拾ってしまったので,それくらいは外国メールと
判断するように本文の条件をちょっとだけ代えました.2文字以上化けていたら駄目ですけど.

種別:受信
018 ○ ヘッダ [[ -熙]] OR 本文 [[ -熙][ -熙]] >> Account1\受信 (正規)
019 ○ ヘッダ ![charset="*iso-2022-jp] AND ヘッダ ![charset="*shift[_\-]jis] >> Account1\foreign (正規)

タイトル日本語以外のメールを振り分け
記事No345
投稿日: 2006/10/30(Mon) 06:02
投稿者atuyso
hogesaさん お早うございます atuysoです。

本文の[ -熙]を受信時の条件に使えるということですね。

この件では相当、試行錯誤なさったんでしょうね。
ほかの方にも大いに参考になると思います。


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
      atuyso
 Windows XP Home Edition SP2
    EdMax 2.85.6F