[SIMILAR] WITH 7748 ズ推 WITH 2004 ムメ WITH 1780 推定 WITH 1516 bsfilter WITH 1360 パム WITH 944 ー( WITH 903 ベイ WITH 707 キタ WITH 558 ィル WITH 534 ルタ WITH 504 タリ WITH 486 スパ WITH 367 イズ WITH 317 フィ WITH 194 メー WITH 174 リン WITH 154 ング WITH 150 ター WITH 109 ール WITH 1 [ WITH 1 ] WITH 1 定で WITH 1 で楽 WITH 1 楽々 WITH 1 々ス WITH 1 ルを WITH 1 をフ WITH 1 /. WITH 1 j WITH 1 ( WITH 1 ゜∀ WITH 1 ∀ の検索結果 231 件中 151 - 160 件目 (0.170033123 秒)
しばしば日記等で遅いと書かれている。 googleで検索 しても、それなりに引っかかる風味。 "遅い"で思いだすジョブズの話。 MacOSを開発したが起動が遅い。最適化してもやっぱり遅い。で、ジョブズが檄を飛ばす。「多くの人が、多くの回数起動するのだ。その時間を合計すれば、人の寿命に匹敵するのだ。人の命を ...
C社からutf-8 + base64なメイルが来るので対応検討中。 日本語のメイルかどうか、super ad-hocに判定しているルーチンはどうするか? iconvの引数のcode setは、OS非依存か? eucJPに変換できないutf-8が来たら、どうするか? utf-8 + quoted-printableもありそう subjectが、utf-8 mime b or q encodingなのにも対 ...
_ (スコア:1750)
IMAPサーバにもよって、普通にprocmailを使えるようなのもありますし、sieveのようなIMAPサーバ上で実行されるスクリプトを使う必要のあるものもあります。 あと、imapfilterというプログラムはIMAPでアクセスすることによって振り分けることができるようです。 (個人的にはimapfilterのようなものをRubyで作っ ...
_ (スコア:1750)
MeCabを使ってみた。MeCabが切り分けたtokenから、漢字が2文字以上、連続する部分を拾っている。-dで意味不明のtokenが出てこないのは、気持ちがいい。 portsからインストールしたMeCabを使うには、rubyではなくruby_rを起動する必要があるので、スクリプトの先頭部分を書き換えた。emacsをruby-modeにする部分 ...
_ (スコア:1750)
どうしようかしら? 激しくツッコミ希望。 ChaSenあたりを使ってみる。 -u高速化。--incrementalオプションを付けて、"-u -c --incremental"とすると、メイルに出てきたtokenについてのみ、確率テーブルを計算し直す。-aも早くなる。 いっそのこと、確率テーブル廃止? SPAM判定のときに、その場でtoken database ...
_ (スコア:1750)
現在、自宅ではmewがPOP/SMTPを喋ってプロバイダとメイルをやりとりしているため、デーモンの類が一切、走っていない。 途中でbsfilter + 何かに、SPAMだというマークを付けさせる。 POPで新着メイルをチェックするbiff系ツールを使いたい。 本文中の"From"が、"> From"になるのは許さない。 という条件では、何 ...
_ (スコア:1750)
release-1.0.13になる予定。 --refer-headerオプション追加 複数行のContent-Transfer-Encodingがbase64, 8bitと言っている場合に、base64 decodeする uuencodeしたのを本文に貼り付けてあるっぽいのをスキップする shift-jisなMIME B-encodingをnkfがデコードしてくれないので、iso-2022-jpと書き換えてからnk ...
_ (スコア:1750)
動作は以下のようになる。 --add-spam spam中のtokenの出現回数を、データベースに加算する。 --update データベースに入っている全tokenについて、今までの出現回数からspam確率を計算する。 --add-spam --update spam中のtokenの出現回数を、データベースに加算し、そのspam中のtokenについてのみ、spam確率を ...
_ (スコア:1750)
Invalid Text ほんの少し高速化 連続していない漢字(==1文字だけ)も判定に使用する。動詞を拾うことが狙い MeCabが名詞と判断した物は、そのまま判定に使用する。以前は、ひらがなを捨てたり、カタカナと漢字でさらに分解したりしていた Prozaccが登録されていなかったら、最後の1文字を削ってProzacで試すよう ...
_ (スコア:1750)
たださんのところで、false positive多発である。以下を試して頂けません? -v付きで実行。デフォルトのPaul Graham方式の場合、キーとなった15tokenのSPAM確率が表示される。その値が妥当なものか、表示されたtokenがメイルヘッダばかりだったりしないか、確認。 メイルヘッダばかりの場合は、-H付きで実行。 - ...
_ (スコア:1750)
_ (スコア:1750)