[SIMILAR] WITH 9590 encoded WITH 6721 社共 WITH 5545 通メ WITH 3027 合法 WITH 2801 全社 WITH 2440 encoding WITH 2437 字コ WITH 1757 mime WITH 1499 字列 WITH 1126 共通 WITH 1123 本文 WITH 963 中継 WITH 885 文字 WITH 839 ルサ WITH 773 メイ WITH 753 検査 WITH 699 削除 WITH 478 模様 WITH 472 イル WITH 320 ーバ WITH 238 サー WITH 197 コー WITH 147 ード WITH 66 いる WITH 46 てい WITH 1 - WITH 1 words WITH 1 in WITH 1 quoted WITH 1 text WITH 1 バは WITH 1 は、 の検索結果 72 件中 51 - 60 件目 (0.076680159 秒)
メイルそのものがtext/htmlだったはずなのに、メイルとしてはmultipart/mixedで、その中の一つのパートがtext/htmlという形式になっている場合がある。 ...
C社とミーティング。貰った名刺には、"カスタマーテクニカルサービス本部 コアコンペテンシー プリンシパル サービス エンジニア"とか、"ストラテジック イニシアティブ テクニカルリーダー"とか書いてある。難し過ぎるので改善を希望。 日本語にする。例:ガキの使い、中ボス 順序の分かる指標を付ける。例:並、 ...
_ (スコア:579)
以下のような方針でbsfilterを作ってみた。 基本的には、ベイジアンフィルタの改善 --- Better Bayesian Filteringに従う。 単語の定義として1から5まで挙げられているが、4は面倒なので無視。 5については、 subject to from unix-from, return-path url, mail addressっぽい奴 という分類をする。 還元はしな ...
_ (スコア:534)
どうしようかしら? 激しくツッコミ希望。 ChaSenあたりを使ってみる。 -u高速化。--incrementalオプションを付けて、"-u -c --incremental"とすると、メイルに出てきたtokenについてのみ、確率テーブルを計算し直す。-aも早くなる。 いっそのこと、確率テーブル廃止? SPAM判定のときに、その場でtoken database ...
_ (スコア:534)
たださんのところで、false positive多発である。以下を試して頂けません? -v付きで実行。デフォルトのPaul Graham方式の場合、キーとなった15tokenのSPAM確率が表示される。その値が妥当なものか、表示されたtokenがメイルヘッダばかりだったりしないか、確認。 メイルヘッダばかりの場合は、-H付きで実行。 - ...
_ (スコア:534)
動作は以下のようになる。 --add-spam spam中のtokenの出現回数を、データベースに加算する。 --update データベースに入っている全tokenについて、今までの出現回数からspam確率を計算する。 --add-spam --update spam中のtokenの出現回数を、データベースに加算し、そのspam中のtokenについてのみ、spam確率を ...
_ (スコア:534)
検疫所で全数検査している間は食べてもよいとして、問題はその後。アメリカ人がきっちり検査し続けるなんてあり得ない。 ...
_ (スコア:520)
ついでに鼻炎を治せと言われて、アレグラとフルナーゼが出ている。先週やったアレルゲンの検査結果をもらった。 IgE359 ハウスダスト10.49 ヤケヒヨウヒダニ0.49 スギ7.77 ヒノキ0.47 ブタクサ2.78 カモガヤ8.37 20年くらい前にやった検査は、腕に引っかき傷をつけて、エキスみたいのをたらして、痒くなったら当 ...
_ (スコア:520)
_ (スコア:603)