つれづれなる備忘録より。
void GraphicWizardsLair( void ); //を見たりすると、デフォルトの値は大切だと思う。
spam-cutoffとして、何かの文献で見た0.95というを使っているのだが、高すぎるように思う。自分では0.6で使っているし、ただのにっきフルスロットルでも同じ傾向らしい。0.8くらいに下げようかしらん?
そういえば、解析に使う単語数(?)を増やすなんて話もありませんでしたっけ?
最近はデフォルトが"--method rf"なので、tokenizerが拾ってきたtokenを全部使って判定してます。"--method g"については、15token固定なので、これを可変にという提案がありました。どうしよう...
にゃるほどー
そういえば、解析に使う単語数(?)を増やすなんて話もありませんでしたっけ?
最近はデフォルトが"--method rf"なので、tokenizerが拾ってきたtokenを全部使って判定してます。
"--method g"については、15token固定なので、これを可変にという提案がありました。どうしよう...
にゃるほどー