Tema: Re: Laiško grąžinimas nesant adresato
Autorius: audrius
Data: 2012-03-29 13:06:45
http://www.commtouch.com/ technologijos principas isaiskintas
gal kiek patikslinsiu: spamassasin - laisko turinio analize pagal taisykles (nu gal pastaruoju metu pridejo kiu feature, nebesidomiu), beiso - apmokymas pagal vartotoja (-us), pattern matching - kazkas panasaus kaip beiso, tik veiksminga jei yra skaitlinga bendra pasauline sistema, kuri near-realtime gauna itartinu laisku pavyzdzius pvz hash'ais isskaidytus segmentus ir pagal juos reitinguoja laiskus: virus outbreak, bulk ir t.t. 
jei tos sistemos vartotojas butu tik 1 - sistema neveiktu, nes nebutu jokio bendro pattern, butu 0% spam filtravimo, o kai yra simtai tukstanciu ivairiose salyse: viskas labai tiksliai veikia

santykis mazdaug toks:
spamassasin, t.y. laisko turinio analize pagal rules'us - 90% spam nufiltravimas, prie 1% false positive, bet bejege pries naujus spameriu "fintus" iki update, pavyzdys: rusiski spamai kazkada, tekstas gif pavidalu ir kt.
apmokyta beiso sistema (kaip suprantu tavo atveju tai spamassasino beiso plugina naudoji) - 99% nufiltravimas prie 0.5% false positive, parktiskai tai pvz neisivaizduoju kaip turetu ja naudotis tie, kurie dirba industrijoje, susijusioje su spam turiniu: viagra pardavinedami arba porno industrijoj :)
NEapmokyta beiso sistema - teoriskai neturetu is viso veikt... 0 % nufiltravimas - pats tam juk pritari "cituoju: apsimoko per 2-3 paras"
pattern matching - nufiltravimas panasus kaip beiso ,BET false positive dar pora nuliu po kablelio, kodel - trumpai tikiuosi paaiskinau, daugiau yra pilna aprasymu internete

> įdomu darosi: pattern mach'as ūber gut, Bayes'as - guvno, HMM išvis ne 
> mokslas.
> 
> Neša pardavėju.

taip, situos dalykus kazkada pardavinejau
 
> PS: spamassassin'as man kol kas nei vieno gero laiško nepasiuntė į 
> spam'ą. False negative - ~1%, kai atsiranda naujas pattern'as, apsimoko 
> per 2-3 paras.
> 
> -- 
> ejs