( arpi_esp | 2020. 04. 22., sze – 17:26 )

mivel ez a level szoveget elemzi, nem tudhatja hogy te szandekosan iratkoztal fel ra, vagy csak ugy kapod...  mivel tartalmilag nagyon hasonlit a spam-ekre, annak pontozza.  amire feliratkoztal azt whitelisteljed es kesz. a gmail is spamba rakja ezeket...

nagyon nehez definialni mi a kulonbseg a bulk email es a spam kozott - ahogy fentebb is irtak, van akinek ez van akinek az. nezopont kerdese.

vannak url whitelistek is, spamassassinbe be lehet allitani, es akkor a megbizhato hirlevel kuldoket lepontozza.

masik lehetoseg, hogy tanitasz sajat modelt, nem muszaj az enyemet hasznalni. ott vannak a toolok hozza, lehet sajatot epiteni, mondjuk eros vas kell hozza (cuda gpu ajanlott, de anelkul is lefut par nap alatt).  maildedup2.py megcsinalja az unix mailboxbol a tokenizalt .txt-t, ezt lefuttatod kulon a ham es a spam minta mappadon. aztan a 2 txt-t beadod (data/mail.pos+.neg) a keras4_emb.py-nak, az eloallitja a modelt. ha reszletesebben erdekel valakit szoljon, gyartok majd leirast rola, annyira nem trivialis, de nem is tul bonyolult.

A'rpi