Solutie antispam - filtre bayesiene

Trimis la data: 2010-05-28 Materia: Informatica Nivel: Facultate Pagini: 11 Nota: / 10 Downloads: 1
Autor: Sebi Dimensiune: 424kb Voturi: Tipul fisierelor: pdf Acorda si tu o nota acestui referat: 1 2 3 4 5 6 7 8 9 10
vezi mai multe detalii vezi mai putine detalii
Raporteaza o eroare
Referat despre Solutie antispam - filtre bayesiene
Ce este SPAM-ul ?
Spam-ul este definit ca si abuzul de sisteme de mesagerie electronice ( incluzand sistemele digitale de disributie ) ce consta in trimiterea in masa de mesaje nesolicitate. Cea mai cunoscuta forma de SPAM este spam-ul prin email. Termenul este asociat si la abuzuri media asemantoare cum ar fi : spam prin mesagerie instanta, spam newsgroup,
spam de blog, spam al motorului de cautare, wiki spam, spam de mesagerie prin telefonie mobila, spam de forum, spam prin fax, spam de tip social networking, spam de retea file sharing.Spam-ul este un abuz viabil din punct de vedere econimic deoarece cei care fac publicitatea nu au costuri de operare mari, trebuie doar sa-si gestioneze lista de mailuri. Deasemenea e greu sa fie luati la raspundere cei ce trimit spam-urile in masa, persoane numite si spammeri.

Referat despre Solutie antispam - filtre bayesiene
SPAM prin e-mail
Spam-ul prin e-mail, cunoscut si ca "junk mail" este un tip de spam ce presupune trimiterea de mesaje aproape identice la un umar mare de destinatari. Un sinonim pentru spam este "unsolicited bulk e-mail" (UBE). Mai intalnim si termenul de "unsolicited commertial e-mail" (UCE). Spam-ul prin email a luat amploare constant din 1990. Botnets,
retele de computere infectate cu virusi sunt folosite pentru a trimite aproximativ 80% dintre spam-uri. Statutul legal al spam-urilo variaza de la o juristictie la alta. In SUA, spam-urile au fost declarate legale cu condita ca mesajul ca se incadreze in anumite specificatii.
Un sondaj realizat in 2004 a estimat ca spam-urile produc pierderi de 21,58 de miliarde de dolari anual in SUA, prin efectuarea de trafic de internet costisitor si ocuparea timpului utilizatorilor internet.

Spam-ul este in continua crestere, un raport de securitate Miscrosoft precizand faptul ca peste 97% dintre e-mail-urile trimise zilnic sunt spam-uri. In 1978 un spam e-mail cu caracter publicitar a fost trimis de catre Gary Thuerk la 600 de adrese, reprezentand toti utilizatorii ARPANET de la momentul respectiv. In 2002 erau trimise 2,4 miliare de spam-uri pe zi, in 2004 – 11 miliarde, 2005 – 30 de miliarde, 2006 – 55 de miliarde, 2007 – 90 de miliarde, iar in 2007 – 100 de miliarde. Figura 1. Exemplu de inbox cu spam-uri

Botnet
Botnet este jargonul dat pentru o colectie de agenti software sau roboti care ruleaza autonom si automat. Cu toate ca termenul de botnet poate fi folosit pentru a referi orice fel de grup de roboti, cum ar fi roboti IRC, termenul este folosit de obicei pentru a referi o colectie de computere virusate ( numite zombie computers ) ce ruleaza aplicatii instalate prin exploatarea vulnerabilitatilor web : viermi ( worms ), troieni ( trojan horses ) sau backdoors. Computerele virusate pot fi controlate de un bot master pentru efectuarea diferitelor sarcini, cel mai des pentru a trimite spam-uri e-mail. Figura 2. Exemplu de creare a botnet si utilizarea lui pentru a trimiterea de spam-uri

1) Un operator botnet trimite virusi sau viermi sau troieni ce infecteaza computerele utilizatorilor, virusi ce contin aplicatia robot.
2) Robotul de pe PC se logheaza pe un anumit server de tip Command&Control ( de obicei un server de IRC, dar in unele cazuri si un server web)
3) Spammer-ul cumpara acces la botnet de la operatorii serverului.
4) Spammer-ul trimite instructiuni prin serverul IRC la computerele infectate, facandule sa trimita mesaje spam serverelor de mail.
Acest tip de roboti este folosit pentru diferite scopuri, inclusiv pentru atacuri de tip denial-of-service, crearea sau folosirea frauduloasa de servere SMTP pentru spam-uri, frauda de clickuri, furtul de coduri de activare pentru aplicatii, credentiale pentru logari si
informatii financiare cum ar fi numere de carti de credit.

Comunitatea de operatori botnet este intr-o continua rivalitate, cu privire la cine are mai multi roboti, cine are latimea de banda cea mai mare si cine are cele mai performate computere, cum ar fi computerele folosite la serverele universitatilor, corporatiilor sau guvernelor.

Teorema lui Bayes
Teorema lui Bayes este una din teoremele fundamentale ale teoriei probabilitatii, care determina probabilitatea apartenentei evenimentelor si a obiectelor la o anumita grupa. A fost enuntata de matematicianul britanic Thomas Bayes.

Formul lui Bayes este :
unde :
P(A) este probabilitatea marginala a lui A.
P(A|B) este probabilitatea lui A conditionata de B.
P(B|A) este probabilitatea lui B conditionata de A.
P(B) este probilitatea marginala a lui B.

Exemplu de utilizare :
Intr-o scoala sunt 60% baieti si 40% fete. Fetele poarta pantaloni si fuste in numar egal, iar baietii doar pantaloni. Un observator vede de la distanta un elev ce poarta pantaloni. Care este probabilitatea ca acel elev sa fie fata ?

Raspunsul il putem afla folosing formula lui Bayes, unde :
P(A) – probabilitatea ca elevul sa fie fata indiferent de alta informatie. Avand in vedere ca observatorul vede un student oarecare, acest lucru ca fiecare elev are aceeasi probabilitate de a fi vazut, si faptul ca sunt 40% fete, inseamna ca aceasta probabilitate e 0.4

P(B|A) – probabilitatea ca un elev sa poarte pantaloni, avand in vedere ca elevul este fata. Aceasta este de 0.5 deoarece stim ca fetele poarta si fuste si pantaloni in numar egal.

P(B) – probabilitatea ca elevul sa poarte pantaloni indiferent de alta informatie. Deoarece toti baietii poarta pantaloni, si jumatate de fete poarta pantaloni aceasta este de 0.5 x 0.4 + 1 x 0.6 = 0.8
Cu aceste informatii aplicand formula aflam ca probabilitatea noastra este egala cu :

Filtre Bayesiene
Filtrarea Bayesiana a spam-urilor este o tehnica statistica de filtrare a e-mailurilor. Ea se foloseste de clasificarea naiva Bayes pentru a identifica spam-uri e-mail. Primul program de filtrare de e-mailuri care sa foloseasca clasificarea Bayes a fost iFile creat de Jason Rennie publicat in 1996. Programul era folosit pentru a sorta e-mailurile pe foldere.

Prima publicatie academica privind filtrele Bayesiene, intitutalata "A Bayesian approach to filtering junk e-mail" a fost realizata de M.Sahami, S.Dumais, D. Heckerman si E.Horvitz in 1998. Variatii ale acestei tehnici de baza au fost implementate in lucrari de cercetare si
produse software comerciale.

  • pag. 1
  • pag. 2
  • pag. 3
  • pag. 4
  • pag. 5
  • pag. 6
  • pag. 7
  • pag. 8
  • pag. 9
  • pag. 10

Nota explicativa
Referatele si lucrarile oferite de Referate.ro au scop educativ si orientativ pentru cercetare academica.

Iti recomandam ca referatele pe care le downloadezi de pe site sa le utilizezi doar ca sursa de inspiratie sau ca resurse educationale pentru conceperea unui referat nou, propriu si original.

Referat.ro te invata cum sa faci o lucrare de nota 10!
Filmele zilei
Linkuri utile
Programeaza-te online la salonul favorit Descarca gratuit aplicatiile pentru iOS si Android Filmulete haioase Filme, poante si cele mai tari faze Jocuri Cele mai tari jocuri de pe net Referate scoala Resurse, lucrari, referate materiale pentru lucrari de nota 10 Bacalaureat 2019 Vezi subiectele examenului de Bacalaureat din 2019 Evaluare Nationala 2019 Ultimele informatii despre evaluare nationala
Toate imaginile, textele sau alte materiale prezentate pe site sunt proprietatea referat.ro fiind interzisa reproducerea integrala sau partiala a continutului acestui site pe alte siteuri sau in orice alta forma fara acordul scris al referat.ro. Va rugam sa consultati Termenii si conditiile de utilizare a site-ului. Informati-va despre Politica de confidentialitate. Daca aveti intrebari sau sugestii care pot ajuta la dezvoltarea site-ului va rugam sa ne scrieti la adresa webmaster@referat.ro.
Confidentialitatea ta este importanta pentru noi

Referat.ro utilizeaza fisiere de tip cookie pentru a personaliza si imbunatati experienta ta pe Website-ul nostru. Te informam ca ne-am actualizat politica de confidentialitate pentru a integra cele mai recente modificari privind protectia persoanelor fizice in ceea ce priveste prelucrarea datelor cu caracter personal. Inainte de a continua navigarea pe Website-ul nostru te rugam sa aloci timpul necesar pentru a citi si intelege continutul Politicii de Cookie. Prin continuarea navigarii pe Website-ul nostru confirmi acceptarea utilizarii fisierelor de tip cookie conform Politicii de Cookie. Nu uita totusi ca poti modifica in orice moment setarile acestor fisiere cookie urmarind instructiunile din Politica de Cookie.


Politica de Cookie
Am inteles