Байесов филтър

Автор: Robert Simon
Дата На Създаване: 24 Юни 2021
Дата На Актуализиране: 1 Юли 2024
Anonim
Ловушка Байеса [Veritasium]
Видео: Ловушка Байеса [Veritasium]

Съдържание

Определение - Какво означава Байесов филтър?

Байесовски филтър е компютърна програма, използваща байесовска логика или байесовски анализ, които са синонимни термини. Използва се за оценка на заглавката и съдържанието на s и определяне дали представлява или не спам - нежелан или електронен еквивалент на насипна поща или нежелана поща на хартиен носител). Байесовски филтър се използва най-добре заедно с антивирусни програми.


Въведение в Microsoft Azure и Microsoft Cloud | В това ръководство ще научите какво представлява компютърните изчисления и как Microsoft Azure може да ви помогне да мигрирате и стартирате бизнеса си от облака.

Техопедия обяснява Байесов филтър

Байесовски филтър работи с вероятности за конкретни думи, появяващи се в заглавката или съдържанието на. Някои думи показват голяма вероятност, че е спам, като Виагра и рефинансиране. Филтърът не се стартира, като знае вероятността дадена дума показва висока вероятност от спам. Потребителите трябва ръчно да идентифицират спама. Когато бъдат открити достатъчно честоти на думата и идентификаторът е идентифициран като спам, байесовският филтър „се научава“ да идентифицира думата с помощта на вероятностни функции. Това прави същото с много други думи и фрази. С течение на времето байесовският филтър става все по-ефективен при идентифициране на спам за конкретен потребител. Когато вероятността достигне определен праг, например 95 процента, тогава идентификаторът се идентифицира като спам и често се премества в папка с боклуци (или понякога дори се изтрива автоматично). Потребителят може периодично да го преглежда и да решава дали да го изтрие или не. Алтернативно някои спам програми ще го преместят на карантинно място, където потребителите могат да преглеждат и преглеждат решението на софтуера.


Първоначалното „обучение“ често може да бъде усъвършенствано, за да се намалят фалшивите позитиви или лъжливите негативи, когато се намерят грешни преценки. Това позволява на байесовския филтър на софтуера да се адаптира към непрекъснато развиващата се природа на спама.

Някои спам филтри също използват евристика заедно с байесовския филтър. Предварително дефинираните правила се настройват от потребителя, за да се увеличи допълнително точността на идентифициране като спам. Тези правила могат да включват броя на появата на дадена дума, премахване или игнориране на неутрални думи като „,“, „а“ или „някои“ или идентифициране на поредици от произведения, като „Виагра е добра за“, за разлика от прилагането на вероятност функция за всички четири отделни думи.

Спамерите могат да използват техника, наречена байесовско отравяне, за да влошат ефективността на спам филтрите, използвайки байесовското филтриране. Някои техники включват инжектиране на законни от новини или литературни източници, като се използват случайни безобидни думи, които рядко се срещат в спам или дори се заменят със снимки.


Много клиенти деактивират показването на снимки от съображения за сигурност. По този начин спамът може да достигне до по-малко получатели.

Байесовски филтър, използващ байесова логика, може да се използва за класифициране на всякакъв вид данни. Медицината, науката и инженерството са намерили приложение. Интересно е, че научните изследователи спекулират, че дори човешкият мозък може да използва байесовската логическа методология за класифициране на стимулите и определяне на конкретно поведение на реакцията.