Сигурност

Глобален дейтатлон търси AI решения за борба с пропагандата и “фалшивите новини”

Computer World

През последните години наблюдаваме възхода на социалните медии, който позволи на хората да споделят информация с голям брой онлайн потребители, без тя да минава особен качествен контрол. От друга страна, този процес даде възможност на всеки да бъде създател на съдържание и позволи много по-бързото разпространение на информацията. Погледнат от друга страна, този факт направи възможно злонамерени потребители да разпространяват по-бързо дезинформация и потенциално да достигат до по-голяма аудитория. В някои случаи това включва изграждането на сложни профили за отделните потребители въз основа на комбинация от психологически характеристики, мета-данни, демографски данни и местоположение, след което чрез микро-насочване “фалшивите новини“ и пропагандните кампании, които са основни оръжия за постигане на политически или финансови дивиденти, се персонализират.

Фукуяма не би могъл да сгреши повече, предричайки края на историята и триумфа на либералната демокрация през 1989 г. Зловредните актьори използват фалшиви новини, пропаганда и дезинформация, за да развият опасни идеологии. В такъв случай можем ли да използваме изкуствен интелект, за да си възвърнем доверието в журналистиката и да премахнем предубедени и ненадеждни източници на информация?”, пита в своя публикация Виктор Сендеров, съорганизатор на глобалната инициатива Hack the News Datathon, която си е поставила за цел да подпомогне борбата с “фалшивите новини” и пропагандата в интернет пространството.

 

В последните години разпространението на невярна информация се превърна в глобално явление и вече 18 държави в различни точки на света са съобщавали за проблеми, свързани с дезинформация по време на избори. За да стане ясен мащабът на тази тенденция, трябва да се обърне внимание на факта, че 150 милиона потребители на Facebook и Instagram са имали взаимодействие с пропагандни политически реклами, а Cambridge Analytica имаше достъп до данните на 87 милиона потребители на Facebook. Потенциалното въздействие на “фалшивите новини” пък може да се види както по време на президентските избори в САЩ през 2016 г., така и при референдума за Брекзит във Великобритания.

"Ядрената, биологичната и кибер-войната най-често се посочват като водещи заплахи за човечеството. Реалността показва, че ние вече обитаваме среда на информационна война с фалшиви новини и манипулация на общественото мнение, което е изключително опасно", казва и проф. Питър Кокрейн от Университета в Съфолк, Великобритания, член на консултативния съвет към Hack the News Datathon.

По принцип дезинформацията има различни форми като „фалшиви новини“, предразсъдъци и чиста пропаганда, като последната е една от най-опасните ѝ форми. Институтът за анализ на пропагандата (действащ между 1937 и 1942 г.) дава следната дефиниция за пропаганда: „Изразяване на мнение или действие от лица или групи, умишлено създадени да влияят върху мненията или действията на други лица или групи по отношение на предварително заложени цели".

Трябва да се има предвид обаче, че пропагандата, макар и свързана с “фалшивите новини”, е нещо различно от тях. Двата термина се припокриват само частично. Възможно е пропагандата да се основава на достоверна информация, а в същото време съществуват и “фалшиви новини”, които нямат пропаганден характер.

Както никога досега, възможностите за разпространение на пропаганда са в ръцете на всеки бизнес, независимо от неговия размер. Затова и осъзнаването на потребителите е от решаващо значение за намаляване на нейното въздействие”, категоричен е д-р Алберто Барън-Седеньо, съорганизатор на Hack the News Datathon от страна на Qatar Computing Research Institute (QCRI), HBKU.

Според експертите един от най-добрите начини за борба с пропагандата и нейното влияние минава през това потребителите да бъдат обучени как да я разпознават. Това определено би помогнало да се намали разпространението на подобна информация чрез споделяне в социалните медии, както и въздействието ѝ върху потребителите, които вече са имали достъп до нея. Както каза Гьобелс, министър на пропагандата в нацистка Германия: „Пропагандата става неефективна в момента, в който я осмислим”.

Наличието на практически инструмент, който може да регистрира използването на пропаганда в новините, е важно и може да повлияе на начина, по който читателите консумират новини в бъдеще”, добавя и д-р Джовани да Сан Мартино, също част от организацията на Hack the News Datathon от QCRI.

Точно разработването на инструменти за откриване на пропагандата в новините е и целта на първия Hack The News Datathon, който се провежда от 21 до 29 януари 2019 г. Той е организиран от QCRI и Data Science Society, глобална общност от хора, занимаващи се с науката за данните, която стои зад няколко подобни международни инициативи.

 

Надяваме се, че този дататон ще допринесе за преустановяването на порочните практики, които съществуват в момента при създаването и консумацията на новините. Ние стоим зад културата с отворен код и затова всички модели, разработени по време на дататлона, както и набора от данни, ще бъдат публично достъпни, така че да могат да бъдат използвани от всеки, който се интересува, включително изследователи по сигурността, компании и дори отделни потребители на новини”, обръща внимание Серги Сергиев, основател на Data Science Society.

За разлика от предишни усилия в тази посока, фокусирани върху проверката на твърдения, факти, слухове или новинарски статии, Hack The News Datathon има за цел анализа на използването на пропагандни техники. Всъщност наличието на пропаганда в новините често е трудно забележимо. И все пак, ситуацията се променя, ако потребителите се оглеждат за специфичните техники.

Надяваме се този дататон да постави началото на многообещаваща изследователска работа в борбата с пропагандата”, казва д-р Преслав Наков, съорганизатор на инициативата от QCRI, и добавя: „Подобно на борбата със спам кампаниите, тази с дезинформацията е състезателна дисциплина, при която злонамерените актьори постоянно променят и подобряват своите стратегии. И все пак начините, по които те могат да адаптират посланието си, са ограничени, тъй като ефективната пропаганда изисква използването на определени техники. Точно там искаме да нанесем нашия удар".

Фокусирането върху индивидуалните техники дава две ключови предимства. На първо място, то позволява на системата, базирана на изкуствен интелект (AI), да обясни на потребителя защо определена статия се счита за потенциално пропагандистка. От друга страна то може да научи потребителите как да разпознават употребата на пропагандни техники в реални новини. Не на последно място, подобен подход допълнително облекчава системите от необходимостта да оценяват наличието на пропаганда на ниво статия, което е трудно и потенциално субективно, тъй като при повечето дефиниции, за да се докаже наличието на такава, трябва преди това да се докаже определено намерение. За разлика от това, откриването на техники за пропаганда е много по-лесно и обективно.

Пропагандата е наявсякъде в новините, варираща от крещящо натрапване на определени тези до изключително фино и ефективно промиване на мозъци. Както и в миналото, това може да доведе до огромни икономически и социални бедствия. За да се преборим с този мащаб, са необходими алгоритми. За щастие, вече се появяват първите анотирани данни за пропаганда в новините. С нетърпение очаквам гениалните модели за машинно обучение, които могат да се използват за автоматично откриване на пропагандни техники”, коментира и Лора Толоси-Халачева, съорганизатор на дейтатлона.

Основният екип, който стои зад дефинирането на задачата и подготовката на данните, се състои от петима души - трима учени от Qatar Computing Research Institute (д-р Джовани да Сан Мартино, д-р Алберто Барон-Седеньо и д-р Преслав Наков), които имат сериозен опит в обработката на естествен език (NLP) и борбата с дезинформацията като част от проекта Tanbih, д-р Лаура Толоси-Халачева, NLP изследовател с опит в анализа на слухове в социалните медии, свързани с Брекзит, и Виктор Сендеров, NLP изследовател и победител в двa предишни дататлона. Международният екип на инициативата е подкрепен от доставчика на глобални медийни и бизнес услуги, свързани с анализа на данни, A Data Pro.

В рамките на дейтатлона участие взимат над 250 човека от 50 страни, както и консултативен съвет от 15 добре известни експерти от водещи световни институции, включително MIT, Университетът в Кеймбридж, Университетът на Мичиган в Ан Арбър, Университетът на Калифорния в Санта Барбара, Университетът на Британска Колумбия, Университетът в Шефилд. Техническият университет в Дармщат, Тексаският университет в Арлингтън, Университетът в Съфолк, Катарският университет, Институтът по информатика “Макс-Планк”, ISI Foundation, Amazon и Full Fact.

След като имахме нещастието да бъдем обект на сериозна пропаганда по време на комунистическия режим в Източна Европа през 80-те години, преживяхме от първо лице катастрофалните последици, които може да има тя. Много съм развълнувана да видя това усилие за справяне с пропагандата, за което очаквам да има дългосрочни положителни резултати. Благодарна съм на организаторите и на всички участници за тяхната работа по създаването на ресурси и алгоритми, които могат да ни помогнат да откриваме и по този начин да избягваме пропагандата в новините”, коментира проф. Рада Михалце от Мичиганския университет в Ан Арбър, член на консултативния съвет на дейтатлона.

Според проф. Уилям Уанг от Калифорнийския университет в Санта Барбара, също член на консултативния съвет на инициативата, фалшивите новини и пропагандата заплашват истинността на журналистиката като цяло и се превръщат в централен проблем за всички интернет компании. “Това може да доведе до съвсем реално, офлайн насилие и проблеми за националната сигурност. Затова именно технологиите за обработка на естествен език трябва да преминат отвъд академичните среди и да окажат положително въздействие върху обществото”, категоричен е той.

Победителите от дататона и най-добрите AI решения за откриване на пропаганда ще бъдат излъчени и представени на официалното закриване на Hack News Datathon на 29 януари.





© Ай Си Ти Медиа ЕООД 1997-2019 съгласно Общи условия за ползване

X