Иновативен проект открива следи от дезинформация на български | IT.dir.bg

17-11-2017 20-11-2018
Иновативен проект открива следи от дезинформация на български
Снимка: iStock by Getty Images/Guliver Photos

Иновативен проект открива следи от дезинформация на български

Вече са събрани близо 200 000 съобщения от различните канали

29 2216

Иновативен научен проект открива следи от дезинформация в българските социални медии. Проектът се казва "TRACES", от английски "следи", а продължителността му е една година. Той за първи път създава ресурси на български език, с помощта на които ще могат да се разпознават написани лъжи, казват изследователите. Те използват определението на Европейската комисия за дезинформация като "доказуемо невярна информация, която се разпространява целенасочено, с цел да се въведе в заблуждение обществеността".

Изследователите са събрали близо 200 000 съобщения от различните канали - Туитър, Телеграм и Фейсбук на български език, по теми, свързани с известни от медиите случаи на предполагаеми манипулации.

Отделно са създадени списъци с изрази на български, по които може да се определи дали даден текст съдържа лъжи. Механизмът е да се открива дезинформацията по езикови маркери. Списъците съдържат 18 категории с езикови феномени. В експеримента са поканени да участват двадесетима журналисти от български медии.

Проектът прави първата проверка дали в социалните медии могат да се открият следи на автоматично генерирани текстове, съдържащи невярна информация - станалите популярни напоследък дийпфейкове.

Проектът използва методи от психолингвистиката, езикознанието, журналистиката, и изкуствения интелект. Създадени са нови езикови ресурси за българския език - списъци с изрази за лъжа, измама и манипулация, както и са събрани данни от социалните медии, които са анотирани с балансирани гледни точки. Поради сложността на темата, проектът е подсилен юридически, съгласно българското и европейското законодателство.

Част от събраните ресурси ще бъдат споделени публично, но след подписване на определени юридически споразумения, с цел спазване на законодателството на Европейския съюз и правата на човека, като Общия регламент относно защитата на данните (GDPR), Законодателния акт за изкуствения интелект (AI Act), Хартата на основните права на Европейския съюз.

Сайтът на проекта е финансиран индиректно от Европейската комисия чрез AI4Media и в рамките на разработките на института за големи данни в полза на интелигентното общество ГЕЙТ, към СУ "Св. Климент Охридски".

В края на януари ще бъде организиран двудневен семинар за разпознаване на дезинформация и невярна информация, на който са поканени да участват както журналисти, така и хора, заинтригувани от темата. :

Иновативен проект открива следи от дезинформация на български

Иновативен проект открива следи от дезинформация на български

Вече са събрани близо 200 000 съобщения от различните канали

29 2216 Снимка: iStock by Getty Images/Guliver Photos

Иновативен научен проект открива следи от дезинформация в българските социални медии. Проектът се казва "TRACES", от английски "следи", а продължителността му е една година. Той за първи път създава ресурси на български език, с помощта на които ще могат да се разпознават написани лъжи, казват изследователите. Те използват определението на Европейската комисия за дезинформация като "доказуемо невярна информация, която се разпространява целенасочено, с цел да се въведе в заблуждение обществеността".

Изследователите са събрали близо 200 000 съобщения от различните канали - Туитър, Телеграм и Фейсбук на български език, по теми, свързани с известни от медиите случаи на предполагаеми манипулации.

Отделно са създадени списъци с изрази на български, по които може да се определи дали даден текст съдържа лъжи. Механизмът е да се открива дезинформацията по езикови маркери. Списъците съдържат 18 категории с езикови феномени. В експеримента са поканени да участват двадесетима журналисти от български медии.

Проектът прави първата проверка дали в социалните медии могат да се открият следи на автоматично генерирани текстове, съдържащи невярна информация - станалите популярни напоследък дийпфейкове.

Проектът използва методи от психолингвистиката, езикознанието, журналистиката, и изкуствения интелект. Създадени са нови езикови ресурси за българския език - списъци с изрази за лъжа, измама и манипулация, както и са събрани данни от социалните медии, които са анотирани с балансирани гледни точки. Поради сложността на темата, проектът е подсилен юридически, съгласно българското и европейското законодателство.

Част от събраните ресурси ще бъдат споделени публично, но след подписване на определени юридически споразумения, с цел спазване на законодателството на Европейския съюз и правата на човека, като Общия регламент относно защитата на данните (GDPR), Законодателния акт за изкуствения интелект (AI Act), Хартата на основните права на Европейския съюз.

Сайтът на проекта е финансиран индиректно от Европейската комисия чрез AI4Media и в рамките на разработките на института за големи данни в полза на интелигентното общество ГЕЙТ, към СУ "Св. Климент Охридски".

В края на януари ще бъде организиран двудневен семинар за разпознаване на дезинформация и невярна информация, на който са поканени да участват както журналисти, така и хора, заинтригувани от темата. :