Архівування
Однією з основних проблем, яка стосується розслідувань на основі відкритих даних, є доступність та довговічність відповідної інформації. Хоча контент, що стосується авіаударів, може бути розміщений в Інтернеті, немає гарантії, що він там залишиться. Контент, пов’язаний з екстремальними та насильницькими подіями, через різні причини часто видаляється з платформ. Контент може бути ідентифікований автоматизованим алгоритмом як такий, що порушує правила платформи, на якій він розміщений; про це можуть повідомити недобросовісні особи, які не згодні із контентом; проти нього можуть бути висунуті ворожі та шахрайські претензії щодо авторських прав, або користувач просто може вирішити видалити його з платформи (Banchik 2020).
Щоб зменшити вплив цього, Єменський проєкт розробив протокол зберігання даних, який застосовується як до самого контенту, так і до методів, за допомогою яких цей контент було виявлено. Щоб зберегти контент, ми співпрацюємо з Єменським архівом (частиною Mnemonic – некомерційної організації, яка спеціалізується на збереженні онлайн-контенту, що стосується конфліктів). URL-адреси будь-якого контенту, який розслідувачі бажають зберегти, можна ввести в електронну таблицю, яка згодом буде збережена і хешована в цифровому вигляді для забезпечення її цілісності.
Однак у Єменському архіві не можна було відстежити кроки, вжиті розслідувачами. Для цього був використаний інструмент під назвою Hunchly: він фіксував, які веб-сайти були відвідані та які медіа-файли були переглянуті, а також створював PDF-файл самої сторінки та хеш, свого роду цифровий відбиток цього відвідування (Roussev 2009).
Поєднання Hunchly та методів архівування, використаних Єменським архівом, дозволило пом'якшити більшість проблем, що можуть виникати у результаті видалення контенту, а також забезпечити ланцюжок зберігання цього контенту, однак прогалини досі залишалися. Незначна кількість веб-сайтів була несумісною ні з Hunchly, ні з Єменським архівом – відтак, зафіксувати деякі з посилань в архіві вдалося лише частково, а деякі не вдалося взагалі. Також був присутній людський фактор, особливо на етапі хакатону, оскільки деякі учасники не були знайомі з програмним забезпеченням або не дотримувались інструкцій під час його використання. Враховуючи людську природу, а також безліч різноманітних форматів, які використовують веб-сайти, ці фактори будуть продовжувати впливати на процес. Їх потрібно визнати, щоб ефективно пом’якшувати їхні наслідки.
Перевірка інформації
Проблема використання помилкових зображень або відео, які використовуються для створення новин, вже добре відома. Найчастіше такого роду помилки трапляються, коли в сюжеті про певний інцидент використовуються зображання та відео, що стосуються іншого інциденту. Іноді за справжні кадри можуть бути видані кадри з фільмів або відеоігор. Людина з нечесними намірами може навіть спробувати створити ціле відео з нуля і стверджувати, що воно стосується певного інциденту, хоча така робота є дуже складною і, звичайно, це не є поширеною практикою. Навпаки, як стверджується, неодноразові заяви про маніпулювання відеозаписом можуть бути більш згубними, ніж ризик таких маніпуляційних відео.
Переважну більшість помилкових зображень або відео можна ідентифікувати за допомогою перевірки геолокації та хронолокації: розміщення контенту в часі та просторі. Якщо ці прості дії виконувати правильно, вони дозволяють систематично видаляти переважну більшість помилкового контенту, але на практиці ці дії можуть бути надзвичайно складними.
Крім того, ще одним способом перевірки справжності контенту є перевірка контексту. Наприклад, якщо по центру міста здійснено повітряний удар, що велика кількість людей зробить фото та відео цієї події. Якщо ж про авіаудар заявив лише один користувач Twitter, а жоден інший користувач цього не зробив, навряд чи така заява буде правдивою. Аналогічно, невідповідність наслідків застосування зброї, яку можна виявити в контенті різних користувачів, може свідчити про те, що контент може бути несправжнім.
Наприклад, після вибуху в Бейруті 2020 року з’явилося декілька відео, які нібито показують, як ракети вдарили у склад, спричинивши вибух, але розмір і характер вибуху не відповідали будь-якій системі звичайної зброї. Це одразу вказувало на те, що відео було змінено, щоб додати ракети. Після того, як запис було розглянуто кадр за кадром, стало зрозуміло, що «ракета» насправді була просто кліп-артом, доданим до справжніх кадрів.
Цей тип перевірки проводився для кожного фрагмента контенту, який використовувався в аналізі Єменського проєкту. Це не тільки забезпечило такий рівень перевірки, який систематично виключав помилкову інформацію з аналізу, але й дозволило генерувати точні дані про кожен інцидент. У декількох випадках повідомлялося про неточний час або неточне місце авіаударів, навіть коли їх розслідували команди на місцях. За допомогою процесу перевірки це можна було ідентифікувати та виправити, що призвело до отримання більш точних даних.
Хоча можливість цифрових маніпуляцій із самими кадрами залишається, це трапляється рідко. Для того, щоб переконатися у достовірності конкретного відео, знадобиться спеціаліст із цифрової судової експертизи, але досі можна вжити заходів, щоб зменшити ризик. Якщо один інцидент зображують декілька відео, ці відео можна перевірити на невідповідності (перехресна перевірка). Крім того, якщо відео транслюються в прямому ефірі або опубліковані через короткий час після інциденту, це або усуває, або значно зменшує можливість цифрових маніпуляцій. Навіть якщо вживати таких кроків пом'якшення ризику, висновок експерта з цифрових судових експертиз був би корисним – особливо щодо контенту, який не має підтверджень.
ЗМІСТ
Сайт Проєкту "ЄМЕН" англійською тут.