Как определить дипфейки
Пока качественную подделку могут выявить только опытные спецы по кибербезопасности. В этот экспертный центр Следственного комитета России обычно не пускают журналистов. Подлинность речи здесь могут определить до микротона.
"Если отдельные звуки взять, они могут быть похожи, но, если взять целиком картинку, она уже будет отличаться. Как человек говорит, как он произносит конкретные звуки, какие у него паузы, заикается он, шепелявит", – объяснил старший эксперт отдела фоноскопических и лингвистических исследований СЭЦ Следственного комитета России Александр Бакин.
И это наше главное отличие. У нейросетей идеальная дикция и мелодичность речи. В разговоре мы чаще делаем паузы и меняем громкость, чем искусственный интеллект. А некоторые слоги мы не произносим чисто физически: гортань человека не способна передавать все звуки, которые может воспроизвести нейросеть.
Но именно в режиме реального времени цифровой фактчекинг возможен.
"Попросить его так вот помотать головой, поднять правую руку, поднять левую руку, нейросеть не успеет отреагировать на данный алгоритм, это будет выглядеть максимально неестественно", – отметил заместитель директора института высокотехнологичного права НИУ МИЭТ Генрих Девяткин.
Чтобы определить видео, которое было синтезировано, а не снято, придется присматриваться к каждому кадру: неестественные блики объектива, издаваемые звуки не соответствуют движению губ и даже отражение в глазах – нейросети не всегда сохраняют картинку на радужной оболочке человека.