Эту историю я слышал в трёх разных вариантах от трёх разных аспирантов в разных университетах. Если вам кажется, что это городская легенда: вам не кажется. Но звучит правдоподобно.
Главный герой
Михаил, аспирант второго года в одном из московских технических вузов (название вуза в разных версиях разное). Возраст 26 лет. Диссертация по теме теории сигналов в радиоэлектронике (точная формулировка тоже плавает между версиями).
Что общего во всех версиях: Михаил написал хорошую диссертацию за 1.5 года вместо положенных 3, имел поддержку научного руководителя, готовился к защите. Текст диссертации был в Word, в одном файле объёмом около 250 страниц с уравнениями, графиками и обширными списками литературы.
Идея
В какой-то момент Михаил решил, что его работа заслуживает внимания не только академического сообщества. Идея пришла ему в голову после просмотра TikTok-видео какого-то студента из Канады, который рассказывал о своей научной работе под трендовую музыку.
Михаил решил сделать "научный TikTok-канал". План: выкладывать короткие видео, в каждом по одной интересной мысли из диссертации, с трендовой музыкой на фоне, с визуальными эффектами. Цель: вирусность и популяризация науки.
Для удобства Михаил решил сделать так: загрузить весь текст диссертации в Notion с тегами и разделами, потом из Notion копировать кусочки в TikTok. Это казалось разумным.
Аутсайдер в этой истории
В этой истории есть аутсайдер: AI-сервис, который Михаил решил использовать. Это был один из новых на тот момент сервисов "автоматического создания видео из текста". Пишешь промпт, AI генерирует короткое видео с озвучкой.
Михаил решил: загрузим весь текст диссертации в этот сервис, попросим выделить "интересные моменты", сгенерировать видео для каждого. Сервис требовал прикреплять файл напрямую, без копирования по частям.
Михаил прикрепил весь файл диссертации.
Что произошло
То, что Михаил не учёл: этот конкретный сервис, при выполнении бесплатной операции, в своих условиях использования включал пункт о праве сервиса использовать загруженные тексты для тренировки своих моделей. Михаил, как все нормальные люди, условия не читал.
Сервис выполнил задачу: создал серию из 30 коротких видео по основным тезисам диссертации. Михаил начал выкладывать их в TikTok с трендовой музыкой.
Видео начали набирать просмотры. Первое набрало 3 тысячи, второе 8 тысяч, третье 25 тысяч. Михаил радовался.
К десятому видео в комментариях начали появляться странные сообщения от других аспирантов: "А ты не из того же университета что и автор работы X?", "Это же текстуально совпадает с препринтом такого-то автора". Михаил пугался, но списывал на совпадения.
Открытие
Через две недели после публикации первого видео, у Михаила состоялась встреча с научным руководителем. Тот выглядел расстроенным и спросил: "Михаил, я видел сегодня препринт на arxiv по нашей теме. От какого-то автора с Кипра, имени я раньше не слышал. И знаешь, что меня удивило? Структура и формулировки очень похожи на твою работу".
Михаил проверил препринт. И действительно, текст препринта совпадал с его диссертацией на 80%. С небольшими перефразировками, но суть та же. Имя автора (которое не нашли в базах данных, фейковое) опубликовало работу за неделю до того, как Михаил планировал свою защиту.
Как это случилось: AI-сервис, в который Михаил загрузил диссертацию, не только сгенерировал видео, но и попутно "обработал" текст для тренировки и (по неподтверждённой информации) частично слил его через утечку данных через одного из своих платных клиентов. Этот клиент опубликовал работу первым.
Финал
Михаилу пришлось радикально переписывать диссертацию. Тема осталась той же, но методология и формулировки полностью изменены. Защита перенесена на полтора года.
TikTok-канал он закрыл. AI-сервис продолжает работать.
Эпилог
Я повторю: эта история передаётся в нескольких вариантах. В одном из них Михаил подал в суд на AI-сервис и выиграл. В другом.Михаил вообще не аспирант, а студент магистратуры. В третьем, это была не диссертация, а патент.
Но повсюду центральный месседж один: не загружай свои уникальные тексты в облачные AI-сервисы, если ты не хочешь чтобы они стали публичным достоянием.
А правда это или нет, судите сами.
Эта история выглядит подозрительно литературно. Слишком хорошо сложен сюжет. Но проблема "слива" приватных текстов через AI-сервисы реальна и обсуждается в академических кругах. Где-то на стыке между легендой и предупреждением.



комментариев
Оставить комментарий
Email не публикуется и используется только для аватара Gravatar. Без него аватар будет случайный. Комменты модерируются автоматически (фильтр спама).