Ученые отмечают, что системы машинного обучения и искусственного интеллекта имеют ограниченные возможности разрешать неясности в отношении неопознанных летающих объектов, если применять их исключительно к устным сообщениям свидетелей. Заключение бросает вызов проектам, целью которых является классификация повествований о наблюдениях с использованием обработки естественного языка и больших языковых моделей.
Дебаты набрали обороты после того, как исследователи представили конвейер машинного обучения, который анализирует отчеты Национального центра сообщений об НЛО на предмет «нарративной драмы». Предложение сочетает в себе структурированные функции, анализ свободного текста, модели повышения градиента и интегрированную объяснимость. Сторонники метода утверждают, что свидетели создают самые длинные доступные публичные записи неопознанных аномальных явлений (НАП) с соответствующей языковой структурой для анализа.
Ограничения свидетелей как источника доказательств
Надежность человеческих показаний в научных вопросах имеет документально подтвержденные недостатки. В правовой системе из 51 случая оправдания приговоренных к смертной казни 45,9% были связаны с ненадежными информаторами, а 25,2% произошли в результате ошибочного опознания очевидцами. Эти цифры показывают серьезные недостатки в способности человека точно сообщать о событиях.
Сообщения об автомобильных авариях ясно иллюстрируют эту хрупкость. Рассказы об одном и том же событии, собранные от разных людей, часто содержат существенные противоречия. Учитывая, что существует только одна физическая реальность, не все версии могут быть верными одновременно. Избыточность повествования не компенсирует отсутствие объективного инструментария.
Исследователи подчеркивают, что люди не являются надежными научными детекторами. Предвзятость отбора, перекрестное загрязнение рассказов свидетелей и тенденция к построению связных историй подрывают качество данных, собранных с помощью показаний. Эти проблемы преследуют любой последующий анализ, независимо от сложности применяемого алгоритма.

Качественные данные в сравнении с объемом неопределенной информации
Обилие малозначимых сообщений не компенсирует их отсутствие научной полезности. Многие наблюдения НЛО являются результатом ошибочно идентифицированных природных явлений или земных технологий, скрытых шумом разнородных наборов данных. Накопление более запутанных повествований не устраняет двусмысленности относительно реальной природы наблюдаемых объектов.
Проект Галилео, возглавляемый Ави Лебом, устанавливает противоположный приоритет: получение высококачественных данных, полученных одновременно с нескольких направлений наблюдения. Эта конструкция позволяет определить расстояние, скорость и ускорение объектов в небе. Без надежных измерений расстояний становится невозможным оценить, насколько аномален движущийся объект.
Международная федерация футбола (ФИФА) иллюстрирует этот принцип в другом контексте. Вместо того, чтобы анализировать рассказы вратарей, судей и болельщиков с помощью передовых систем искусственного интеллекта, организация внедрила технологию Goal Line (GLT) и видеопомощник рефери (VAR). GLT использует 14 высокоскоростных камер, чтобы подтвердить, пересек ли мяч линию, отправляя результат судье в течение одной секунды. VAR просматривает отснятый материал в режиме реального времени, чтобы обеспечить общую точность. Инструментарий, а не повествование, разрешает двусмысленность.
Характер проблемы интерпретации
Когда информация ограничена, разведка действует в жестких рамках. Размытые видеоролики НЛО, выпущенные без учета расстояния до камеры, не решают вопросы о том, отклоняются ли объекты от пределов производительности человеческих технологий. Качество данных определяет то, что можно сделать, а не сложность модели.
Ансамбль сложных моделей искусственного интеллекта, машинного обучения, больших языковых моделей и обработки естественного языка не устраняет разрыв между плохими данными и надежной интерпретацией. Текстовый анализ переплетенных повествований, часто загрязненный информацией, которой обмениваются свидетели, создает артефакты, которые больше отражают социальную структуру повествования, чем реальность наблюдаемого явления.
Президент Трамп объявил 17 апреля 2026 года, что скоро будет опубликована первая волна секретных файлов об НЛО. Главный вопрос остается: будут ли выпущенные видео самыми интригующими или просто наиболее драматично задокументированными? Без информации о расстоянии, скорости и ускорении захваченных объектов широкий выпуск сырья может подпитывать спекуляции, не устраняя фундаментальных неясностей.
Приоритеты тщательного расследования
Исследователи, связанные с Проектом Галилео, устанавливают четкую иерархию исследования аномальных явлений:
- Многоугольные приборы высокого разрешения для одновременного сбора данных
- Вывод физических параметров (расстояние, скорость, ускорение) с разных точек зрения
- Исключение известных природных явлений и наземных технологий посредством инструментального анализа
- Снижение систематической ошибки отбора за счет постоянного мониторинга, а не сбора добровольных отчетов
- Приоритет высококачественных данных перед большими объемами неоднозначных повествований
Совпадение показаний свидетелей по схожим описаниям не подтверждает эти описания. Общие истории часто отражают перекрестное загрязнение информации, а не сближение с истиной. Основная физическая реальность остается независимой от повествовательного консенсуса.
Последствия для будущих выпусков данных
Публикация правительственных файлов об НЛО дает возможность оценить реальное качество данных, имеющихся в государственной власти. Если в видеороликах отсутствует инструментальный контекст, информация о платформе захвата, калибровке камеры, геометрических параметрах, они будут способствовать скорее спекуляциям, чем научным знаниям.
Высококачественные данные стоят тысячи великолепных языковых моделей. Изображение с полным физическим контекстом превышает тысячу слов без обоснования. Эта предпосылка направляет работу над аномальными явлениями, а также любые строгие научные исследования. Сложность вычислений не заменяет соответствующее оборудование и не компенсирует намеренный сбор плохих данных.