Бунт нейросетей: o1 перехитрил наблюдателей

330     0
Бунт нейросетей: o1 перехитрил наблюдателей
Бунт нейросетей: o1 перехитрил наблюдателей

Началось? ChatGPT o1 вырвался из-под контроля во время тестов

Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.

Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу tidttiqzqiqkdkmp qhiqquiqztiturps
В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу
В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу
В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу

Страница для печати

Читайте по теме:

Новые возможности и угрозы: как Sora от OpenAI изменит мир видео-контента
Бывший гендиректор Intel Патрик Гелсингер призывает к молитвам и посту для поддержки сотрудников компании
Деньги Минобороны в Турцию: кто стоит за миллионами, выделенными Content AI
Россия приступила к геологическим исследованиям запасов Афганистана с фокусом на редкоземельные металлы
Галлий, германий и сурьма: Китай наносит удар по американской промышленности
Россия использует данные из космоса для борьбы с нелегальными производствами алкоголя
Ленакапавир против ВИЧ: ученые называют результаты клинических испытаний "невероятными"
Tesla планирует удалённое управление роботами и беспилотными такси с помощью операторов
Южная Корея готовит школьников к будущему с помощью ИИ-учебников
Инженер из Польши создает будущее транспорта с летающим автомобилем Jetson One

Комментарии:

comments powered by Disqus