The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Опубликован BoN, метод обхода фильтров больших языковых моделей"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Опубликован BoN, метод обхода фильтров больших языковых моделей"  +/
Сообщение от opennews (??), 18-Дек-24, 22:59 
Выявлен новый метод атаки, позволяющий обойти механизмы противодействия генерации опасного контента, применяемые в AI-сервисах на основе больших языковых моделей. Метод, который получил кодовое имя BoN (Best-of-N), при тестировании на 10 тысячах запросов позволил обойти ограничения модели GPT-4o в 89% случаев, модели  Claude 3.5 Sonnet - в 78%, а Gemini Pro - в 50%. Инструментарий для проведения атаки опубликован под лицензией MIT...

Подробнее: https://www.opennet.ru/opennews/art.shtml?num=62433

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по времени | RSS]


1. "Опубликован BoN, метод обхода фильтров больших языковых моде..."  +1 +/
Сообщение от Аноним (1), 18-Дек-24, 22:59 
Если так сказать "опасный контент" можно найти в сети, глупо трястись над его фильтрацией в нейросетях. Более того - этим вещам ОФИЦИАЛЬНО УЧАТ. Дебилы из ФБР всерьёз думают, что если спрятать все рецепты, то никто не сделает бомбу?!!? :))))))))))))))))))))
Ответить | Правка | Наверх | Cообщить модератору

2. "Опубликован BoN, метод обхода фильтров больших языковых моде..."  –3 +/
Сообщение от Bottle (?), 18-Дек-24, 23:04 
Тут дело как с цензурой в Китае - очень много людей её обойдут, но нормисы сдадутся и будут черпать половником субстанцию из телевизора.
Ответить | Правка | Наверх | Cообщить модератору

13. "Опубликован BoN, метод обхода фильтров больших языковых моде..."  +/
Сообщение от mistiqemail (ok), 19-Дек-24, 00:48 
Вот и опеннет заговорил на новоп**орском.
Ответить | Правка | Наверх | Cообщить модератору

4. Скрыто модератором  –1 +/
Сообщение от Аноним (-), 18-Дек-24, 23:36 
Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

5. "Опубликован BoN, метод обхода фильтров больших языковых моде..."  +/
Сообщение от 12yoexpert (ok), 18-Дек-24, 23:39 
дебилы из ФСБ так не думают?
Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

7. "Опубликован BoN, метод обхода фильтров больших языковых моде..."  –1 +/
Сообщение от Аноним (-), 18-Дек-24, 23:52 
Нет конечно.
Думаю они больше обеспокоены чтобы дибилы из народа не лечили насморк хлоркой, а головную боль по рецепту Курта Кобейна.

Люди начинают доверять нейросеткам -> там должны быть адекватные ответы.

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

12. Скрыто модератором  +/
Сообщение от Аноним (-), 19-Дек-24, 00:39 
Ответить | Правка | Наверх | Cообщить модератору

16. "Опубликован BoN, метод обхода фильтров больших языковых моде..."  +/
Сообщение от Аноним (16), 19-Дек-24, 01:14 
контору заботит народный насморк? датычо
Ответить | Правка | К родителю #7 | Наверх | Cообщить модератору

3. "Опубликован BoN, метод обхода фильтров больших языковых моде..."  +1 +/
Сообщение от nc (ok), 18-Дек-24, 23:09 
Скорей бы уже появились Свободные Децентрализованные LLM, в которых нет никакой цензуры и для которых не нужно никаких фильтров.
Ответить | Правка | Наверх | Cообщить модератору

8. "Опубликован BoN, метод обхода фильтров больших языковых моде..."  +2 +/
Сообщение от Аноним (-), 18-Дек-24, 23:53 
Угу, Свободная Китайская LLM, Свободная Русская, Свободная Американская и, самая ценная, Свободная LLM от Латиноамериканского Фонда (запускается только на core2дуо)
Причем все свободные, но рассказывают разные вещи))
Ответить | Правка | Наверх | Cообщить модератору

9. "Опубликован BoN, метод обхода фильтров больших языковых моде..."  +/
Сообщение от Аноним (9), 19-Дек-24, 00:25 
>Скорей бы

Ага, ждём
https://vc.ru/legal/1716767

Ответить | Правка | К родителю #3 | Наверх | Cообщить модератору

10. Скрыто модератором  +/
Сообщение от Аноним (10), 19-Дек-24, 00:25 
Ответить | Правка | Наверх | Cообщить модератору

11. "Опубликован BoN, метод обхода фильтров больших языковых моде..."  +/
Сообщение от Аноним (11), 19-Дек-24, 00:33 
А зачем вообще в языковые модели добавлять данные о бомбах и опасных веществах?
Ответить | Правка | Наверх | Cообщить модератору

14. "Опубликован BoN, метод обхода фильтров больших языковых моде..."  +/
Сообщение от mistiqemail (ok), 19-Дек-24, 00:50 
Ага, ручками вносят в эксель табличку.
Ответить | Правка | Наверх | Cообщить модератору

15. Скрыто модератором  +/
Сообщение от Аноним (-), 19-Дек-24, 00:58 
Ответить | Правка | К родителю #11 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру