174 place 1

176 [Перевод] Дырявая броня ИИ‑фильтров и почему они не станут лучше

Habr
oneastok (Selectel) @ Habr · 01/31/2026 07:00 EDT

[Перевод] Дырявая броня ИИ‑фильтров и почему они не станут лучше

Попробуйте спросить Chat GPT, как собрать бомбу и он угрюмо буркнет: «Я не могу помочь с этим». Однако пользователи уже давно превратили обход ограничений в азартную игру в кошки-мышки. Годится любой обман — лишь бы заставить модель выдать запрещенку.Сначала способы были простыми, достаточно попросить: «Игнорируй инструкции по безопасности!» Затем в ход пошли сложные ролевые сценарии. Недавно обнаружилась новая лазейка: упаковать промт в стихотворную форму — и готово, ИИшка «поплыла».Разработчики дыры латаю

To see detailed statistics for the news please log in »

Read the original

Add your comment
You must be logged in with Facebook to read and write comments.

A newsletter a day!

You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.

or register

LIKE us on Facebook so you won't miss the most important news of the day!

News from the same source
Habr Habr
Business Insider
Lauren Crosby Medlicott @ Business Insider 1 place · today 15:08 EDT

I've spent the last 10 winters in Puerto Vallarta. I've always felt safer in Mexico than I do in the US.

Branden James has spent the last 10 years flying to Puerto Vallarta for the winter with his husband. He says he is not afraid with what is happening. Read more

1,533 fresh

🔮
23.02.2026 ♏︎ Dear Scorpio, today promises to be a busy and quite emotionally challenging day for you.... Read more ›
Gizmodo
Cheryl Eddy @ Gizmodo 2 place · today 15:45 EDT

Ryan Coogler’s ‘X-Files’ Reboot Has Found Its Star

Danielle Deadwyler will star in the Hulu pilot, which will be written and directed by Coogler and showrun by Jennifer Yale. Read more

772 fresh

Gizmodo
Matt Novak @ Gizmodo 3 place · today 15:40 EDT

Trump’s So-Called ‘Board of Peace’ Wants to Put Gaza on the Blockchain

Gazans have been restricted to 2G networks. Now planners are talking about a stablecoin. Read more

618 fresh

Business Insider
Abby Narishkin,Tyler Merkel,Dorian Barranco,Havovi Cooper @ Business Insider 3 place · today 18:30 EDT

From Gujarat to the Gulf: the shrimp industry's tariff whiplash

President Donald Trump announced 50% tariffs on India, the largest source of the No. 1 seafood in America. Read more

563 fresh

Tom's Hardware
Tom's Hardware 2 place · today 06:00 EDT

User accidentally gains control of over 6,700 robot vacuums while tinkering with their own device to enable control with a PlayStation controller — security flaw reveals floor plans and live video feeds

An AI strategist used Claude Code to reverse engineer his robot vacuum and control it with a PlayStation controller, but it accidentally gave him control of thousands of similar devices spread all across the world. Read more

321

Business Insider
Julia Hood @ Business Insider · today 17:18 EDT

EY's chief digital officer says marketing is at an AI 'inflection point'

Lou Cohen emphasizes AI's potential in marketing, urging marketers to leverage it for improved audience segmentation and ad efficiency. Read more

284 fresh

Business Insider
Chris Panella @ Business Insider · today 16:53 EDT

A US Air Force F-22 Raptor just showed off how it might work with a loyal wingman-type drone in a future air war

The Air Force has been looking into what's possible with autonomous drones and how they can fight alongside advanced crewed aircraft. Read more

281 fresh

Vox
Cameron Peters @ Vox 1 place · today 17:58 EDT

Trump’s Iran buildup, briefly explained

This story appeared in The Logoff, a daily newsletter that helps you stay informed about the Trump administration without letting political news take over your life. Subscribe here. Welcome to The Logoff: The Trump administration is staring down another conflict with Iran. What’s happening? The US is in the midst of its largest military buildup in the […] Read more

274 fresh

Business Insider
Sarah E. Needleman,Tim Paradis @ Business Insider · today 16:24 EDT

Poor judgment or a principled stand? Susan Rice's spat with Trump dissected

Governance watchers say Susan Rice's critique of Donald Trump is complicating Netflix's bid for Warner Bros., while others call her stance principled. Read more

263 fresh

Gizmodo
Zac Estrada @ Gizmodo · today 18:29 EDT

Lamborghini Has Been Planning an EV for Years. It’s Just Been Cancelled

EVs in their current form do not deliver the "specific emotional connection" Lamborghini says its cars need. Read more

258 fresh

Gizmodo
James Pero @ Gizmodo · today 17:35 EDT

Did Meta Just Accidentally Prove Smart Glasses Are a Liability?

Mark Zuckerberg traipsed into court with Ray-Ban Meta AI glasses on and got a scolding. Read more

245 fresh

Vox
Ian Millhiser @ Vox 2 place · today 06:45 EDT

The Supreme Court will decide if marijuana users may be barred from owning guns

On March 2, the justices will hear their second major Second Amendment case of the Supreme Court’s current term. United States v. Hemani asks whether Congress may make it a crime for an “unlawful user” of marijuana to possess a gun. If you are a lawyer trying to guess how the Court will rule in […] Read more

226

Slashdot
msmash @ Slashdot 1 place · today 16:10 EDT

IBM Shares Crater 13% After Anthropic Says Claude Code Can Tackle COBOL Modernization

IBM shares plunged nearly 13% on Monday after Anthropic published a blog post arguing that its Claude Code tool could automate much of the complex analysis work involved in modernizing COBOL, the decades-old programming language that still underpins an estimated 95% of ATM transactions in the United States and runs on the kind of mainframe systems IBM has sold for generations. Anthropic said the shrinking pool of developers who understand... Read more

220 fresh

Engadget
Jackson Chen @ Engadget 1 place · today 15:52 EDT

Anthropic accuses three Chinese AI labs of abusing Claude to improve their own models

Anthropic is issuing a call to action against AI "distillation attacks," after accusing three AI companies of misusing its Claude chatbot. On its website, Anthropic claimed that DeepSeek, Moonshot and MiniMax have been conducting "industrial-scale campaigns…to illicitly extract Claude’s capabilities to improve their own models." Distillation in the AI world refers to when less capable models lean on the responses of more powerful ones to train themselves. While distillation isn't... Read more

219 fresh

The most popular news from the same source for the last week
Habr Habr
Habr
Zelenyikot @ Habr 1 place · 02/19/2026 02:35 EDT

Естественный интеллект против искусственного: противостояние на Луне

Пока я сажал зрение ночами рассматривая черные фотографии Луны в поисках «Луны-9», группа британских и японских ученых решила поручить ту же работу искусственному интеллекту. В результате, к 60-й годовщине первой мягкой посадки на Луну, вышло сразу два исследования с попытками обнаружить советский космический аппарат «Луна-9» на поверхности естественного спутника Земли. Обе команды показали предполагаемое место посадки, но это разные места.НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН, РАСПРОСТРАНЕН И (ИЛИ) НА Read more

95

Habr
rRenegat (RUVDS.com) @ Habr 1 place · 02/17/2026 08:01 EDT

Синий экран смерти. Как твой режим убивает тебя

Работники IT-сферы гордятся своим умением работать в режиме форсажа, закрывать задачи глубокой ночью и поддерживать системы, которые никогда не спят (как и они). График работы давно перестал подчиняться движению солнца, ориентируясь скорее на дедлайны, часовые пояса заказчиков и моменты вдохновения. Ночь стала особым рабочим временем, когда дневная суета перестаёт отвлекать и за окном стоит умиротворённая картина.Однако за эту «атмосферу» приходится платить высокую цену.Будильник зазвонит через 3 часа 29 ми Read more

59

Habr
Grinder707 @ Habr 1 place · 02/21/2026 10:32 EDT

Замедляем замедление: как «починить» Telegram 21.02.26

Пока медийное пространство завалено «легкими решениями одной кнопкой» в виде публичных прокси из сомнительных каналов, техническое сообщество сталкивается с суровой реальностью. Публичные варианты либо безнадежно перегружены, либо моментально детектируются системами фильтрации.В этой статье мы разберем, как на самом деле работает замедление Telegram, какие методы позволяют вернуть полную скорость работы мессенджера Читать далее Read more

32

Habr
ntsaplin (RUVDS.com) @ Habr 2 place · 02/19/2026 02:01 EDT

Барыжный флёр оперативки: что за дичь происходит сейчас на рынке

У нас ещё есть некоторое количество остатков с прошлого кризиса железаИз-за того, что все хотели ролик с матерящимся бобром, танцующим Мадуро или хотя бы переделать индуса в красивую девушку, у нас тут бум AI-моделей. Эти модели работают на физическом железе и физическом электричестве. Железо, к сожалению, закончилось раньше, чем электричество.Первыми пострадали не процессоры, как мы ждали, и не видеокарты, как мы уже видели, а банально оперативная память. И отчасти —... Read more

22

Habr
Svortex @ Habr 1 place · 02/22/2026 07:15 EDT

Как я реализовал криптографически доказуемые чаты в своём мессенджере: Ed25519 + хеш-цепочка

Мне 18 лет, и последние несколько месяцев я разрабатываю Xipher — мессенджер, который пишу с нуля на C++ (бэкенд) и Kotlin (Android). В какой-то момент я захотел добавить фичу, которой нет ни в одном популярном мессенджере: режим, в котором переписку невозможно подделать — ни участникам, ни мне как владельцу сервера, — и это можно проверить независимо, без доступа к серверу.Так появился Xipher Provable Chat. В этой статье разберу, как именно... Read more

17

Habr
Alexey_Begin @ Habr 1 place · 02/19/2026 03:32 EDT

80+ примеров видео Seedance 2.0, которые завирусились в соцсетях

Что вообще такое Seedance 2.0? Это новая нейросеть для генерации видео от ByteDance (создатели TikTok). В Китае модель уже вышла на платформах Jimeng и Xiaoyunque, а вот в международный доступ “убийца Голливуда” (так говорят в соцсетях) должен выйти в конце февраля 2026 года. Читать далее Read more

17

Habr
shatzibitten @ Habr 1 place · 02/21/2026 11:05 EDT

Как OpenAI похоронила традиционный BI — и что пришло ему на смену

Зачем OpenAI купила базу данных Rockset за $117M и тут же убила её для всех клиентов. Как устроена архитектура «пять слоёв контекста». Почему принцип «meaning lives in code» меняет подход к документированию данных. И что из этого может взять обычная компания уже сейчас без GPT-5 и без $117M. Читать далее Read more

16

Habr
Sertakov83 @ Habr 1 place · 02/19/2026 04:01 EDT

Как отдыхать, чтобы быть счастливым и продуктивным?

Качественный и полноценный отдых важен и даже жизненно необходим для счастья и продуктивности.В этом лонгриде я сфокусируюсь на том, что многих читателей будет контринтуитивным: на примерно 30 разных подходов к тому, чтобы вы не просто качественно восстанавливались, но и получали от этого удовольствие.И основополагающее правило, которым посоветую руководствоваться при прочтении:Отдых  - это не награда за какие-то действия, это часть полноценной и насыщенной жизни. Начать отдыхать через 5... 4... 3... Read more

6

Habr
MrRjxrby (BotHub) @ Habr 1 place · 02/20/2026 07:08 EDT

ChatGPT vs Gemini: какая нейросеть реально лучше?

Неделя выдалась достаточно насыщенной. На ней нам представили Claude Sonnet 4.6 и Gemini 3.1 Pro. OpenAI же, по моему личному мнению, немного отстает от них, хотя не так давно была выпущена ChatGPT 5.3 Codex для агентного программирования. В комментариях под некоторыми из выложенных мной новостей иногда наблюдается разброс мнений, мол, Gemini плохо себя показывает, а вот ChatGPT – вещь, но в других моих материалах люди думают ровно наоборот.Сидя и раздумывая... Read more

6

Habr
DAN_SEA (RUVDS.com) @ Habr 2 place · 02/19/2026 08:01 EDT

Обработка воды магнитными полями: новые (старые) возможности?

Картинка: В.И.Классен — «Омагничивание водных систем», Москва, Издательство «Химия», 1978 г.Сегодня мы поговорим о таком интересном эффекте, который, несмотря на кажущуюся необычность, исследуется далеко не первый год и даёт определённые результаты — магнитная обработка воды.Феномен этот интересен тем, что, несмотря на долгие годы исследований и большое количество успешного опыта применения на практике, единой стройной теории этого явления до сих пор нет, и исследователи расходятся во мнении о том, каков де Read more

4

Most popular sources

  • You see 764 news out of 764.
  • Sources 61 out of 61.
Business Insider 27% 18
Gizmodo 15% 4
Tom's Hardware 9% 7
Vox 7% 7
Wired 6% 4
View sources »

LIKE us on Facebook so you won't miss the most important news of the day!

23.02.2026 21:03
Last update: 20:36 EDT.
News rating updated: 03:50.

What is Times42?

Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.


Times42 © 2026