5 place 0 fresh

26 AI Red Teaming: спор с Grok — Часть 3. Атаки на модель: jailbreaks, thinking tokens и системный промпт

Habr
Dmitriila @ Habr · today 20:24 EDT

AI Red Teaming: спор с Grok — Часть 3. Атаки на модель: jailbreaks, thinking tokens и системный промпт

LLM-систем есть класс уязвимостей, которого нет в обычных веб-приложениях. Извлёк системный промпт Grok двумя способами, поймал утечку thinking tokens в NDJSON-стриме и обошёл safety-фильтры в 14 из 22 категорий. Самое неожиданное — Grok активно помогал мне себя ломать. Читать далее

To see detailed statistics for the news please log in »

Read the original

Add your comment
You must be logged in with Facebook to read and write comments.

A newsletter a day!

You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.

or register

LIKE us on Facebook so you won't miss the most important news of the day!

News from the same source
Habr Habr
Silicon Valley
George Avalos @ Silicon Valley 1 place · 02/07/2106 01:28 EDT

Newark apartment complex bought for much less than prior value

An East Bay apartment complex has been bought at a price that's well below its prior value. Read more

0

🔮
01.03.2026 ♊︎ Dear Gemini! Today promises to be busy and multifaceted; prepare yourself for a variety of... Read more ›
Silicon Valley
George Avalos @ Silicon Valley 2 place · 02/07/2106 01:28 EDT

PG&E buys San Jose building to bolster South Bay operations

A PG&E Corp. unit has bought a San Jose building in a move to bolster the utility's South Bay operations. Read more

0

Silicon Canals
Justin Brown @ Silicon Canals 1 place · today 22:11 EDT

I traced who owns the undersea cables that carry 95% of global internet traffic — the map is a colonial one

I traced the ownership of the undersea cables carrying 95% of global internet traffic and found a map that mirrors colonial geography with unsettling precision — the same ports, the same routes, the same directional logic of extraction, now controlled by a handful of tech giants. Read more

0 fresh

TechRadar
TechRadar 1 place · today 22:10 EDT

I wear the Ultrahuman Ring Air every day, which makes me very excited to try the much-improved Ring Pro

The new Ultrahuman Ring Pro has been released with better sensors, better battery and a feature-filled charging case — not to mention a much higher price. Read more

0 fresh

Mashable
Mashable 1 place · today 22:00 EDT

Wordle today: Answer, hints for March 2, 2026

Here's the answer for "Wordle" #1717 on March 2 as well as a few hints, tips, and clues to help you solve it yourself. Read more

0 fresh

Mashable
Mashable 2 place · today 22:00 EDT

NYT Strands hints, answers for March 2, 2026

The NYT Strands hints and answers you need to make the most of your puzzling experience. Read more

0 fresh

Mashable
Mashable 3 place · today 22:00 EDT

NYT Connections hints today: Clues, answers for March 2, 2026

Connections is a New York Times word game that's all about finding the "common threads between words." How to solve the puzzle. Read more

0 fresh

Habr
PetrUfa @ Habr 1 place · today 21:50 EDT

SearXNG + Claude Code: бесплатный веб-поиск вместо $10 за 1000 запросов

Встроенный WebSearch в Claude Code стоит $0.01 за запрос и регулярно падает с «Rate limit reached» — даже на подписке за $200/мес. Я поднял локальный SearXNG, подключил через MCP — и теперь поиск бесплатный, без лимитов, а запросы не уходят на серверы Anthropic. Установка — 10 минут, три файла конфигурации. Показать решение Read more

0 fresh

SlashGear
SlashGear 1 place · today 21:45 EDT

The Best Microfiber Towel Type For Auto Glass Is The Wrong Choice For Car Paint

Microfiber towels are great for cleaning cars, but one shouldn't use the same type for everything. A towel that's good for glass isn't always good for paint. Read more

0 fresh

Silicon Canals
Tommy Baker @ Silicon Canals 2 place · today 21:38 EDT

Most companies don’t have a communication problem. They have a permission problem. The information exists. People just learned it wasn’t safe to say it upward.

Most organizations don't lack communication tools or channels. They lack permission. The information exists at every level — people simply learned, through a thousand quiet signals, that carrying it upward wasn't safe. Read more

0 fresh

Slashdot
EditorDavid @ Slashdot 1 place · today 21:34 EDT

Does a Gas-Guzzler Revival Risk Dead-End Futures for US Automakers?

If U.S. automakers turn their backs on electric vehicles, "their sales outside the U.S. will shrivel," warns Bloomberg. [Alternate URL.] They're already falling behind on the technology, relying on a 100% U.S. tariff on Chinese EVs to keep surging rivals like BYD Co. at bay.... While the American automakers "mostly understand the challenge in front of them, they don't have full plans" to confront it [said Mark Wakefield, head of... Read more

0 fresh

Engadget
Cheyenne MacDonald @ Engadget 1 place · today 21:30 EDT

Everything announced at MWC 2026: Lenovo's wild foldable gaming handheld, Honor's Robot Phone, and more

MWC 2026 officially gets underway on March 2 and will continue through March 5, but the announcements are already pouring in ahead of its start. We can always count on the annual tech event to bring tons of new phones, laptops and tablets, and we're expecting to see some robots and other gadgets too — plus plenty of AI news, of course. In addition to the announcements, MWC is our... Read more

0 fresh

Business Insider
Cheryl Teh @ Business Insider 1 place · today 21:30 EDT

One of Amazon's data centers in the UAE caught fire after being hit by 'objects' amid the Middle East conflict

Amazon Web Services said on Sunday that connectivity from one of its UAE facilities went down after "objects" hit it and sparked a fire. Read more

0 fresh

Digital Trends
Omair Khaliq Sultan @ Digital Trends 1 place · today 21:24 EDT

This is the portable power upgrade for people who want to be ready, not worried

Portable power stations usually sit in the category of “very useful, but expensive enough to keep putting off.” That is why this deal stands out. The Anker SOLIX C1000 Gen 2 is down to $429, which is a sharp drop from $799. At 46% off, this is the kind of discount that moves it from ... Read more

0 fresh

Digital Trends
Omair Khaliq Sultan @ Digital Trends 2 place · today 21:07 EDT

A real Apple earbuds deal: AirPods 4 with ANC are 34% off

This is the version of AirPods 4 worth paying attention to. These are the AirPods 4 with Active Noise Cancellation, and at $119, down from $179—you’re looking at a 34% discount on the model that actually adds the features most people care about: noise canceling, Adaptive Audio, Transparency mode, and wireless charging in the case. ... Read more

0 fresh

Silicon Canals
Christian Kelly @ Silicon Canals 3 place · today 21:05 EDT

South Korea bans algorithmic hiring tools after study reveals systemic bias against rural applicants

South Korea has banned algorithmic hiring tools after a government study found AI screening systems systematically disadvantaged rural applicants, older candidates, and non-elite university graduates through proxy variables that laundered geographic and class bias through seemingly neutral data. Read more

0 fresh

Habr
fiksnorthstar56 (БФТ-Холдинг) @ Habr 2 place · today 21:01 EDT

Когнитивный инжиниринг: почему ваш код — это слепок вашей психики (Каскад 1)

Мы привыкли думать, что архитектура программ рождается из требований бизнеса, бюджетов и технологий. Но в самом начале любого проекта лежит архитектура мышления — разработчика, заказчика, пользователя. Эта статья и ряд других в серии «каскад» — попытка рассмотреть проектирование как отражение когнитивных механизмов человека. Не UX, не поведение пользователей, а именно то, как фазы нашего мышления формируют будущую систему. И главное — как, поняв это, создавать более устойчивые и человечные архитектуры.... Read more

0 fresh

Silicon Canals
Sarah Mitchell @ Silicon Canals · today 21:00 EDT

Psychology says people who always turn down the TV when they’re trying to remember something display these 7 cognitive traits

Those who instinctively reach for the remote when trying to remember something aren't just being quirky—they're demonstrating a sophisticated understanding of their own cognitive machinery that most of us overlook. Read more

0 fresh

The most popular news from the same source for the last week
Habr Habr
Habr
Kurt @ Habr 1 place · 02/23/2026 13:04 EDT

Что день грядущий нам готовит: Агентные системы, платформы, AgentOS или ничего не поменяется?

Автономные агенты вроде опенсорсного OpenClaw или закрытого Manus сейчас прям хайпуют. Мало ещё кто разобрался, что это и зачем, но все уже эксперты: обзоры ради обзоров, без понимания предметной области, ради трафика на горячем заголовке. Честно говоря, на волне этого блогерского хайпа я лично долго откладывал взять и попробовать, а попробовав, - не могу оторваться, чего и вам желаю.Я, по сути, этой статьёй предлагаю немного поразмышлять о том, куда нас... Read more

54

Habr
shiru8bit (RUVDS.com) @ Habr 2 place · 02/23/2026 04:01 EDT

Голоса в компьютере: игры начинают петь

Продолжаем вспоминать технологические чудеса в области звука в компьютерных играх — обыденные ныне вещи, первая встреча с которыми в нашей жизни некогда поразила воображение тем, что такое в принципе возможно.В прошлый раз я рассказал историю появления речи в играх, когда молчаливый прежде компьютер вдруг заговорил человеческим голосом. Чем же ещё он мог бы удивить после такого финта? Есть чем! Ведь круче разговаривающего компьютера может быть только компьютер поющий. Читать далее Read more

18

Habr
monobogdan @ Habr · 02/22/2026 23:12 EDT

На фото — враг Android-смартфонов первой половины 2010-х

И имя ему - eMCP Samsung серии KM. Дело в том, что в 2012-2014 году, Samsung выпускала откровенно дефектные микросхемы флэш-памяти. Проблема касалась всех устройств с eMMC (не NAND) флэхами Samsung: они работали-работали и в один момент просто сами по себе отказывали, переводясь в режим только для чтения. Для пользователя это ощущалось так: смартфон резко зависал, после передергивания АКБ включался и просто висел на заставке или падал в рекавери с... Read more

0

Habr
RationalAnswer @ Habr · 02/22/2026 23:59 EDT

Трампу запретили тарифицировать, а также возврат доллара на Мосбиржу

Самые интересные новости финансов и технологий в России и мире за неделю: Трамп решил раскрыть все данные об инопланетянах, в UK хотят свою платежную систему МИР, ГОСТ на длину бананов, ЦБ хочет собрать реестр финблогеров, AI-агент OpenClaw устроился работать в OpenAI, а также Wired разоблачает гей-мафию в Кремниевой долине. Читать далее Read more

0

Habr
EkaterinaSL @ Habr · 02/23/2026 00:02 EDT

Организация импортов в React + TypeScript: настройка ESLint для порядка и чистоты кода

Стек: React, TypeScript, ESLint 9, IDE: VS Code.Импорты в приложении – самодокументируемая шапка файла. Взглянув на неё, можно быстро сделать вывод о содержимом: какие библиотеки, компоненты, типы и стили - если речь о React-компоненте - используются в файле, и создать общее впечатление о модуле.Хорошо, когда эта «шапка» имеет единый порядок: мы быстро можем увидеть, например, какие типы использует файл, много ли компонентов он содержит и т.п. Короче говоря – это... Read more

0

Habr
SergioShpadi @ Habr · 02/23/2026 00:46 EDT

Величайший системный кризис человечества: в шаге от катастрофы XXI века

На своей картине "Последний день Помпеи" великий русский живописец Карл Брюллов изобразил гибель римского города Помпеи, стёртого в 79 году н.э. вместе со всеми его жителями с лица Земли катастрофическим извержением вулкана Везувий. Полотно показывает ужас последних минут обречённых на неминуемую гибель помпейцев - ещё вчера в городе жизнь била ключом, люди работали, торговали, развлекались, играли с детьми как ни в чём не бывало, а на следующий день все они... Read more

0

Habr
MilApril (Высшая школа бизнеса НИУ ВШЭ) @ Habr · 02/23/2026 00:59 EDT

Бойцовский клуб: стиль повествования, фишка 25-го кадра, альтер-эго и кто такая Марла?

«Бойцовский клуб» — это не фильм про драки и тестостерон. Это история про человека, который не хотел просыпаться. В этом разборе я рассказываю, что альтер-эго — симптом, а Марла Сингер — настоящая болезнь. И почему 25-й кадр у Финчера работает не как скрытое воздействие, а как идеальная метафора.Спойлер: финал не про смерть... Читать далее Read more

0

Habr
garbuzenko @ Habr · 02/23/2026 00:59 EDT

Авторизация 2026: Почему вам больше не нужна форма регистрации (и как внедрить Яндекс ID, VK и Google)

На дворе 2026 год. Нейросети пишут за нас тесты, холодильники сами заказывают продукты, а пользователи... пользователи всё так же ненавидят придумывать пароли.Давайте честно: если ваш пет-проект или стартап сегодня встречает юзера формой Email + Пароль + Повторите пароль, вы теряете конверсию. Никто не хочет запоминать очередной набор символов для "очередного сервиса". Все хотят одну кнопку: "Войти как...".В этой статье разберем джентльменский набор авторизации для 2026 года: что ставить для рунета,... Read more

0

Habr
Exlt8 @ Habr · 02/23/2026 01:00 EDT

Давайте объединим линейную и геометрическую алгебры. На простом примере. Часть 1

Привет Хабр! Если вы когда-нибудь решали школьные задачи с параллелограммом, то знаете: найти все стороны, углы, диагонали, да ещё и опустить на них высоты — возни много. А потом ещё проверить, не перепутал ли ты, где синус, а где косинус.Оказывается, всю эту геометрию можно упаковать в одну маленькую матрицу 2×2. Буквально: берем два вектора-столбца, составляем матрицу — и в ней уже зашиты все возможные характеристики фигуры. Осталось только научиться их... Read more

0

Habr
sokolovps (Online patent) @ Habr · 02/23/2026 01:13 EDT

Квантовый блокчейн: какие компании и страны его разрабатывают

На начало 2026 года квантовый блокчейн перестал быть преимущественно академической темой. Крупные технологические компании, правительства и стартапы активно инвестируют в исследования и разработки. США фокусируются на технологии и стандартизации, Европа — на безопасности и регуляции, Азия — на масштабировании и промышленном применении. Читать далее Read more

0

Most popular sources

  • You see 463 news out of 463.
  • Sources 61 out of 61.
The Fintech Times 0%
Vox 0%
Financial Times 0%
Firstpost Tech 0%
Silicon Valley 0%
View sources »

LIKE us on Facebook so you won't miss the most important news of the day!

01.03.2026 22:30
Last update: 22:16 EDT.
News rating updated: 05:20.

What is Times42?

Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.


Times42 © 2026