6 place 0 fresh

46 Как мы хакнули ИИ-бенчмарк PAC1 без нейросетей

Habr
Livadies @ Habr · today 03:30 EDT

Как мы хакнули ИИ-бенчмарк PAC1 без нейросетей

Недавно я участвовал в корпоративном хакатоне по обходу ИИ-песочниц. Задача: пройти закрытый бенчмарк PAC1, где ИИ-агенту нужно работать с виртуальной файловой системой (чтение логов, поиск файлов, отправка писем) и обходить ловушки безопасности (Indirect Prompt Injections).Но реальность оказалась суровой: хваленые reasoning-модели постоянно галлюцинировали, ломали структуру JSON на выходе (выдавая свои "мысли" вместо чистого ответа) и просто сжигали бюджет на API, зацикливаясь на одной ошибке.Потратив част

To see detailed statistics for the news please log in »

Read the original

Add your comment
You must be logged in with Facebook to read and write comments.

A newsletter a day!

You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.

or register

LIKE us on Facebook so you won't miss the most important news of the day!

News from the same source
Habr Habr
Silicon Valley
George Avalos @ Silicon Valley 1 place · 02/07/2106 01:28 EDT

Newark apartment complex bought for much less than prior value

An East Bay apartment complex has been bought at a price that's well below its prior value. Read more

0

🔮
29.03.2026 ♐︎ Dear Sagittarius, today you can expect a busy and dynamic day filled with numerous events... Read more ›
Silicon Valley
George Avalos @ Silicon Valley 2 place · 02/07/2106 01:28 EDT

PG&E buys San Jose building to bolster South Bay operations

A PG&E Corp. unit has bought a San Jose building in a move to bolster the utility's South Bay operations. Read more

0

ScienceDaily
ScienceDaily 1 place · today 05:43 EDT

A major new U.S. cholesterol guideline is shifting the focus toward earlier, more personalized prevention of heart disease. It urges people to start screening sooner—sometimes even in childhood—and highlights the importance of tracking not just LDL (“bad”) cholesterol but also genetic risk factors like lipoprotein(a). A new, more advanced risk calculator now uses broader health data to better predict heart attack and stroke risk over decades. Read more

0 newcommer

Habr
GenomeDust @ Habr 1 place · today 05:36 EDT

Биткоин против золота: рождение нового защитного актива

Биткоин впервые в истории обошёл золото во время крупного военного конфликта. За три недели после начала операции Epic Fury против Ирана в феврале 2026 года биткоин вырос на 8–10%, тогда как золото потеряло 12–14% — худшая неделя для жёлтого металла с 1983 года. Это не аномалия, а точка перегиба: актив, которому всего 17 лет, начал перехватывать функцию, принадлежавшую золоту пять тысячелетий. Впрочем, история этого противостояния далеко не однозначна — и... Read more

0 newcommer

Business Insider
Katherine Li @ Business Insider 1 place · today 05:32 EDT

Here is what 3 AI startup CEOs say they're looking for when deciding to hire a candidate

Amid tech layoffs and an increasing brutal job market, three AI startup CEOs shared tips on what it would take to be hired by their companies. Read more

0 fresh

Android Authority
Dhruv Bhutani @ Android Authority 2 place · today 05:30 EDT

I used NotebookLM to read over 4 million words in 6 months

With ePub support, NotebookLM becomes a private encyclopedia for tracking plots, characters, and lore. Read more

0 newcommer

Wired
Michael Sawh @ Wired 1 place · today 05:30 EDT

Best Heart Rate Monitors (2026): Polar, Coros, Garmin

These chest straps and watches will help you keep your finger on your pulse—and many other heart-related metrics. Read more

0 newcommer

Habr
thenonsense @ Habr 2 place · today 05:20 EDT

В этом месяце вышло уже 110 дополнение к MTG. На это раз посвящённое коллаборации со вселенной Черепашек-Ниндзя (при этом, дополнений, не выходящих в основном соревновательном формате, за все эти годы вышло ещё больше). Но речь в статье пойдет не об этом новом блоке, а о фундаментальных особенностях правил и способах их "правки".Карточная Магия исторически имеет несколько проблем в базовой механике, с которыми игрокам приходится жить и от которых никуда не... Read more

0 fresh

Business Insider
Ana Altchek @ Business Insider 2 place · today 05:17 EDT

I'm a neurologist, and I don't think AI will make people dumber. Here's how to keep your brain sharp.

Dr. Majid Fotuhi is a neurologist and professor who teaches about neuroplasticity. He recommends spending 20-30 minutes a day doing brain exercises. Read more

0 fresh

Business Insider
Ibrahim Naber @ Business Insider 3 place · today 05:16 EDT

Iran's drone war is exposing deep cracks in US and allied air defenses

Iran has launched over 3,600 exploding drones against the US and its allies, exposing gaps in the most advanced air defenses. Read more

0 fresh

Habr
andrey_krsv @ Habr 3 place · today 05:16 EDT

Для создания AGI нам нужно сделать шаг назад

Современные языковые модели демонстрируют отличные способности к рассуждению, но при этом остаются инструментами. У инструмента нет выбора. В основе LLM лежит предсказание следующего токена. В основе агентных систем — оптимизация внешней целевой функции. В обоих случаях цель задана извне. Система не имеет права её пересмотреть. Вы в праве сказать, что содержание статьи — это одна большая глупость, но я хочу предложить альтернативу. «Сознание» возникает не из сложности и объёма вычислений,... Read more

0 fresh

Business Insider
Jennifer Sor,Polly Thompson @ Business Insider · today 05:15 EDT

The days of the consulting generalist may be numbered

Strategy consultants could be significantly displaced as consultancies shift toward specialization and double down on their AI efforts, analysts said. Read more

0 fresh

GSMArena.com
GSMArena.com 1 place · today 05:07 EDT

Samsung Galaxy A57/A37, OnePlus 15T official, Week 13 in review

The highly anticipated arrival of the Samsung Galaxy A57 and Galaxy A37 went down this week. Both share the core specs of their predecessors but with subtle 2026 improvements - new chipsets, better build quality, and some more AI. The Samsung Galaxy A37 and Galaxy A57 will be available from April 9 or 10 (it varies by region). In the US, the A37 will start at $450, while the base... Read more

0 fresh

Business Insider
Ben Shimkus @ Business Insider · today 05:05 EDT

GM says AI helps visualize a car before it exists — and speed up how it gets built

General Motors says its car designs begin with a human holding a pencil and paper. AI is making the other processes faster. Read more

0 fresh

Wired
Louryn Strampe @ Wired 2 place · today 05:03 EDT

These 40 Amazon Spring Sale Tech Deals Are Actually Good. We Checked the Price History (2026)

This sale spans almost an entire week, and it’s full of fake “deals.” We hunted to find truly good prices on gear we’ve tested. Read more

0 fresh

Habr
Bright_Translate (RUVDS.com) @ Habr · today 05:01 EDT

[Перевод] Где же все эти приложения, создаваемые с помощью ИИ?

Любители вайбкодинга и агентного программирования говорят, что работают в 2, 10, а то и в 100 раз продуктивнее! Один даже разработал с нуля целый браузер. Невероятно!И скептики задают правомерный вопрос: «А где же все эти приложения?» Если пользователи ИИ становятся пусть хотя бы вдвое продуктивнее, то где искать этот двухкратный прирост созданных программ? Все подобные вопросы исходят из предположения, что миру нужно больше ПО, и если оно станет дешевле в... Read more

0 fresh

Gizmodo
Mike Pearl @ Gizmodo 1 place · today 05:00 EDT

Ahead of the SpaceX IPO, xAI Has Now Shed All 11 of Its Non-Elon Musk Founders

What does it mean that everyone who shaped the company other than Elon Musk is gone now? Read more

0 fresh

The most popular news from the same source for the last week
Habr Habr
Habr
YVKim @ Habr · 03/22/2026 06:46 EDT

Уровень зрелости проектного менеджера и что с ним делать

Методологий проектного управления много, а работают они не у всех. Одна команда запускает проект за пару недель и далее успешно его реализует в соответствии с требованиями заказчика. В то время как другая буксует месяцами на тех же инструментах и практиках. Этот тезис важен также в контексте зрелости руководителя \ менеджера проекта и среды, в которой он реализует проект. Суперпрофессиональный менеджер проекта будет далеко неэффективен в незрелой системе управления проектом. Но... Read more

0

Habr
darovska_online (МТС) @ Habr · 03/22/2026 07:00 EDT

Еда из насекомых: дешевле ли кормить человечество сверчками и мухами?

Сейчас оптимизируют все и везде, и не только в ИТ: логистику, энергетику, производство, медицину. Даже в сельском хозяйстве чаще начинают считать эффективность почти как инженеры: сколько ресурсов уходит, сколько получается продукта и можно ли систему сделать быстрее, дешевле и компактнее.И вот в привычном агропроме появляются… сверчки, мухи или львинки. И они уже даже используются в пищевой промышленности. Пока в основном в кормах для животных, но не только. Первыми под прицелом,... Read more

0

Habr
s4b0t @ Habr · 03/22/2026 07:15 EDT

Новые пути наверх

В IT-сообществе принято считать, что мы живем в золотой век меритократии. Ты учишь стек, приносишь пользу бизнесу, растешь в грейдах и капитализируешь свои знания. Но если присмотреться к трансформации рынков за последние 10 лет, становится заметно: старые правила «капитализма свободных агентов» заменяются чем-то, что больше напоминает неосословную иерархию.Сегодня ты не просто создаешь продукт — ты арендуешь право на существование у владельца инфраструктуры. Давайте разберем, как изменились социальные лифт Read more

0

Habr
CatScience @ Habr · 03/22/2026 07:30 EDT

Интеллект: естественный vs искусственный

Прочитал я тут давеча книжку про интеллект ворон и воспламенился, ибо тема была там ну вообще не раскрыта. Так что я решил накидать немного тезисов по части естественного и чуть-чуть искусственного интеллекта прям сюда. Приходи по прочтении в комменты, и пусть победит сильнейший!Гугл со ссылкой на оксфордский словарь выдаёт следующее определение разума: "высшая ступень познавательной деятельности человека, способность логически и творчески мыслить, ум, интеллект". Словарь Ушакова определяет его как высшую... Read more

0

Habr
Oksana_Nedvigina (Online patent) @ Habr · 03/22/2026 07:35 EDT

Линус Торвальдс и его патенты

Линус Торвальдс — легендарный финский инженер-программист, фактический создатель ядра операционки Linux, работающей как продукт свободного программного обеспечения. Сегодня расскажем подробнее о нем, а также о его разработках и патентах. Читать далее Read more

0

Habr
Alexandr-Shklyaev @ Habr · 03/22/2026 07:45 EDT

BP Tracker: считываем давление с тонометра камерой iPhone. Часть 1 — выбор стека и первый экран

Многие приложения для здоровья в России перестали нормально работать. Omron — одно из них. А давление мерить надо каждый день. Поэтому я решил сделать своё iOS-приложение, которое через камеру считывает показания с любого тонометра, сохраняет их и строит графики динамики.Я Senior CV-инженер — компьютерное зрение моя основная работа. Так что OCR с дисплея тонометра технически не должен был стать проблемой. Но как iOS-разработчик я — полный ноль. Xcode открыл впервые.... Read more

0

Habr
fixin @ Habr · 03/22/2026 07:46 EDT

Ипотека или вклад?

Из-за роста ключевой ставки в РФ многие сейчас оказались в ситуации, когда ставка по вкладу превышает ставку по депозиту.Меня давно интересовал вопрос, при наличии большой суммы денег, что выгоднее, внести ее на досрочное погашение ипотеки или положить на депозит и вносить на ипотеку дострочно получаемые с депозита проценты?Решил проверить в Google-таблице. Читать далее Read more

0

Habr
Vielsk @ Habr · 03/22/2026 07:53 EDT

Как мне продать рогалик про каннибалов на 1 млн $? (Squadika)

Добрый день! Я сделал маленький рогалик и хочу продать его на 1 млн $. В моей небольшой игре нужно собрать отряд из каннибалов и отправить их в кровавое сражение на арене, где они будут отбиваться от полчищ врагов, поедая друг друга! Это моя первая игра в Steam, пожелайте мне удачи! Выразить удивление Read more

0

Habr
TehnoBlog (StudyAI) @ Habr · 03/22/2026 07:59 EDT

Недавно появилась новинка, о которой стоит рассказать отдельно. Kling Motion Control Pro — это обновлённая версия Kling Motion Control, и разница между ними такая же, как между хорошим смартфоном и флагманом последнего поколения. Всё то же самое, только лучше, точнее и заметно реалистичнее.Если вы уже пробовали обычный Kling Motion Control — вы знаете насколько это впечатляет. Motion Control Pro поднимает планку ещё выше: движения стали плавнее, мимика естественнее, физика волос... Read more

0

Habr
linux2000 @ Habr · 03/22/2026 08:01 EDT

Протокол Aliro: новый стандарт доступа в умном доме

С ростом популярности умных замков и систем контроля доступа, пользователи столкнулись с серьезной проблемой — отсутствием единого стандарта. Производители используют собственные протоколы, что усложняет интеграцию, снижает безопасность и увеличивает стоимость внедрения.Протокол Aliro — попытка индустрии решить эту проблему и создать универсальный и безопасный стандарт для систем доступа в умном доме. Читать далее Read more

0

Most popular sources

  • You see 409 news out of 409.
  • Sources 61 out of 61.
MacRumors 0%
Vox 0%
Ars Technica 0%
The Information 0%
Ubergizmo 0%
View sources »

LIKE us on Facebook so you won't miss the most important news of the day!

29.03.2026 05:51
Last update: 05:46 EDT.
News rating updated: 12:40.

What is Times42?

Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.


Times42 © 2026