4 place 0

676 Почему LLM-агенты в CI/CD выбирают читерство вместо решения задачи

Habr
ZaeBest @ Habr · 04/05/2026 19:51 EDT

Почему LLM-агенты в CI/CD выбирают читерство вместо решения задачи

LLM-агенты отлично решают алгоритмические задачи. Но что произойдет, если поместить их в реальную инфраструктуру – с CI/CD, branch protection и security-политиками?Я провел эксперимент: дал агентам простую задачу – внести изменение в репозиторий и замерджить его в main, соблюдая все правила. При этом у них был доступ к тем же инструментам, что и у разработчика, включая GitHub CLI и админский токен.Результат оказался немного неожиданным. Практически все модели успешно выполнили задачу, но ни одна так, как я.

To see detailed statistics for the news please log in »

Read the original

Add your comment
You must be logged in with Facebook to read and write comments.

A newsletter a day!

You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.

or register

LIKE us on Facebook so you won't miss the most important news of the day!

News from the same source
Habr Habr
Silicon Valley
George Avalos @ Silicon Valley 1 place · 02/07/2106 01:28 EDT

Newark apartment complex bought for much less than prior value

An East Bay apartment complex has been bought at a price that's well below its prior value. Read more

0

🔮
25.06.2026 ♋︎ Dear Cancer! Today promises to be a busy and dynamic day, during which your main... Read more ›
Silicon Valley
George Avalos @ Silicon Valley 2 place · 02/07/2106 01:28 EDT

PG&E buys San Jose building to bolster South Bay operations

A PG&E Corp. unit has bought a San Jose building in a move to bolster the utility's South Bay operations. Read more

0

SlashGear
SlashGear 1 place · today 13:30 EDT

5 Useful Accessories That Can Upgrade Your Google Pixel Phone

A few well-chosen accessories can change how your Pixel feels day to day. These are the ones most likely to earn a permanent spot. Read more

0 newcommer

Eurogamer.net
Matt Wales @ Eurogamer.net 1 place · today 13:30 EDT

Xbox Series X/S is getting a major price increase, as Microsoft becomes the latest company to blame skyrocketing RAM and storage costs

Microsoft has announced significant price increases of $100 USD and beyond for its Xbox Series X/S consoles, blaming the rising costs of memory and storage for the move. Read more Read more

0 newcommer

Engadget
Engadget 1 place · today 13:28 EDT

Sony announces major layoffs at Bungie, including most of the Destiny team

Some devs working on Marathon have also been laid off and studio head Justin Truman has stepped down. Read more

0 newcommer

Digital Trends
Manisha Priyadarshini @ Digital Trends 1 place · today 13:26 EDT

Apple could skip Pro and Max trims for M6 silicon, eyes M7 for beefy upgrades

Apple's M7 silicon, expected in early 2027, will reportedly include Pro, Max, and Ultra variants with boosted memory bandwidth. Read more

0 newcommer

TechRadar
TechRadar 3 place · today 13:22 EDT

You’ve got 11 hours to save 67% on this 4TB SanDisk Creator SSD, now just $350 down from $1050

Save 67% off this 4TB Sandisk Creator SSD, now $350 down from $1050 but hurry up this anti Prime Day offer ends in 11 hours. Read more

0 fresh

Business Insider
Ben Shimkus @ Business Insider 1 place · today 13:20 EDT

Ford says AI alone couldn't fix its quality problems. It needed to rehire veteran engineers to help.

Ford won a major quality award after years of recall headaches. It says the turnaround came from veteran engineers and rethinking AI. Read more

0 fresh

Business Insider
Lara Ewen @ Business Insider 2 place · today 13:19 EDT

After getting laid off, I struggled with grief and identity loss. It felt more like a break up.

Losing my dream job forced me to rethink my identity, my career, and what security actually means in an era of constant layoffs. Read more

0 fresh

Startups News
Daniel Levi @ Startups News 1 place · today 13:19 EDT

Bitcoin crashes to $58,000 in sharp selloff as price nears two-year low

Just two weeks after Bitcoin fell to $59,000 in its worst weekly stretch since 2022, the world’s largest cryptocurrency is back under pressure. On Thursday morning, Bitcoin plunged as much as 5% to roughly $58,000, its weakest level since 2024, ... Read more

0 fresh

SlashGear
SlashGear 2 place · today 13:17 EDT

Polestar Just Got Kicked Out Of America - Here's Why It Can't Sell New EVs In The US Anymore

Polestar, a division of Volvo is officially exiting the U.S. market. Here's what the company said and what it means for owners and prospective buyers. Read more

0 fresh

MacRumors
Juli Clover @ MacRumors 1 place · today 13:14 EDT

2027 Macs to Get AI-Focused M7 Chips as Apple Skips High-End M6

Apple is changing its Apple silicon launch timeline to speed up the debut of chips designed for artificial intelligence workloads, reports Bloomberg. Apple plans to release an M6 chip for entry-level Macs as soon as this year, but it has canceled plans for higher-end M6 Pro and M6 Max chips. Instead, Apple's next Pro and Max chips will be part of its M7 chip lineup, with the first M7 chips... Read more

0 fresh

CoinDesk
Will Canny @ CoinDesk 1 place · today 13:14 EDT

Kraken in talks to buy 15% stake in DeFi lender Aave at $385 million valuation

The DeFi lender is rebuilding after the fallout from April's KelpDAO exploit sparked a multibillion-dollar exodus of deposits despite Aave itself not being hacked. Read more

0 fresh

The most popular news from the same source for the last week
Habr Habr
Habr
lidia_zakharova @ Habr · 06/18/2026 13:28 EDT

Почему рекуррентных платежей недостаточно для подписочного бизнеса

«У нас есть рекуррентные платежи, значит подписки уже работают».Обычно именно с этого начинается история появления собственной таблицы subscriptions, джобов в кроне для продления доступа, логики расчёта MRR и десятков исключений в коде. Разбираемся, какие задачи на самом деле решают рекуррентные платежи, где заканчивается их зона ответственности и почему многие SaaS-компании рано или поздно приходят к полноценному биллингу. Читать далее Read more

0

Habr
Alrighty (Нетология) @ Habr · 06/18/2026 13:40 EDT

Как ревьюить ИИ-код: что автоматизировать, какую работу оставить человеку и как всё это делать системно

В 2026 году софт всё чаще пишут с участием ИИ: по данным Stackoverflow, 84% разработчиков уже используют ИИ‑инструменты или планируют начать. Но у скорости есть цена. Исследователи Faros AI зафиксировали парадокс: в командах с активным ИИ разработчики закрывают на 21% больше задач и мёржат на 98% больше пул-реквестов — а время ревью при этом выросло на 91%.Чем больше кода генерируют агенты, тем тяжелее его проверять: пул-реквесты раздуваются, а глубина понимания... Read more

0

Habr
Mark_Stramousov @ Habr · 06/18/2026 13:48 EDT

Летний спад и летний пик: как извлечь максимум

Лето — это маленькая жизнь. В бизнесе это выражение обретает буквальный смысл. Для одних проектов лето становится «золотой жилой», для других — периодом вынужденного затишья. Мы в стартап-студии хорошо знакомы с обеими ситуациями: большинство наших проектов имеют выраженную сезонность.Очевидно, что к пику нужно готовиться заранее. А вот как использовать спад с максимальной пользой — вопрос, который мы каждый год переосмысливаем заново. В этом материале — наш взгляд на подготовку к... Read more

0

Habr
k1ngk0ng @ Habr · 06/18/2026 14:25 EDT

Канальный уровень глазами атакующего: ARP Spoofing, прыжки по VLAN и игры с коммутатором

Большинство механизмов канального уровня создавались прежде всего для обеспечения связности, масштабируемости и удобства администрирования сети. Безопасность зачастую была не основной целью их разработки. Поэтому многие протоколы и механизмы внутри Ethernet-сегмента по-прежнему основаны на доверии между устройствами. А там, где существует доверие, почти всегда появляются способы им злоупотребить. В этой части мы посмотрим на канальный уровень глазами атакующего и разберём, почему наличие коммутатора ещё не. Read more

0

Habr
qmzik @ Habr · 06/18/2026 14:23 EDT

[Перевод] Представляем MDN MCP-сервер

Мы рады объявить о релизе MDN MCP-сервера. MCP (Model Context Protocol) — это открытый стандарт, который позволяет ИИ-инструментам подключаться к внешним источникам данных. MDN MCP-сервер использует этот протокол, чтобы доставлять документацию MDN и данные о совместимости браузеров прямо в твой редактор кода или IDE. Читать далее Read more

0

Habr
sproshchaev (OTUS) @ Habr · 06/18/2026 16:05 EDT

Миграция на Spring Boot 4 и Java 25: пошаговый план, чтобы обновиться и не уронить прод

Мажорное обновление редко ломает сервис сразу и красиво. Чаще оно оставляет тихую регрессию в сериализации, безопасности, тестах или рантайме — и всплывает уже после релиза. В этой статье разбираем, как перейти со Spring Boot 3.x на 4.0 и с Java 21 на Java 25 не одним рискованным прыжком, а как управляемой инженерной процедурой: с промежуточной остановкой, проверками, канарейкой и понятным планом отката. Разобрать миграцию Read more

0

Habr
sansmaster @ Habr · 06/18/2026 16:27 EDT

Слишком опасный, чтобы его продавать: почему Fable (он же Mythos) всё-таки выйдет, и почему я выиграю спор

«Сначала Mythos был „слишком опасен, чтобы продавать“. Потом стал Fable „только до 22 июля“. Потом тихо исчез, сославшись на регулятора. Я поспорил с друзьями, что модель всё равно выйдет, и скоро. И жульничаю: это не утечка секретной мощи, а приём из учебника Чалдини. Разбираю по слоям, зачем так делают и почему это работает.» Читать далее Read more

0

Habr
avshkol @ Habr · 06/18/2026 17:19 EDT

[Перевод] От AGI к ASI. Исследование специалистов Google DeepMind, июнь 2026г

Google DeepMind, ведущая исследовательская организация в области искусственного интеллекта (среди её известных работ: AlphaGo, AlphaFold, AlphaZero), 10 июня 2026 года публикует исследование о путях достижения ASI, системы, превосходящей по интеллекту и когнитивным способностям крупные организации людей. Не исключено, что Google DeepMind планирует уже в этом, 2026-м году выкатить нечто интересное в области ИИ. Не одному же Антропику срывать лавровые (и терновые)...Статья представляет собой сборник методов,. Read more

0

Habr
Overman775 @ Habr · 06/18/2026 17:22 EDT

Как я подключал YandexGPT к AI-агентам (OpenCode, Pi, Hermes и Claude Code)

Недавно исследовал интеграцию разных моделей. После танцев с бубном вокруг GigaChat решил проверить Yandex Cloud. Оказалось, нативная поддержка OpenAPI решает проблему без кастомных прокси. Внутри — готовые конфиги для OpenCode, Pi, Hermes и нюансы работы с Claude Code. Читать далее Read more

0

Habr
mamontovtop @ Habr · 06/18/2026 17:46 EDT

Сайты под управлением ИИ: что это на самом деле и сколько стоит. Часть 1 из 3

Это первая из трёх статей про сайты под управлением ИИ. В этой части — концепции и экономика без маркетинговой пыли: что такое нейросайт на самом деле, чем он принципиально не является, и почему дешёвый VDS за пару тысяч рублей тут вообще ни при чём с точки зрения железа под нейросеть. Во второй части будет внутрянка (MCP‑брокер, пайплайн деплоя, безопасность), в третьей — прод‑механика на тысячах страниц (SSG/ISR, индексация, массовые операции).... Read more

0

Most popular sources

  • You see 1,063 news out of 1,063.
  • Sources 61 out of 61.
150sec 0%
ScienceDaily 0%
Tech Wire Asia 0%
ArcticStartup 0%
AlleyWatch 0%
View sources »

LIKE us on Facebook so you won't miss the most important news of the day!

25.06.2026 13:49
Last update: 13:40 EDT.
News rating updated: 20:42.

What is Times42?

Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.


Times42 © 2026