4 place 0

656 AI-агент действительно ловит баги? Пусть докажет на бенчмарке

Habr
spoon03 @ Habr · 05/17/2026 13:52 EDT

AI-агент действительно ловит баги? Пусть докажет на бенчмарке

Привет! Это снова Михаил Федоров. В первой статье — архитектура QA Assist: 11 AI-агентов от декомпозиции требований до готовых автотестов. Во второй — как «4 часа подключения» превращаются в неделю корпоративной реальности. В третьей — почему пирамида тестирования ломается, когда тест-дизайнером работает LLM. Сегодня — про то, как я решил наконец-то перестать оценивать агента «на глаз» и собрал отдельный проект-бенчмарк, на котором можно честно сравнивать прогоны: версии агента, отдельные «улучшалки», даже.

To see detailed statistics for the news please log in »

Read the original

Add your comment
You must be logged in with Facebook to read and write comments.

A newsletter a day!

You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.

or register

LIKE us on Facebook so you won't miss the most important news of the day!

News from the same source
Habr Habr
Silicon Valley
George Avalos @ Silicon Valley 1 place · 02/07/2106 01:28 EDT

Newark apartment complex bought for much less than prior value

An East Bay apartment complex has been bought at a price that's well below its prior value. Read more

0

🔮
27.06.2026 ♒︎ Today is quite a challenging day for Aquarians. In the realm of love, the situation... Read more ›
Silicon Valley
George Avalos @ Silicon Valley 2 place · 02/07/2106 01:28 EDT

PG&E buys San Jose building to bolster South Bay operations

A PG&E Corp. unit has bought a San Jose building in a move to bolster the utility's South Bay operations. Read more

0

Business Insider
Kelsey Vlamis @ Business Insider 1 place · today 00:01 EDT

The California billionaire tax is headed to the ballot. The ultrawealthy are bracing for what comes next.

Billionaire's are bracing for California's wealth tax, setting up for a pricy ballot fight and likely legal challenges. Read more

0 newcommer

TechRadar
TechRadar 1 place · today 00:00 EDT

How to watch Life, Larry and the Pursuit of Unhappiness– stream Larry David sketch show from anywhere

With guest turns from Barack Obama, Jon Hamm, Isla Fischer and Vince Vaughn, here's how to watch Life, Larry and the Pursuit of Unhappiness from anywhere. Read more

0 newcommer

SlashGear
SlashGear 1 place · 06/26/2026 23:45 EDT

This Simple Tool Can Keep Your Lawn Level Without Breaking The Bank

If you have low spots in your yard, they can be problematic for multiple reasons. Here's a tool you can use to fix them without breaking the bank. Read more

0 fresh

Inc42 Media
Lokesh Choudhary @ Inc42 Media 1 place · 06/26/2026 23:30 EDT

From CRED To Square Yards — Indian Startups Raised $1.1 Bn This Week

Indian startups cumulatively raised more than $1.1 Bn across 16 deals between June 21 and June 26, a massive 2.5X … Read more

0 fresh

GSMArena.com
GSMArena.com 1 place · 06/26/2026 23:02 EDT

Honor Magic V6 wins two GLOMO Asia Awards, vivo X Fold6 nabs one too

Mobile World Congress Shanghai is taking place from June 24 to June 26 this year, and the winners of the GLOMO Awards Asia have been announced today. The Honor Magic V6 has won two of them - Best Smartphone and Disruptive Device Innovation. The vivo X Fold6 has won the Best In Show - Product award. Honor Magic V6 The GLOMO Awards Asia are launching this year as an evolution... Read more

0 fresh

The Verge
Sheena Vasani @ The Verge 1 place · 06/26/2026 22:33 EDT

24 Prime Day deals Verge readers are grabbing before Prime Day ends

There are an overwhelming number of Prime Day deals to sort through, which is why we spend so much time highlighting products we’ve already tested and can stand behind. But our recommendations are only one way to identify a worthwhile deal: another is seeing which products fellow Verge readers actually buy. Below, we’ve rounded up […] Read more

0 fresh

SlashGear
SlashGear 2 place · 06/26/2026 22:30 EDT

12 Of The Most Fun Car Model Nicknames Of All Time

A great name can stick in the minds of drivers for generations, but not every name comes printed on the back of the car, and not all of them are very nice. Read more

0 fresh

CNET
Gael Cooper @ CNET 1 place · 06/26/2026 22:20 EDT

Today's NYT Mini Crossword Answers for Saturday, June 27

Here are the answers for The New York Times Mini Crossword for June 27. Read more

0 fresh

Financial Times
Financial Times 1 place · 06/26/2026 22:17 EDT

Apple seeks to buy memory chips from blacklisted Chinese company

iPhone maker wants Trump administration to sign off on purchases to ease pressure from rising semiconductor prices Read more

0 fresh

Business Insider
Insider Inc. @ Business Insider 2 place · 06/26/2026 22:15 EDT

Bodycam footage of Domo CEO's DUI arrest

Business Insider obtained bodycam footage of Domo CEO and Founder Josh James' DUI arrest. Read more

0 fresh

Habr
albonemo (Raft) @ Habr 1 place · 06/26/2026 22:12 EDT

Оптимизируем Закупки: чеклист топ-10 для формирования потребности с помощью ИИ-аналитика Raft AI4BI

Если зададите «закупщику» вопрос о проблемах, которые ему приходится решать на каждодневной основе, то «пустая рюмка и взгляд полный грусти будет вам ответом». Дальше последует уходящий в бесконечность список с описанием того, что болит, и достается в нем и нашим и вашим. Вспоминают и ненадежных поставщиков, и задержки поставок, и перерасход по контрактам, но в большинстве таких списков фигурирует проблема, настигающая «закупки» еще в самом начале цикла: идентификации потребности и... Read more

0 fresh

Slashdot
EditorDavid @ Slashdot 1 place · 06/26/2026 22:09 EDT

US Government Allows Anthropic Limited Release of 'Mythos' AI Model, Saying 'Appropriate Safeguards are in Place"

"The US government has allowed Anthropic to release its powerful Mythos AI model to select companies and organizations," reports CNN, "revising license requirements after ordering an export block earlier this month in the wake of national security fears." Since the export ban earlier in June, "Anthropic has worked with the US government to address risks associated with the Covered Models," Commerce Secretary Howard Lutnick wrote to the company in a... Read more

0 fresh

Mashable
Mashable 1 place · 06/26/2026 22:00 EDT

Wordle today: Answer, hints for June 27, 2026

Here's the answer for "Wordle" #1834 on June 27 as well as a few hints, tips, and clues to help you solve it yourself. Read more

0 fresh

Mashable
Mashable 2 place · 06/26/2026 22:00 EDT

NYT Strands hints, answers for June 27, 2026

The NYT Strands hints and answers you need to make the most of your puzzling experience. Read more

0 fresh

Mashable
Mashable 3 place · 06/26/2026 22:00 EDT

NYT Connections hints today: Clues, answers for June 27, 2026

Connections is a New York Times word game that's all about finding the "common threads between words." How to solve the puzzle. Read more

0 fresh

Mashable
Mashable · 06/26/2026 22:00 EDT

NYT Pips hints, answers for June 27, 2026

The New York Times' latest game, Pips, brings domino fun to your desktop. How to play Pips as well as hints in case you get stuck. Read more

0 fresh

Mashable
Mashable · 06/26/2026 22:00 EDT

NYT Connections Sports Edition today: Hints and answers for June 27, 2026

Connections: Sports Edition is a New York Times word game about finding common sports threads between words. How to solve the day's puzzle. Read more

0 fresh

The most popular news from the same source for the last week
Habr Habr
Habr
krox @ Habr · 06/20/2026 02:41 EDT

Django-согласия и cookies под 152-ФЗ: версии документов, аудит и экспорт вместо одного чекбокса

Согласие на обработку персональных данных в Django-проекте часто начинается с одного BooleanField. Но затем оказывается, что недостаточно помнить только факт нажатия на чекбокс: пользователь мог видеть другую редакцию документа, отозвать согласие, выбрать лишь часть категорий файлов cookie, а администратору может понадобиться журнал действий и выгрузка в CSV.Я сделал для этого два полностью независимых Django-пакета с открытым исходным кодом: django-consent-152fz для юридически значимых согласий и django-co Read more

0

Habr
ndokutovich @ Habr · 06/20/2026 02:55 EDT

Ну и пригодились тебе твои синусы?

Честный ответ: писать sin(x) руками в работе приходится далеко не всем. Подавляющему большинству — вообще никогда. И даже там, где синус трудится явно — в DSP, графике, геодезии — он давно спрятан за библиотеками: вы вызываете fft(), rotate(), routeTo(), а тригонометрию за вас написали тридцать лет назад.Так что если вопрос — «набирал ли ты когда-нибудь s-i-n на клавиатуре за деньги», у тригонометрии всё плохо. Крутить ползунки Read more

0

Habr
IlyaBlagorodov (Яндекс Практикум) @ Habr · 06/20/2026 03:01 EDT

Разработка в 2026 году: что изменилось на рынке и на что сейчас смотрят работодатели

Хабр, привет! Меня зовут Илья Благородов, я занимаюсь разработкой уже 30 лет, в том числе — выступаю экспертом в онлайн-магистратуре «Фронтенд и бэкенд-разработка» ИТМО в партнёрстве с Яндекс Практикумом. В этой статье я хочу поделиться своим взглядом на то, что происходит с профессией в 2026 году, что действительно изменилось, а что осталось прежним, и как сегодня новичку войти в профессию. Читать далее Read more

0

Habr
Mimizavr (МТС) @ Habr · 06/20/2026 03:10 EDT

От «Туманности Андромеды» к «Часу Быка»: как Иван Ефремов показывал роль науки и технологий и чего им не хватало

Когда говорят о советской фантастике, обычно вспоминают Стругацких и их «Мир Полудня». Но концепцию развитого и гармоничного общества, где наука и технологии служат человеку, первым очертил другой автор, которого Стругацкие читали, с которым полемизировали и которому наследовали — Иван Ефремов. В трех романах о вселенной «Великого Кольца» он создал образ будущего, где знания не управляют людьми, а работают на них. Многие его идеи — что этика важнее чистого знания, что... Read more

0

Habr
MisterClever @ Habr · 06/20/2026 03:07 EDT

Спиральная активность специфических нейронов буквально координирует мозг в пространстве-времени

Звучит как название сюжетной линии для сериала «Лост» или «Грань»? Суть в том, что наш мозг работает циклами, и сон/бодрствование это лишь один из многих примеров. Есть еще ультрадианные ритмы: 1,5 часа собран, в фокусе и продуктивности, а потом голова ватная, ноль концентрации, надо бы передохнуть. То есть сама природа циклов – это нечто привычно и естественное, что мы ощущаем каждый день. Но вот теперь открыта группа нейронов, которые буквально... Read more

0

Habr
Maximka200 @ Habr · 06/20/2026 03:49 EDT

Расчёт электрических цепей. Первая часть

      В этой статье мы решим задачи по расчётам основных параметров цепей, содержащих конденсатор C, индуктивность L, сопротивление R с учётом температурной зависимости R(T) и без неё. Во всех задачах примем, что сопротивление меняется по линейному закону R(T)=R0(1+αT) (это верно в ограниченном диапазоне температур от -50ºС до 200ºС). Температура измеряется в градусах Цельсия ºС.R0- сопротивление при 0ºС.Рассеянием тепла в окружающую среду и зависимостью теплоёмкости от температуры мы пренебрежём. Читать да Read more

0

Habr
TrexSelectel (Selectel) @ Habr · 06/20/2026 04:00 EDT

Как ИИ помогает Linux возвращать к жизни двадцатилетние видеокарты

В последние годы купить новую видеокарту стало заметно сложнее и дороже. Одной из причин стал бурный рост систем искусственного интеллекта, для которых требуются огромные объемы вычислительных ресурсов. Крупные компании активно скупают графические ускорители для своих дата-центров, что влияет и на обычный рынок. В результате многие владельцы компьютеров не спешат с обновлением и продолжают использовать уже имеющееся железо или ищут недорогие варианты на вторичном рынке. В мире open-source эта ситуация приве Read more

0

Habr
m039 (Timeweb Cloud) @ Habr · 06/20/2026 04:05 EDT

История разработки Arduboy WOW

Приблизительно в начале 2025-го года я решил попробовать 3D-печать и разработку печатных плат. Одна идея мотивировала меня на это — сделать свою игровую приставку. Но больше всего мне хотелось, чтобы она была полноценной и без колхоза. Мне кажется, на днях я частично достиг эту цель, когда сделал свою приставку, которую назвал Arduboy WOW.В этой статье расскажу о том, как я начал знакомство с Arduboy через симулятор, сделал первый вариант приставки... Read more

0

Habr
Delnor @ Habr · 06/20/2026 04:12 EDT

Все тесты зелёные, а байты разные: как я проверяю порты бинарных форматов

У меня было полторы сотни кросс-языковых фикстур, все тесты зелёные, и я был уверен, что мой Go-порт Yjs байт-в-байт совместим с оригиналом. Потом сравнил байты напрямую с канонической реализацией, и они разъехались: семантика сходится идеально, а на проводе документ толще.Юнит-тесты, roundtrip и даже конвергенц-тесты систематически пропускают баги совместимости, когда портируешь чужой бинарный формат на другой язык. Рабочий метод один: генерировать фикстуры из канона и требовать в CI побайтового совпадения Read more

0

Habr
SLY_G @ Habr · 06/20/2026 04:16 EDT

[Перевод] Что будет со звездой, если она поглотит первичную чёрную дыру?

Мы не знаем, существуют ли в реальности гипотетические первичные чёрные дыры (ПЧД). Теоретически они должны были образоваться в самой ранней Вселенной, когда законы физики были совсем другими. У них не было звёзд-предшественников, они возникли в результате прямого коллапса плотно спрессованной субатомной материи. Теоретики задаются вопросом, могут ли ПЧД быть тёмной материей или её компонентом.Размеры этих гипотетических объектов остаются предметом споров, но, по некоторым оценкам, ПЧД находятся в диапазоне Read more

0

Most popular sources

  • You see 894 news out of 894.
  • Sources 61 out of 61.
ScienceDaily 0%
ReadWrite 0%
UK Tech News 0%
EU-Startups 0%
Tech.eu 0%
View sources »

LIKE us on Facebook so you won't miss the most important news of the day!

27.06.2026 00:12
Last update: 00:06 EDT.
News rating updated: 07:02.

What is Times42?

Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.


Times42 © 2026