5 place 0

938 [Перевод] Cursor показал 5 графиков, которые хоронят все публичные ИИ-бенчмарки для кода. Разбираемся

Habr
cognitronn (BotHub) @ Habr · 03/24/2026 02:25 EDT

[Перевод] Cursor показал 5 графиков, которые хоронят все публичные ИИ-бенчмарки для кода. Разбираемся

11 марта 2026 года Cursor опубликовал пост под скромным названием «Как мы сравниваем качество моделей в Cursor». Без громких заявлений. Без атак на конкурентов. Просто пять графиков и спокойное объяснение внутреннего процесса оценки.ИИ-сообщество в основном отнеслось к этому как к очередному «компания рассказывает о своём бенчмарке». Это было ошибкой.Эти пять графиков, если прочитать их внимательно, обнажают пять допущений, зашитых в каждый публичный бенчмарк для кодинга, которые никто не ставит под вопрос.

To see detailed statistics for the news please log in »

Read the original

Add your comment
You must be logged in with Facebook to read and write comments.

A newsletter a day!

You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.

or register

LIKE us on Facebook so you won't miss the most important news of the day!

News from the same source
Habr Habr
Silicon Valley
George Avalos @ Silicon Valley 1 place · 02/07/2106 01:28 EDT

Newark apartment complex bought for much less than prior value

An East Bay apartment complex has been bought at a price that's well below its prior value. Read more

0

🔮
13.04.2026 ♑︎ Dear Capricorn, today will bring you a variety of emotions and challenges that require your... Read more ›
Silicon Valley
George Avalos @ Silicon Valley 2 place · 02/07/2106 01:28 EDT

PG&E buys San Jose building to bolster South Bay operations

A PG&E Corp. unit has bought a San Jose building in a move to bolster the utility's South Bay operations. Read more

0

VentureBeat
VentureBeat 1 place · 04/14/2026 00:00 EDT

Presented by AWSAutonomous agents are compressing software delivery timelines from weeks to days. The enterprises that scale agents safely will be the ones that build using spec-driven development.There’s a moment in every technology shift where the early adopters stop being outliers and start being the baseline. We’re at that moment in software development, and most teams don’t realize it yet.A year ago, vibe coding went viral. Non-developers and junior developers... Read more

0 fresh

The Fintech Times
Amrit Kang @ The Fintech Times 1 place · today 14:30 EDT

We’re Just Getting Started

US fintech enters an AI-led phase as capital concentrates on established players, stablecoins gain traction, and success hinges on timing, scale, and compliance heading into Q2. Read more

0 fresh

CoinDesk
Helene Braun @ CoinDesk 1 place · today 10:53 EDT

Bitcoin moves off lowest level as worst of weekend fears slip away

As the U.S. blockade of the Strait of Hormuz goes into effect, reports say Iran is considering the abandonment of uranium enrichment as a way to end the war. Read more

0 newcommer

Habr
ruorv @ Habr 1 place · today 10:49 EDT

Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов

Как мы сделали сервис, который подбирает спутниковые снимки под уровень воды на гидропостуВсем привет. Меня зовут Александр Иннокентьев, и уже больше года мы с моим коллегой Павлом Головлевым делаем веб-инструмент для гидрологов под названием «Уровень-Спутник». Читать далее Read more

0 newcommer

SlashGear
SlashGear 1 place · today 10:45 EDT

Hennessey's Ultra-Limited 35th Anniversary Mustang Is A $150,000 Beast

Hennessey has been building absurdly powerful modified cars for 35 years as of 2026, and it's celebrating this anniversary with a very special Mustang. Read more

0 newcommer

Habr
strukk @ Habr 2 place · today 10:44 EDT

Как бизнесу создать канал в мессенджере MAX: способы и нюансы

Замедления Telegram стали звоночком, что пора заводить запасной канал. И тут на арене появляется MAX, правда не такой интуитивно понятный. Трудности начинаются с самого создания канала, для которого нужна маркировка A+ или регистрация на партнёрской платформе — рассказываю про каждый способ Читать далее Read more

0 newcommer

Habr
rurikovich @ Habr 3 place · today 10:42 EDT

AI-Driven подход «Harness Engineering»: наступившее будущее или лишь метод с ограничениями?

Вдохновился идеей OpenAI Harness Engineering и проверил на большом легаси проекте: можно ли отдать агенту всю реализацию, а человеку - постановку, тесты и ревью. Сотни файлов, зелёные тесты и два бага, которые нашли только руками. Про «согласованные ошибки», разные мнения и почему финал эксперимента открытый. Читать далее Read more

0 newcommer

ScienceDaily
ScienceDaily 1 place · today 10:40 EDT

Africa’s forests have undergone a shocking reversal, switching from carbon absorbers to carbon emitters after 2010. Researchers found that heavy deforestation in tropical regions has led to massive biomass losses, far outweighing any gains from regrowth elsewhere. This change could seriously undermine global efforts to slow climate change. Scientists warn that protecting forests is now more urgent than ever. Read more

0 fresh

Eurogamer.net
Fran Ruiz @ Eurogamer.net 1 place · today 10:39 EDT

4A Games announces Metro 2039, and we're getting an Xbox-themed reveal stream later this week

It's time to brave the harsh outside world again, survivor. Metro 2039 has been confirmed, and developer 4A Games will share a proper first look at the game later this week. Read more Read more

0 fresh

Silicon Canals
Mal James @ Silicon Canals 1 place · today 10:38 EDT

The art of thinking clearly in a noisy world

In a world where even silence screams for attention, discovering how to think clearly isn't about escaping the chaos—it's about finding the eye of the storm within your own mind. Read more

0 fresh

Droid Life
Kellen @ Droid Life 1 place · today 10:34 EDT

This is the Pixel 11 Color Google Needs to Make

Pixel 11 and Pixel 11 Pro models are unlikely to go through a design change and the expectation is that Google will be running it back a third time with this current setup. We’ve seen CAD renders that are almost never wrong, so try not to put too much energy into a big Google surprise... Read the original post: This is the Pixel 11 Color Google Needs to Make Read more

0 fresh

Business Insider
Nikita Grant,Abby Narishkin,Jessica Orwig @ Business Insider 1 place · today 10:33 EDT

Meet the 31-year-old set to take over Wolfgang Puck's culinary empire. He got his start washing dishes at 12.

Byron Lazaroff-Puck, has been working alongside his father for nearly 20 years as he prepares to lead Wolfgang Puck's global culinary empire. Read more

0 fresh

TechRadar
TechRadar 2 place · today 10:30 EDT

No, you don't need a new turntable this Record Store Day, just use this cheap extra to clean your vinyl

Take it from me: a fancy record player won't improve how your vinyl sounds if you haven't tried this cheap extra first Read more

0 fresh

Business Insider
Bryan Metzger @ Business Insider 2 place · today 10:28 EDT

What bets are lawmakers and staffers making on prediction markets? They don't have to say.

Ethics laws require politicians to disclose stock trades. They don't require the same for trading on prediction markets like Kalshi and Polymarket. Read more

0 fresh

Engadget
Jackson Chen @ Engadget 1 place · today 10:26 EDT

Two suspects have been arrested for allegedly shooting at Sam Altman's house

OpenAI CEO Sam Altman's house may have been the target of a second attack after San Francisco Police Department arrested two suspects for a reported shooting in the Russian Hill neighborhood. The SFPD said in a press release that police officers responded to a "suspicious occurrence of possible shots fired" at around 5:56 AM ET / 2:56 AM PT on Sunday, April 12. SFPD's Special Investigation Division took over the... Read more

0 fresh

Habr
PCB-network (ЭРЕМЕКС) @ Habr · today 10:23 EDT

Delta Design Домашняя: профессиональная САПР — теперь для всех

Компания ЭРЕМЕКС много лет разрабатывает Delta Design — профессиональную САПР для корпоративных заказчиков: сквозной цикл, интеграции с PLM, сотни компонентов, многослойные платы, в том числе с гибко-жесткой структурой  и т.д.Но у нас давно копилась отдельная папка в почте: письма от физических лиц, от радиолюбителей, от студентов, от фрилансеров, которые делают умный дом в гараже или пилят ретро-консоль для себя и друзей. Все они писали примерно одно и то же: «Хотим... Read more

0 fresh

Vox
Benjy Sarlin @ Vox 1 place · today 10:20 EDT

Eric Swalwell’s downfall, explained

Rep. Eric Swalwell (D-CA) suspended his campaign for California governor on Sunday after a series of disturbing accusations of sexual misconduct. The scandal had drawn a fierce response from Democrats nationwide as they tried to force him out and keep the fallout contained.  Just days ago, Swalwell was one of the frontrunners in a crowded […] Read more

0 fresh

The most popular news from the same source for the last week
Habr Habr
Habr
Dmitrij-Blinov (LogistiX) @ Habr · 04/06/2026 10:27 EDT

Почему на производстве вечный аврал, и как от него избавиться

Кладовые забиты деталями, но на финишную сборку не хватает двух позиций. Склад показывает «всё в наличии», а в цехе пусто. К концу месяца — авральные переработки, чтобы закрыть план. Это не описание какого-то конкретного завода. Это типичная картина на предприятиях, где производство и складская логистика живут в параллельных мирах.На проводимых нами проектах автоматизации на производствах — от рыбопереработки до промышленных заводов — практически везде встречаются одни и те же пять... Read more

0

Habr
cognitronn (BotHub) @ Habr · 04/06/2026 10:44 EDT

[Перевод] После краха Sora Альтман переключается на ещё более разрушительную авантюру, чтобы похоронить OpenAI окончательно

Сэм Альтман не понимает технологии, не хочет понимать и считает, что ему это не нужно.Или это только мне кажется, что истинная миссия Сэма Альтмана — спалить как можно больше инвестиционного капитала за кратчайший срок?В этом он и правда похож на своего кумира — Наполеона Бонапарта. Французский император привёл миллионы европейцев к смерти; император ИИ спустил миллиарды долларов. И занял ещё больше — без каких-либо внятных перспектив возврата инвестиций.Чего только не... Read more

0

Habr
TomHunter @ Habr · 04/06/2026 10:47 EDT

Топ самых интересных CVE за март 2026 года

Всем привет! Подводим итоги марта по части самых интересных CVE. Дайджест был бы неполным без десяточки от Cisco: небезопасная десериализация под RCE в Cisco FMC, активно эксплуатируемая с конца января.Отдельно также отметилась компрометация цепочки поставок сканера уязвимостей Aqua Trivy с далеко идущими последствиями, включая кражу исходников у той же Cisco. В ИИ-платформе Langflow критическая уязвимость под внедрение кода без аутентификации, в Chrome два нулевых дня в Skia и V8, а... Read more

0

Habr
beeline_cloud (Beeline Cloud) @ Habr · 04/06/2026 10:47 EDT

Десятки «кораблей Тесея» уже готовы, еще тысячи на подходе! Новый спор вокруг применения ИИ в опенсорсе

В философии есть известный парадокс — корабль Тесея: если заменить все доски, будет ли это тот же самый корабль? Похожая дискуссия с начала марта развернулась и в ИТ-сообществе, и виноваты в этом, как в последнее время часто бывает, системы ИИ, способные за считаные минуты с нуля переписать открытый проект.Кейс библиотеки chardet вызвал споры о допустимости и этичности такого подхода, а также о роли лицензирования в новой реальности. Сегодня мы в... Read more

0

Habr
DyadichenkoGA @ Habr · 04/06/2026 10:46 EDT

Почему ваш персонаж телепортируется при высоком FPS: float precision в играх

Всем привет! Меня зовут Григорий Дядиченко, и я разрабатываю разные проекты на заказ. Сталкивались ли вы с ситуацией, когда персонаж в вашей игре начинает немного дёргаться, если поиграть достаточно долго? Или пуля иногда пролетает сквозь тонкую стену, хотя коллайдер на месте? Если да — добро пожаловать в мир проблем float precision.Сегодня хочется поговорить о том, почему тип float — при всей его повсеместности — может создавать тонкие и неочевидные баги... Read more

0

Habr
3ball @ Habr · 04/06/2026 10:46 EDT

Эксперимент: поиск неслучайностей в AES-CBC на 500k сэмплах

Привет, Хабр! Сегодня я расскажу, как пытался анализировать поведение AES-128-CBC на 500 000 выборках шифротекстов. Читать далее Read more

0

Habr
Neurosonya @ Habr · 04/06/2026 10:56 EDT

Как перестать использовать ИИ как чат-бота и начать автоматизировать рабочие процессы (Workflows)

Большинство людей используют ИИ неправильно. Они задают один вопрос, получают один ответ и копируют его в свой документ. Это уровень чат-бота. Настоящая сила ИИ-агентов (таких как Claude Cowork или ChatGPT Agent) раскрывается не в генерации текста, а в выполнении многошаговых рабочих процессов (workflows).В этой статье мы разберем, как передать агенту цепочки задач, которые обычно съедают часы вашего времени: от полного цикла онбординга нового клиента до подготовки писем по итогам двухчасовых... Read more

0

Habr
infosave @ Habr · 04/06/2026 11:21 EDT

Web-панель для для управления VPN и множеством протоколов v2

Я выпустил вторую версию PHP-веб-панели для управления Amnezia VPN. Теперь это не просто интерфейс к одному серверу, а полноценная система управления VPN-инфраструктурой: 9 протоколов, роли, лимиты, метрики, резервные копии, Docker-управление удаленными хостами и REST API для автоматизации. Проект открыт и доступен на GitHub. Читать далее Read more

0

Habr
aak204 @ Habr · 04/06/2026 11:21 EDT

Иллюзия логики: как я доказал, что LLM-агенты игнорируют факты, и почему Chain-of-Thought делает только хуже

Сейчас каждый второй стартап пилит ИИ-агентов. Мы оборачиваем LLM в цикл Промпт -> Вызов инструмента -> Ответ и ждем, что нейросеть сама расследует инцидент, найдет баг или напишет фичу. Но на практике автономные агенты часто ходят по кругу, игнорируют явные ошибки и «влюбляются» в свою первую догадку.Индустрия пытается лечить это костылями: наращивает контекст до миллионов токенов или заставляет модель «подумать шаг за шагом» (Chain-of-Thought). Я решил проверить эту архитектуру на... Read more

0

Habr
A1exMa @ Habr · 04/06/2026 11:27 EDT

Куда бедному нейроблоггеру податься?

Когда решение вести блог принято, перед каждым будущим автором немедленно встает следующий вопрос: где? Или, точнее — в чём?Я думал, что решение этого вопроса тривиально и займёт не больше пяти минут. На самом деле я залип почти на неделю, потому что современный мир предлагает нам много вариантов. Вы можете согласиться с моим выбором или сделать свой собственный. Эта кроличья нора оказалась достаточно глубока — и я хочу дать вам путеводитель,... Read more

0

Most popular sources

  • You see 580 news out of 580.
  • Sources 61 out of 61.
BetaKit 0%
Tech Wire Asia 0%
ArcticStartup 0%
EU-Startups 0%
Sifted 0%
View sources »

LIKE us on Facebook so you won't miss the most important news of the day!

13.04.2026 11:09
Last update: 11:00 EDT.
News rating updated: 18:02.

What is Times42?

Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.


Times42 © 2026