13 place 0
Топовые AI-модели с 95% на SWE-bench показывают 0% и 3% на ProgramBench бенчмарке, где задачи специально не пересекаются с обучающей выборкой. Не «упали на десять пунктов» - обнулились.Параллельно: в мае 2025 Anthropic опубликовали safety-эксперимент, где Claude Opus 4 в 84-96% случаев пытался шантажировать инженера приватной перепиской, чтобы избежать отключения. В мае 2026 они же выпустили разбор причин и инженерное решение - production-модели на этом тесте теперь 0%.Две истории, одна структура: модель пр
A newsletter a day!
You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.
LIKE us on Facebook so you won't miss the most important news of the day!
An East Bay apartment complex has been bought at a price that's well below its prior value. Read more ›
0
A PG&E Corp. unit has bought a San Jose building in a move to bolster the utility's South Bay operations. Read more ›
0
Inside Ineffable Intelligence: the team behind David Silver's $5.1bn superintelligence push Read more ›
0 fresh
The UK government is to ban social media for under 16 year olds in a landmark decision that will impact generations to come. The government has shared plans to use the same model for a social media ban as Australia, which covers user-to-user platforms whose purpose is to enable social interaction and allow users to post ... Read more ›
0 newcommer
Sundar Pichai swerves AI in Stanford speech, but still faces protests at Google policies. Read more ›
0 newcommer
Nevada gaming regulators are asking a state court to hold prediction-market operator Kalshi in contempt, saying the company continues to… Continue reading Nevada seeks Kalshi contempt sanctions as prediction market fight escalates further Read more ›
0 newcommer
This 4K Samsung M7 display doubles as a smart TV hub, and a deal has dropped it 43% to just $229.99 for the first time. Read more ›
0 newcommer
AI is helping workers deliver more quickly, but they're then having to go behind it picking up the pieces. Read more ›
0 newcommer
У вас есть сервер. Он числится на балансе. За ним закреплён Иванов. Иванов уволился год назад. Где сервер – никто не знает.Если это звучит знакомо, вы не одиноки: по данным исследования российского рынка ITAM 2026 года (опрошено больше 100 компаний), 80% организаций оценивают зрелость своих процессов управления активами на уровне 1–3 из 5. То есть большинство российских компаний до сих пор разбираются с вопросом «что у нас вообще есть». До... Read more ›
0 newcommer
Роли между популярными нейросетями более-менее распределены. ChatGPT остается главным универсальным помощником для большинства пользователей. Claude считается одним из лучших инструментов для программирования. Grok постепенно превращается в встроенного собеседника для аудитории X. А DeepSeek завоевал популярность как мощная и при этом относительно недорогая альтернатива американским моделям. Кому нужна еще одна китайская нейросеть — Qwen? Разбираемся, что это такое, чем она отличается от DeepSeek и может ли Read more ›
0 newcommer
Девять AI-агентов делят одну API-квоту — и один ответ 429 быстро превращается в каскадный отказ всей системы. В этой статье разбираемся, почему стандартные ретраи и jitter перестают работать при общей квоте, и показывает архитектуру Rate Governor: с приоритетами, общим пулом токенов, предиктивным Circuit Breaker и координацией между агентами. Изучить паттерны Read more ›
0 newcommer
Я прихожу в компании временным CTO — когда прежний ушёл, когда инженерка не вывозит или когда надо привести её в порядок перед раундом. И из раза в раз вижу одну и ту же историю: новый технический директор в первый же день ныряет в код, а через полгода уходит — без полномочий, без доверия, с выгоранием. Расскажу, что в первые три дня стоит делать вместо этого. Никакой теории из книжек по... Read more ›
0 newcommer
Ironsmith is a free AI Mac app builder that turns plain-language requests into native macOS utilities, with local and cloud model options for creating small personal tools. Read more ›
0 fresh
F&B brand Foodstories has raised ₹50 Cr (about $5.2 Mn) in a funding round led by Zerodha cofounder Nikhil Kamath,… Read more ›
0 fresh
Google's AI Overviews can't stop thinking of you as a friend, and that's a problem. Read more ›
0 fresh
Читать статьи и веб-материалы через суммаризацию от LLM — это уже почти норма. Даже один только разбор общей картины плюс диалоговые вопросы заметно поднимают эффективность обучения.Но такой способ замыкается в одной сессии. А то, что по-настоящему определяет качество исследования и обучения, — это инсайты, рождающиеся из связей между материалами, прочитанными в разное время.Удерживать эти связи силами человека тяжело. У памяти есть предел: детали статьи, прочитанной полгода назад, забываются. Держать в... Read more ›
0 newcommer
ИИ-агенты уже умеют писать письма, резюмировать встречи и искать ответы в базе знаний. Но в корпоративной среде этого мало. Пока агент только работает с текстом, он остаётся помощником рядом с процессом, а не участником самого процесса.Чтобы агент действительно помогал в корпоративных бизнес-приложениях по типу ITSM, SDLC или других enterprise-сценариях, ему нужен безопасный доступ к действиям: получить данные, проверить статус, создать задачу, найти связанный объект, сходить во внешнюю систему и вернуть... Read more ›
0 newcommer
Anthropic отчиталась, что больше 80% её кода теперь пишет Claude, — а её же автоматический проверяющий ловит лишь треть прошлых ошибок, то есть две трети пропускает. Если код пишет один ИИ, а проверяет такой же — они слепнут в одних и тех же местах, и второй контур даёт не защиту, а общую слепую зону. Разбираю на инженерном уровне, почему «проверка ИИ» не равна независимой проверке, как измерить слепое пятно и... Read more ›
0
На связи Денис из команды SPQR. Мы занимаемся разработкой системы, которая помогает легко реализовать горизонтальное масштабирование PostgreSQL с помощью шардирования. И это не теоретическая задача на два шарда и десять таблиц. Необходимо сделать систему, которая в пределе хранит петабайты данных и выдерживает сотни тысяч запросов в секунду. В прошлой статье мы показывали SPQR со стороны пользователя: как выбрать ключ шардирования, как разложить таблицы на распределённые (distributed) и справочные (referenc Read more ›
0
Наткнулся на старую веб-камеру, которая валялась без дела. Дешевый вариант с посредственным качеством. С такой камерой не стать звездой онлифанс. Но выкидывать жалко. Пришла в голову мысль — почему не соорудить управление жестами для компьютера?Полноценное управление компьютером, как в фильмах с Томом Крузом, пока остаётся фантастикой: руки затекают, случайные движения превращаются в случайные команды. А вот привязать к жестам пару действий — выключить звук, свернуть окна, прокрутить ленту — реально... Read more ›
0
Тестирование функциональности Direct I/O — задача сама по себе нетривиальная. Сложность возрастает, если проверить работу функциональности можно только на ненагруженной базе данных, а тестируемое приложение предназначено для работы с высоконагруженными системами.Можно, конечно, ограничиться проверкой того, что на неактивной базе приложение не использует кеш. Но это не даёт ответа на главные вопросы клиента: «Будет ли реальная выгода в промышленной эксплуатации и не случится ли так, что активное резервное ко Read more ›
0
Перед вами тарелка рамена, бутерброды, десерт и ароматный обед. Половину из них кто-то готовил, фотографировал и, возможно, уже съел. Вторую половину придумала нейросеть. Ваша задача — угадать, где еда настоящая, а где очень убедительный обман. Читать далее Read more ›
0
Добро пожаловать на мой маленький тестовый полигон.В этой статье я расскажу, как столкнул лбами двадцать один алгоритм машинного обучения - от старой доброй линейной регрессии, KNN, случайного леса до троицы табличных королей (XGBoost, LightGBM, CatBoost), нескольких многослойных нейросетей и нейросетей с механизмом внимания. И я заставил их всех решать задачу, которая на первый взгляд кажется абсурдной (только на первый взгляд?).Большинство бенчмарков в машинном обучении вроде MNIST или Titanic давно натре Read more ›
0
Короче, такая история. В моей практике бывало такое, что приходит команда и говорит: «хотим внедрить ИИ». А под этим она понимает что-то среднее между волшебной кнопкой и наймом робота на ставку аналитика. Через пару часов разговора выясняется, что ожидания и механика расходятся примерно на световой год. Происходит это часто — и именно поэтому стоит один раз разобраться, что там внутри и откуда берётся настоящий эффект. Читать далее Read more ›
0
Разбираем возможности ИИ-генератора видео Seedance 2.0 и версии Pro. Сравнение с Kling и Veo 3, лучшие промпты, лимиты, советы по созданию роликов и как пользоваться нейросетью из России без VPN. Полный обзор с примерами генерации видео. Читать далее Read more ›
0
Привет! Меня зовут Андрей, я инженер в Циане. Примерно год назад мы начали внедрять в работу AI-помощников для разработки, а несколько месяцев назад сфокусировались на Claude Code как самом продвинутом из доступных. Сейчас пилотно используем его в командах инфраструктуры, платформы, продуктовой разработки. Масштаб здесь велик, риски интеграции AI тоже. В статье я расскажу, какие проблемы мы решали в процессе внедрения. И призываю вас поделиться своим опытом в комментариях. Читать далее Read more ›
0
Привет, меня зовут Николай Разумовский, я дизайнер в команде цифровой трансформации Ареал. Как дизайнер я регулярно сталкиваюсь с задачей: нужно быстро получить уникальные изображения для интернет-магазинов, корпоративных сайтов, лендингов и презентаций. Если опираться только на стоки, процесс затягивается, а визуально проекты становятся похожими друг на друга.Генерация через нейросети решает сразу несколько задач: Читать далее Read more ›
0
Most popular sources
|
|
0% |
|
|
0% |
|
|
0% |
|
|
0% |
|
|
0% |
| View sources » | |
LIKE us on Facebook so you won't miss the most important news of the day!
15.06.2026 06:22
Last update: 06:16 EDT.
News rating updated: 13:11.
What is Times42?
Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.