4 place 0

299 Как Gemini 3.5 Flash сломали ради красивых графиков (и почему она обходит 3.1 Pro только на бумаге)

Habr
YH7H22 @ Habr · 05/23/2026 15:40 EDT

Как Gemini 3.5 Flash сломали ради красивых графиков (и почему она обходит 3.1 Pro только на бумаге)

Буквально на днях Google выкатила gemini 3.5 flash. Маркетологи бьют в фанфары: легковесная модель обходит тяжелую gemini 3.1 pro на бенчмарках terminal bench 2.1 и MCP atlas! Но стоит открыть чат, и наступает разочарование. Модель общается сухим, бюрократическим, абсолютно безжизненным языком, уступая в человечности даже старой 3.0 flash. В этой статье мы разберем физику RLHF-лоботомии, покажем, как оптимизация под агентов убивает энтропию генерации, и почему современные бенчмарки стали главным врагом разв

To see detailed statistics for the news please log in »

Read the original

Add your comment
You must be logged in with Facebook to read and write comments.

A newsletter a day!

You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.

or register

LIKE us on Facebook so you won't miss the most important news of the day!

News from the same source
Habr Habr
Silicon Valley
George Avalos @ Silicon Valley 1 place · 02/07/2106 01:28 EDT

Newark apartment complex bought for much less than prior value

An East Bay apartment complex has been bought at a price that's well below its prior value. Read more

0

🔮
03.07.2026 ♒︎ Horoscope for Aquarius Today Dear Aquarians, today promises to bring you mixed emotions and impressions... Read more ›
Silicon Valley
George Avalos @ Silicon Valley 2 place · 02/07/2106 01:28 EDT

PG&E buys San Jose building to bolster South Bay operations

A PG&E Corp. unit has bought a San Jose building in a move to bolster the utility's South Bay operations. Read more

0

Tech.eu
Cate Lawrence @ Tech.eu 1 place · today 05:36 EDT

Pytorch: the software layer underpinning Europe's AI ambitions

Europe has emerged as one of the world's leading centres for open-weight AI, with companies including Mistral, Black Forest Labs and Helsing contributing to a growing ecosystem focused on open models ... Read more

0 fresh

CoinDesk
Shaurya Malwa @ CoinDesk 1 place · today 01:29 EDT

XRP bulls test path back toward $1.10 as token zips 4% higher

Buyers defended a higher low and pushed XRP toward near-term resistance, though the move still needs a clean break above $1.10 to confirm momentum. Read more

0 newcommer

CoinDesk
Shaurya Malwa @ CoinDesk 2 place · today 01:18 EDT

Ether and solana extend gains as a short squeeze lifts bitcoin toward $62,000

Bearish traders lost $281 million in liquidations over 24 hours, nearly double the longs, as bitcoin pushed to its strongest level in two weeks. Ether is up almost 10% on the week and solana nearly 19% while a rebound in tech stocks eased the pressure from the AI trade. Read more

0 fresh

Digital Trends
Rachit Agarwal @ Digital Trends 1 place · today 01:01 EDT

Samsung’s Galaxy S27 Pro and Ultra could finally ditch that ancient selfie camera

Samsung's Galaxy S27 Pro and Ultra may swap the aging 12MP selfie camera for a sharper 16MP sensor, plus upgraded telephoto and ultra-wide lenses. Read more

0 fresh

Wired
Lily Hay Newman, Matt Burgess @ Wired 1 place · today 01:00 EDT

EU Politicians Investigated Pegasus Spyware. Then It Ended Up on One of Their Phones

“It is a direct attack on the rule of law,” says one European Parliament member of the new findings from Citizen Lab. Read more

0 fresh

TechRadar
TechRadar 1 place · today 01:00 EDT

UK government signs £30 million deal to build the world’s first prototype fusion power plant by 2040

Dassault Systèmes to lead UK prototype fusion power plant digital twin software with £30 million deal, supporting engineering and collaboration. Read more

0 fresh

The Fintech Times
The Fintech Times @ The Fintech Times 1 place · today 01:00 EDT

MANSA and Esca Finance Link Rails for Same-day African Settlement

The Tether-backed stablecoin infrastructure firm has partnered with Esca Finance to offer same-day settlement across Nigeria, Ghana and CFA franc corridors. Read more

0 fresh

Business Insider
Aditi Bharade @ Business Insider 1 place · today 00:54 EDT

A heat dome threatens the Fourth of July weekend with extreme temps and power strain

The heat dome arrives just before the Fourth of July weekend, when AAA predicted 72.2 million Americans would travel. Read more

0 fresh

CNET
Tyler Lacoma @ CNET 1 place · today 00:43 EDT

SwitchBot Debuts Advanced Camera With AI Event Alerts, Wildlife Recognition

SwitchBot's latest 3K camera includes some familiar AI features and a couple of standout customizations I've never seen before. Read more

0 fresh

GSMArena.com
GSMArena.com 1 place · today 00:31 EDT

Lenovo starts teasing a new Legion gaming tablet with 5G, here's when it's coming

Lenovo launched the Legion Y700 (Gen 5) tablet in March, and now the company is working on a new version. Currently teased as the Y700 Unlimited (machine translated from Chinese), it's going to be made official in August, and it will have 5G support. Until then, we can expect to see more teasers in the next few weeks. For now, we have the video you can see below, which showcases... Read more

0 fresh

Habr
ManticoreSearch @ Habr 1 place · today 00:04 EDT

Шардинг в Manticore Search: автоматическое распределение и репликация

На старте поисковая система часто устроена просто: одна таблица на одном сервере. Это работает, пока не случится одно из двух. Либо отдельный запрос перестаёт задействовать весь CPU, за который вы заплатили, либо одного сервера перестаёт хватать — по объёму, по пропускной способности или просто потому, что сервер может выйти из строя, и данные на нём будут потеряны.Автоматический шардинг, встроенный в Manticore Search и доступный начиная с релиза 27.1.5 , решает... Read more

0 fresh

Habr
Jholinar @ Habr 2 place · today 00:00 EDT

B4 — сетевой мультитул по обходу блокировок

С момента написания первой статьи о B4 прошло полгода. Казалось бы, не очень много времени, но софтина получила ну очень большое количество фич, о которых хочется рассказать подробно. Не буду скрывать: хабраэффект сделал своё дело, и благодаря большому интересу после первой статьи очень многие не разочаровались в отсутствии какого-то функционала, а активно помогали - коммуникацией, запросами, тестированием, - благодаря чему все эти фичи в B4 и появились.В итоге на сегодняшний... Read more

0 fresh

The most popular news from the same source for the last week
Habr Habr
Habr
DimaIam (StudyAI) @ Habr · 06/26/2026 00:55 EDT

Самые странные нательные технологии в истории, часть 2

Продолжаем исторический обзор странных, но порой гениальный нательных технологий! Во второй части мы поговорим о более новых наработках, исторически близких к нам по времени. Читать далее Read more

0

Habr
mainbotan @ Habr · 06/26/2026 01:02 EDT

Мультивалютность в ERP — считаем деньги в тенге, SOLANA и Theter одновременно [Go]

Проблема практически любого предприятия малого масштаба, ведущего бизнес более чем в двух рабочих валютах, очень проста — деньги уходят, деньги приходят, курсы меняются, а мы учитываем только рублёвые активы (в лучшем случае). При этом все наши операции по криптокошелькам представляют собой мистические артефакты, которые вроде как есть, но не попадают даже во внутреннюю отчётность для владельца бизнеса.Так получилось, что я родился скромным Goфером и год назад начал работу над самописной... Read more

0

Habr
Neith @ Habr · 06/26/2026 01:01 EDT

КИИ 2026: как регуляторка душит одних и спасает других

КИИ в 2026: регуляторный пинок, уголовное дело или всё-таки защита?Когда регуляторка стала уголовкой - разбираем, кто реально выигрывает от требований к критической информационной инфраструктуре, реалистичен ли дедлайн 2028 года и почему бумажная безопасность теперь может стоить свободы. Читать далее Read more

0

Habr
ZasukhaIV (INFOSTART.RU) @ Habr · 06/26/2026 02:00 EDT

Переход с 1С: УПП на 1С:ERP: от устаревшего учета к управлению будущим

Многие российские компании привыкли к 1С:УПП (Управление производственным предприятием) и активно ее использовали. Но весной 2026 года разработчики прекращают поддержку этой программы. Это значит, что больше не будет ни обновлений, ни исправлений багов, ни технической помощи от создателей.В I квартале 2027 г. вендор не будет выпускать обновления 1С:УПП кроме тех, которые потребуются для сдачи отчетности за 2026 г. Законодательные изменения, которые вступят в силу с января 2027 г., поддерживаться в... Read more

0

Habr
PyLounge @ Habr · 06/26/2026 02:04 EDT

Кирилл, моя задница и 4 правила леса

Продакшен. 23:52. Пятница. Восстанавливаем схему БД. Нет, не случайная авария. Просто я удалил поле, потому что Кирилл был уверен, что оно не нужно и не затронет всех внешних потребителей нашего API. Эх, подумал я. Опять было нарушено первое правило леса. Сколько раз я уже на этом попадался, и вот опять. Неужели так сложно было проверить? Нет, не сложно. Но зачем? Кирилл на проекте уже 5 лет. Он реально гений, ещё... Read more

0

Habr
Timeshov @ Habr · 06/26/2026 02:28 EDT

Как организовать стимулирующую акцию: от механики до валидации чеков

Стимулирующие акции -штука эффективная, но с подковыркой. Запустить можно быстро, а вот получить результат, не слив бюджет впустую, - уже искусство. В этой статье разберу, какие механики работают, как устроен промосайт, что делать с чеками и где обычно всё ломается. К изучению полотна Read more

0

Habr
Ilya519 @ Habr · 06/26/2026 02:31 EDT

Мой мониторинг аптайма сам нагенерил 932 фантомных падения

2 июня мой мониторинг аптайма разом отрапортовал, что упало почти всё: 932 инцидента за 25 минут. Сайты были живы — все до единого. Виноваты дефолтный лимит файловых дескрипторов 1024 и «оптимизация», тихо размножившаяся в 60 раз. Разбираю по приборам: /proc, ss, EMFILE и почему docker compose restart не спасает. Читать далее Read more

0

Habr
saparlabs @ Habr · 06/26/2026 02:41 EDT

Можно ли пересадить алгоритм из маленькой модели в LLM? Эксперимент с grokking, residual stream и линейной проекцией

Современные LLM (Large Language Models) — это черные ящики. Мы знаем, что они что-то умеют, но как они это делают внутри — остается загадкой. Существует целое направление — механистическая интерпретируемость (mechanistic interpretability), которое пытается заглянуть внутрь нейросетей и найти алгоритмы, зашитые в весах. Ключевая идея этого направления: если модель обучилась решать задачу (например, арифметику), то внутри её residual stream формируется геометрическая структура — числа начинают лежать на окруж Read more

0

Habr
danolivo @ Habr · 06/26/2026 02:49 EDT

Генеративный Postgres-дайджест: от информационного шума — к сигналу

Аналитика, сканирование интернета стали сегодня сильно проще — даже китайских коллег можно читать совершенно прозрачным образом. Изучение исходников смежных OSS-проектов — это вообще песня: за пять минут, на малознакомом языке программирования и без предварительного знания структуры проекта можно получить ответы на важные вопросы, потырить полезные приёмы и изучить как удачные, так и неудачные архитектурные решения. Тогда почему мы всё ещё тратим время, ходим на youtube и новостные сайты в поисках... Read more

0

Habr
double_bobik @ Habr · 06/26/2026 02:56 EDT

Деньги в путешествии за границу из России: 5 ошибок и 5 советов

Если едете за рубеж этим летом, обязательно прочитайте, чтобы не потратить +30% на комиссии, не получить проблем на таможне и просто не остаться на улице без денег. Читать далее Read more

0

Most popular sources

  • You see 827 news out of 827.
  • Sources 61 out of 61.
Tech Wire Asia 0%
StartUs Magazine 0%
AlleyWatch 0%
UK Tech News 0%
Tech.eu 0%
View sources »

LIKE us on Facebook so you won't miss the most important news of the day!

03.07.2026 01:49
Last update: 01:40 EDT.
News rating updated: 08:42.

What is Times42?

Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.


Times42 © 2026