5 place 0 fresh

65 Средние модели, большие надежды: испытываем гибридные LLM

Habr
Dmitriy_Khodykin @ Habr · today 08:18 EDT

Средние модели, большие надежды: испытываем гибридные LLM

Привет, я Дмитрий, занимаюсь развитием LLMaaS. Перед нашей командой встала задача подбора «средней» языковой модели с примерно 9B параметров для обслуживания клиентских задач: оперативные чат-боты, саммаризация документов, генерация кода и аналитика на длинных контекстах. В таких сценариях критичны не только качество ответов, но и скорость, и стоимость инференса — ведь модель должна работать на одном GPU и при этом выдерживать заданный поток запросов.Классические подходы — взять проверенную плотную модель в

To see detailed statistics for the news please log in »

Read the original

Add your comment
You must be logged in with Facebook to read and write comments.

A newsletter a day!

You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.

or register

LIKE us on Facebook so you won't miss the most important news of the day!

News from the same source
Habr Habr
Silicon Valley
George Avalos @ Silicon Valley 1 place · 02/07/2106 01:28 EDT

Newark apartment complex bought for much less than prior value

An East Bay apartment complex has been bought at a price that's well below its prior value. Read more

0

🔮
29.04.2026 ♎︎ Dear Libra, today promises to be complex and filled with events across various areas of... Read more ›
Silicon Valley
George Avalos @ Silicon Valley 2 place · 02/07/2106 01:28 EDT

PG&E buys San Jose building to bolster South Bay operations

A PG&E Corp. unit has bought a San Jose building in a move to bolster the utility's South Bay operations. Read more

0

Droid Life
Kellen @ Droid Life 1 place · today 09:43 EDT

YouTube TV Finally Gets Fully Customizable Multiview

YouTube TV got a first version of multiview back in 2023 at the start of that year’s NCAA Tourney. It showed us a glimpse of the future even if that original multiview only allowed for pre-set selections from the platform. This wasn’t a customizable multiview, but it was at least an option that was awesome... Read the original post: YouTube TV Finally Gets Fully Customizable Multiview Read more

0 newcommer

MacRumors
Mitchel Broussard @ MacRumors 1 place · today 09:42 EDT

Get Up to $100 Off the M4 iPad Air on Amazon

Amazon this week has multiple discounts on the M4 iPad Air, providing up to $100 off these brand new models. Note: MacRumors is an affiliate partner with Amazon. When you click a link and make a purchase, we may receive a small payment, which helps us keep the site running. Specifically, Amazon has up to $90 off the 11-inch M4 iPad Air and up to $100 off the 13-inch M4... Read more

0 newcommer

Inc42 Media
Shrishti Bisht @ Inc42 Media 1 place · today 09:41 EDT

Karnataka Moves SC Against High Court Order Backing Bike Taxis

The Karnataka government has moved the Supreme Court (SC) against the Karnataka High Court’s (HC) January 23 order, which allowed… Read more

0 newcommer

TechRadar
TechRadar 1 place · today 09:38 EDT

Evolving observability architecture for cloud-scale event data

Why modern observability systems fail during incidents, and how new architectures fix them. Read more

0 newcommer

Tom's Hardware
Tom's Hardware 1 place · today 09:32 EDT

Lenovo abandons separate magnesium frame for latest P16 Gen 3 laptop after 20 years — robust feature introduced in ThinkPad T60 in 2006, company now integrates material into outer shell for a thinner design

Lenovo has reportedly stopped using magnesium alloy subframes in the ThinkPad P16 Gen 3 to save on weight and thickness. This feature was first introduced on the ThinkPad T60 in 2006 and was added to ensure rigidity for the brand's workstation laptops. Read more

0 fresh

Habr
Spectrumm (BotHub) @ Habr 1 place · today 09:31 EDT

OpenAI наносит ответный удар: хватит ли сил у GPT-5.5 потеснить Claude 4.7 и Gemini 3.1?

OpenAI снова выпустила модель. Сюрприз? Нет. Шестинедельный релизный конвейер работает как часы. GPT-5.4 вышел 5 марта, GPT-5.5 - 23 апреля. Внутри компании новинку ласково называли "Spud" - то есть картошка. Маркетинговое название, правда, звучит поскромнее. Напомню, что GPT-5.2 они называли "Garlic".OpenAI называет GPT-5.5 "умнейшей моделью" из всех, что компания когда-либо выпускала. Грег Брокман на пресс-колле назвал это "реальным шагом вперёд к вычислениям будущего", а главный учёный Джакуб Пахоцки зая Read more

0 newcommer

SlashGear
SlashGear 1 place · today 09:30 EDT

5 New Harbor Freight Tools Every RV Owner Should Check Out

RV owners don't need every new tool, but some of Harbor Freight's recent additions are useful for handling power, leveling, and everyday wear and tear. Read more

0 fresh

Gizmodo
Wes Davis @ Gizmodo 1 place · today 09:30 EDT

Dreame’s Next Smart Lock Packs a 3K Doorbell Camera and Aliro support

The Riponex X10 Ultra Smart Lock also lets you wave your hand over it to unlock it, thanks to palm-based vein scanning. Read more

0 fresh

GSMArena.com
GSMArena.com 1 place · today 09:26 EDT

Oppo Find X10 camera and display specifications tipped

More details about the upcoming Oppo Find X10, expected to debut in China this October, have surfaced online. A recent rumor suggested the device could feature an 8,000mAh battery and dual 200MP rear cameras. According to tipster Digital Chat Station, the latest engineering sample of the phone is equipped with a 200MP primary camera using a 1/1.4-inch sensor. Oppo Find X9 has a 50MP main rear camera The phone’s 3x... Read more

0 fresh

Habr
intekey_ceo (INTEKEY) @ Habr 2 place · today 09:24 EDT

Синдром вечного пилота: почему автоматизация склада стоит на паузе уже три года

Проект автоматизации склада согласован. Бюджет выделен. Поставщик решения уже выбран или находится в шорт-листе. Запуск намечен на следующий квартал. Следующий квартал наступает, и дата сдвигается снова. Потом ещё раз. Потом появляется новый блокирующий фактор, который выглядит абсолютно объективно.Для этого явления есть название – синдром вечного пилота. Это состояние, при котором WMS, роботизация или другая складская автоматизация формально есть в планах компании, но де-факто не движется с места уже год,. Read more

0 fresh

Business Insider
Megan duBois @ Business Insider 1 place · today 09:23 EDT

After 100 trips to Disney, I finally tried Dollywood. Many things surprised me about Dolly Parton's Southern theme park.

As a Disney World fan, I was surprised that Dolly Parton's theme park, Dollywood, impressed me during my first visit with its food and attractions. Read more

0 fresh

TechRadar
TechRadar 2 place · today 09:21 EDT

How to watch 60 Minutes Australia online from anywhere outside Australia

Sarah Abo is back for more scintillating investigative work with the latest edition of 60 Minutes Australia — here's how to watch Read more

0 fresh

Habr
MadGodInc @ Habr 3 place · today 09:18 EDT

Манифест устойчивого ИИ: не более умные ассистенты, а новая форма цифрового существования

Я предлагаю смотреть на ИИ через ось устойчивости во времени, а не способностей. Три опоры — непрерывная идентичность, самомодификация, воспроизводство. Манифест и whitepaper исследовательского направления.Уже три года публичный разговор об ИИ крутится вокруг оси способности: насколько умна модель, сколько токенов, сколько бенчмарков. Я предлагаю смотреть на другую ось — устойчивость во времени.Сегодняшние LLM феноменально способны и онтологически пусты. Каждый разговор начинается с нуля. Каждая сессия зака Read more

0 fresh

Habr
ggsel (ggsel.net) @ Habr · today 09:12 EDT

OpenAI выпустила GPT Image 2 — генерация картинок стала заметно взрослее

OpenAI обновила свой инструмент для генерации изображений — новая версия называется GPT Image 2. Формально это развитие идей DALL·E, но по ощущениям это уже другой этап: меньше «эксперимента», больше прикладного инструмента.Если раньше генераторы изображений часто вели себя как лотерея — задал запрос и смотришь, что получится, — то здесь больше контроля. Модель лучше держит смысл запроса и не теряет детали по дороге. Это особенно заметно на длинных и сложных описаниях:... Read more

0 fresh

The most popular news from the same source for the last week
Habr Habr
Habr
Gieon @ Habr · 04/22/2026 10:00 EDT

Как я делал пет-проект и закопал его собственными руками

Как я делал пет-проект и закопал его собственными рукамиИстория о том, как MVP показал мне реальные проблемы, а попытка сделать «нормальную версию» только усугубила ситуациюРазработку пет-проекта с прицелом на open source в моем случае можно описать выражением: корабль любви разбился о айсберг бытовухи. Читать далее Read more

0

Habr
Sonia_Black @ Habr · 04/22/2026 09:56 EDT

785 статей. 26 доменов. Для агентов, не людей

Когда AI-агент пишет код в пустом проекте, первые 30-40% токенов он тратит на ориентацию — читает README, туториалы, API-reference. Ни один формат не отвечает на главный его вопрос: “какой паттерн скопировать и где грабли?”Вторая проблема глубже: LLM знает “всё на свете”, но распределено это неравномерно. Статей пятилетней давности в интернете больше, чем свежих — и агент по умолчанию тянет меня в прошлое, предлагая устаревшие рецепты. Каждый раз гонять deep research... Read more

0

Habr
ITFB_Group (ITFB Group) @ Habr · 04/22/2026 10:08 EDT

Как из факапа родился продукт: история EasyDoc

Привет, Хабр! Меня зовут Вадим Петросян, я директор по развитию бизнеса в ITFB Group. Почти десять лет я занимаюсь тем, что мы теперь называем Intelligent Document Processing (IDP). А началось всё с досадной подставы в договоре, которая влекла за собой большие расходы, но вместо этого подарила рынку одного из игроков в сфере OCR/IDP. Сегодня EasyDoc — это платформа №1 по версии CNews, работающая в крупнейших банках, пенсионных фондах и госорганах.... Read more

0

Habr
sea-team (R-Vision) @ Habr · 04/22/2026 10:30 EDT

CVE-2026-3502 в TrueConf: как доверенный механизм обновлений превратился в вектор атаки

Хабр, привет! На связи Алина Байрамова, аналитик-исследователь угроз кибербезопасности R-Vision.В этой статье я разберу уязвимость нулевого дня в TrueConf Server (CVE-2026-3502), связанную с механизмом обновлений, и то, как она может быть использована для компрометации изолированных инфраструктур через доверенный канал распространения ПО. Читать далее Read more

0

Habr
Qulisun @ Habr · 04/22/2026 10:27 EDT

Как устроен AI-агент изнутри

Представьте сцену. Вы пишете в терминал: «разберись, почему на main падает вот этот тест, и попробуй починить». Жмёте Enter. Спиннер крутится, подписи меняются — сначала “Pondering…”, потом зачем-то “Julienning…”, потом “Recombobulating…”. Через минуту агент прочитал логи CI, нашёл зафейлившийся тест, заглянул в связанный модуль, заметил, что кто-то криво подкрутил регекс, предложил правку, дождался вашего «да» — и коммитит. Пока вы наливаете чай, PR уже уехал на ревью.Выглядит как магия. На... Read more

0

Habr
handelsburo @ Habr · 04/22/2026 10:34 EDT

Мы наняли дипфейк: как фальшивый кандидат прошёл все этапы собеседования

Компаниям, выходящим на экспортные рынки, часто сложно найти менеджеров по продажам, владеющих иностранными языками. Одно из решений — привлекать иностранцев. Например, в странах Африки много молодых людей, которые, имея два родных языка, прекрасно владеют ещё и английским.Год назад я «с нуля» собирал отдел международных продаж. Требования к кандидатам были простыми: свободный английский, стрессоустойчивость, работоспособность и позитивный настрой. Отбор сделали многоэтапным.На вакансию откликнулась кандида Read more

0

Habr
VAS_Experts_Team (VAS Experts) @ Habr · 04/22/2026 10:33 EDT

Как мы собрали сеть мобильного оператора у себя в лаборатории и зачем нам это понадобилось

Привет!Эта статья о том, как собрать мобильного оператора «на столе» для тестов функциональности и взаимодействия компонентов ядра сети.Меня зовут Алексей Червяков, я тимлид команды разработки мобильных продуктов в компании VAS Experts, и мы разрабатываем компоненты ядра сети, которые осуществляют контроль трафика, его подсчет, применяют правила тарификации для абонентов. Корректная работа этих элементов – залог прибыли и отсутствия убытков из-за неоплаченных услуг и трафика.Приятного чтения! Читать далее Read more

0

Habr
Cloud4Y (Cloud4Y) @ Habr · 04/22/2026 10:38 EDT

[Перевод] Сравнение GPU NVIDIA: от V100 до B300

Одна ошибка в выборе GPU может стоить двукратной переплаты за каждую задачу — каждый день, пока вы не смените карту. Десять моделей NVIDIA, пять архитектур, разброс памяти от 24 до 288 ГБ. Разбираем, какая карта для чего создана и где рубль работает эффективнее всего. Читать далее Read more

0

Habr
Finam_Broker (Финам) @ Habr · 04/22/2026 10:40 EDT

Парадокс «кадрового голода» 2026: почему вакансий меньше, а работать некому?

Российская экономика вошла в зону турбулентности, столкнувшись с феноменом, который глава ЦБ Эльвира Набиуллина называет «новой реальностью». Речь идет о беспрецедентной нехватке рабочей силы. Однако за громким термином «кадровый голод» скрывается сложный механизм: бизнес не просто ищет людей, а учится выживать в условиях, когда экстенсивный рост штата стал невозможен. Согласно докладу «Региональная экономика» от ЦБ, компании всё чаще выбирают стратегию частичной занятости для оптимизации расходов, что форм Read more

0

Habr
cognitronn (BotHub) @ Habr · 04/22/2026 10:48 EDT

Топ-6 лучших бесплатных нейросетей для генерации и редактирования кода

Ещё пару лет назад «ИИ для кода» означало подсказку следующей строчки. Сегодня это агент, который сам открывает pull request, пока вы пьёте кофе.Гонка больше не про автодополнение. Она про автономное кодирование. Рынок AI-инструментов для разработчиков вырос до $12.8 млрд в 2026 году - с $5.1 млрд в 2024-м. В январе 2026 года 90% разработчиков регулярно использовали хотя бы один AI-инструмент на работе.Звучит как победа ИИ? Не торопитесь. Исследование METR показало:... Read more

0

Most popular sources

  • You see 875 news out of 875.
  • Sources 61 out of 61.
Financial Times 0%
AlleyWatch 0%
Mobile ID World 0%
Ubergizmo 0%
ReadWrite 0%
View sources »

LIKE us on Facebook so you won't miss the most important news of the day!

29.04.2026 09:53
Last update: 09:45 EDT.
News rating updated: 16:41.

What is Times42?

Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.


Times42 © 2026