430 place 0

927 Как сжимать языковые модели без дообучения

Habr
madrugado (МТС, MWS AI) @ Habr · 12/02/2025 08:00 EDT

Как сжимать языковые модели без дообучения

Привет, Хабр! Меня зовут Валентин Малых, я - и.о. руководителя направления фундаментальных исследований в MWS AI. Сегодня я расскажу об одном нашем исследовании по сжатию LLM. Если простыми словами, то это про то, как сделать большую модель чуть-чуть менее требовательной в плане памяти и времени выполнения. Для это придумано три базовых техники: квантизация (загрубление весов модели), дистилляция (обучение уменьшенной копии) и прунинг (удаление части сети). Этот пост как раз будет про третий способ, точнее.

To see detailed statistics for the news please log in »

Read the original

Add your comment
You must be logged in with Facebook to read and write comments.

A newsletter a day!

You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.

or register

LIKE us on Facebook so you won't miss the most important news of the day!

News from the same source
Habr Habr
Silicon Valley
George Avalos @ Silicon Valley 1 place · 02/07/2106 01:28 EDT

Newark apartment complex bought for much less than prior value

An East Bay apartment complex has been bought at a price that's well below its prior value. Read more

0

🔮
10.05.2026 ♑︎ Dear Capricorns! Today promises to be bright and emotionally intense. Your love radiates more than... Read more ›
Silicon Valley
George Avalos @ Silicon Valley 2 place · 02/07/2106 01:28 EDT

PG&E buys San Jose building to bolster South Bay operations

A PG&E Corp. unit has bought a San Jose building in a move to bolster the utility's South Bay operations. Read more

0

SlashGear
SlashGear 1 place · today 09:45 EDT

This Self-Repairing Material Could Let Cars & Planes Last For Centuries

There's a breakthrough in the fight against waste: a self-repairing material that scientists claim has a usable lifespan of more than 100 years. Read more

0 newcommer

Habr
ne_sergo @ Habr 1 place · today 09:43 EDT

Мониторинг error.log Xray: что такое XrayPulse и чем это может пригодиться

У кого на сервере крутится Xray, рано или поздно сталкивается с ошибками вerror.log: обрывы, таймауты, несовпадение SNI, исчерпанные попытки переподключения и прочая диагностика. Смотреть «хвостом» в консоли можно, но это плохо масштабируется: хочется понимать причины, динамику, кто к нам ломится — и желательно без тяжёлого стека вроде ELK на домашней VPS.Я собрал XrayPulse — небольшой дашборд под эту задачу и залил на github, чтобы ими могли воспользоваться другие. В статье... Read more

0 newcommer

Business Insider
Jayme Serbell @ Business Insider 1 place · today 09:35 EDT

I've lived in a van and an off-grid home. Both lifestyles had pros and cons, but neither fits our needs right now.

My partner and I lived in a van and then on a remote, off-grid property before moving to a city. Both lifestyles had unique benefits and downsides. Read more

0 fresh

Business Insider
James LaForge @ Business Insider 2 place · today 09:32 EDT

18 of the best major companies in the US for maternity leave

Maternity leave varies widely across US companies. See some of the best policies among the 500 largest US companies, based on transparency and length of leave. Read more

0 fresh

Habr
Catx2 @ Habr 2 place · today 09:30 EDT

Беспилотные рабочие Чернобыля

Сегодня беспилотником, будь он наземный, плавающий и тем более летающий, никого не удивить. А вот в 1986-ом, когда случилась авария на ЧАЭС, дроны были многим в диковинку и работали они в основном в космосе и в разведке. Сложность ликвидации катастрофы заставили советское руководство обратить своё внимание на НРТК — наземные робототехнические комплексы. Они более устойчивы для радиации, чем люди, могут работать на износ в режиме камикадзе и банально могут тащить... Read more

0 fresh

Habr
MichaelBorisov @ Habr 3 place · today 09:28 EDT

Канал сброса: новый инструмент угнетения

Второе начало термодинамики гласит: энтропия замкнутой системы не убывает. Любой сложный порядок — будь то живая клетка или работающий двигатель — это локально пониженная энтропия. Чтобы поддерживать такой порядок, его нельзя просто «сохранять»: необратимые процессы деградации идут постоянно и самопроизвольно. Порядок требует непрерывного восстановления.Но восстановление порядка означает локальное уменьшение энтропии — а это возможно лишь в том случае, если система открыта: избыточная энтропия сбрасывается. Read more

0 fresh

Habr
maraty (МТС) @ Habr · today 09:20 EDT

Снятся ли искусственному интеллекту цифровые овцы?

Когда-то в далеком 1968 году Филип К. Дик задавался вопросом: «Мечтают ли андроиды об электрических овцах?» Способны ли машины переживать, желать и видеть сны? Хоть сегодняшние «андроиды» и несколько иные, чем в произведении, вопрос до сих остается актуальным. Только слегка сместился фокус: не «мечтают ли», а «снятся ли им цифровые овцы»? Существует ли у нейросетей аналог фазы медленного сна, перерабатывают ли они данные «во сне» и, главное, способны ли «видеть... Read more

0 fresh

Habr
nefrit0n @ Habr · today 09:16 EDT

ASOC на коленке: как я навайбкодил замену DefectDojo для своих задач с обогащением из БДУ ФСТЭК

Когда я начал разбираться, чем в open source можно закрыть задачу ASOC / Vulnerability Management, выбор оказался довольно грустным. По сути единственный известный вариант это DefectDojo. Сам я его в production не тащил, но от коллег регулярно слышал одну и ту же боль: на больших объёмах findings он начинает захлёбываться, в UI быстро не хочется заходить, а аналогов с человеческим интерфейсом и БДУ ФСТЭК «из коробки» в open source я... Read more

0 fresh

Business Insider
Susie Shaw @ Business Insider 3 place · today 09:12 EDT

I spend Mother's Day at my son's grave. It's the only place I feel like a whole family.

When my son died, my understanding of motherhood changed. Now, I spend Mother's Day at his grave. It's the only place I feel like a whole family. Read more

0 fresh

Habr
Guren302 (RUVDS.com) @ Habr · today 09:01 EDT

Японцы в ярости от пиратства: как разница в менталитете породила один из самых горячих споров года

Совсем недавно Илон Маск ввёл в бывшем «Твиттере» автоматический перевод твитов. Намерение благое, но кажется, что мир не готов был к такому повороту событий: оказывается, нынешнее поколение японцев вообще не готово к пиратству и крайне осуждают его. Правда, делают они это в весьма комичной форме. Но почему сложилось так, что японцы негативно относятся к пиратству, в то время как на Западе — совсем иное отношение к данному феномену? Читать далее Read more

0 fresh

Gizmodo
Wes Davis @ Gizmodo 1 place · today 09:00 EDT

Govee Ceiling Light Ultra Review: AI Art Ain’t It

A fun novelty that’s marred by better competition and a price that’s simply too high. Read more

0 fresh

CoinDesk
Oliver Knight @ CoinDesk 1 place · today 09:00 EDT

Bored Ape NFTs are finally making a comeback as crypto traders rediscover their appetite for risk

BAYC floor prices have doubled in a month as traders rotate back into speculative crypto bets, reviving hopes of a broader NFT recovery. Read more

0 fresh

TechRadar
TechRadar 2 place · today 09:00 EDT

What is the release date for The Testaments episode 8 on Hulu and Disney+?

Daisy is fighting for her life... and for her truth to stay concealed in Gilead. But when does The Testaments episode 8 drop on Hulu and Disney+? Read more

0 fresh

Tom's Hardware
Tom's Hardware 2 place · today 09:00 EDT

3DMakerPro Toucan 3D Scanner review: All-in-one 3D scanning

Designed to be used as a standalone device, the 3DMakerPro Toucan allows users to capture a point cloud, generate a 3D model, and export it without using a computer. The hardware has a premium feel, and the Class 3R laser can create detailed point clouds quickly. However, the software lacks polish and has some quirks. Tracking loss, inconsistent export via Wi-Fi, and blurry color textures are all issues that occurred... Read more

0 fresh

The most popular news from the same source for the last week
Habr Habr
Habr
monobogdan (Timeweb Cloud) @ Habr · 05/03/2026 10:05 EDT

Sony CMD-J7: шедевр инженерной мысли из 2001'ого

В прошлой статье мы с вами полностью разобрали схемотехнику и изучили компонентную базу легендарного телефона из 90-х годов - Motorola StarTAC. Девайс 1997 года отличался очень низким уровнем интеграции: даже такие базовые вещи, как модем (бейсбенд), DSP и RF-фронтэнд представляли из себя отдельные модули на плате. Однако уже через год, в 1998 году, Motorola представила StarTAC, где наконец объединила DSP, аудиокодек и процессор в единый кристалл.Казалось бы, вот оно чудо... Read more

0

Habr
Burunduk_House @ Habr · 05/03/2026 10:16 EDT

Удаленное управление стройкой за 3 500 км: нулевой цикл, смета и ошибки планирования

Я готовил участок под модульный дом в тайге, находясь за 3 500 км от объекта. Нулевой цикл занял четыре месяца и стоил около 2,8 млн ₽ еще до первого фундаментного блока. В статье разбираю, как искал землю, делал топосъемку, подводил электричество, организовывал подъезд и контролировал подрядчиков удалённо – с цифрами, ошибками и выводами по планированию. Меня зовут Самир. Я не строитель и не инженер, а маркетолог, поэтому подходил к стройке... Read more

0

Habr
grokfrog @ Habr · 05/03/2026 10:46 EDT

Как я написал E2EE-мессенджер на Spring Boot и WebCrypto — и почему сервер не видит сообщения

Привет, Хабр.Я Java-разработчик и в основном работаю с backend: Spring Boot, базы данных, интеграции, авторизация, WebSocket — всё то, что обычно находится за интерфейсом.В какой-то момент я поймал себя на мысли: я каждый день пользуюсь мессенджерами, но плохо понимаю, как они устроены внутри. Окей, JWT, WebSocket, PostgreSQL, Redis — это понятно. Но что технически означает фраза “end-to-end encryption”? Как сервер доставляет сообщения, если он не должен их читать? Где живут... Read more

0

Habr
Squirrelkate (Positive Technologies) @ Habr · 05/03/2026 11:19 EDT

[Перевод] Как определить, что текст был создан с помощью ИИ. Гибридный лингвистический подход

Я работаю в PR с 2001 года. Тогда профессия пиарщика активно развивалась, на рынке было много политтехнологов и консультантов. За 25 лет профессия сильно трансформировалась, в том числе и по части подготовки контента в различных форматах. И если раньше мы по крупицам собирали информацию и превращали ее в разные материалы, то сегодня контент создается намного быстрее. Каждый раз читаешь новую статью с мыслью: а уникальный ли это контент? Написано самостоятельно,... Read more

0

Habr
ASabramova @ Habr · 05/03/2026 11:20 EDT

Что если причина, по которой не растут продажи, находится совсем не там, где вы ищете?

Почему Фрейд и квантовая механика объясняют бизнес-решения лучше, чем большинство MBA-курсовЯ пришла в психоанализ из топ-менеджмента в IT. Последние 4 года я развиваюсь в психоанализе: как в частной практике, так и в B2B. Я практик до мозга костей и поэтому все получаемые знания сразу переношу на понятные мне бизнес-структуры. И чем дольше я работаю на стыке этих двух миров, тем отчётливее вижу одно и то же: когда бизнес буксует, он... Read more

0

Habr
invaice @ Habr · 05/03/2026 11:45 EDT

Монорепозиторий — стрем или норм?

Наверное, у каждого разработчика был момент, когда бизнеса в жизни становится слишком много. Слишком много хотелок. Слишком короткие сроки. Слишком мало времени подумать.И в этот момент код перестаёт быть инженерной задачей. Он превращается в бесконечное тушение пожаров.Требования меняются быстрее, чем ты успеваешь их осмыслить. Приоритеты «на вчера». Технический долг растет не потому, что вы плохие разработчики, а потому что у вас просто нет времени быть аккуратными. Читать далее Read more

0

Habr
gliderman @ Habr · 05/03/2026 11:48 EDT

Как за 300 рублей и 6 часов получить прошивку уровня синьора?

Полгода прошло с первой статьи https://habr.com/ru/articles/969230/ , вариометр летает и сигнализирует о наборе высоты и о потере высоты, пилоты довольны. Код сыроват конечно. EMA фильтр стоит, линейная архитектура стоит, записи высот в полете нет и экспорта нет. Как-то работает. Но можно качественнее сделать. А вот когда лень переписывать с нуля, знакомая херня? Но решился.Развернул Hermes Agent, закинул на аккаунт DeepSeek4 40 юаней, это 430 рублей, и начал диалог в терминал.... Read more

0

Habr
vadimbydanov @ Habr · 05/03/2026 12:15 EDT

От Infinispan до Postgres на 1 ТБ: эволюция кэша поиска отелей

Всем привет! Хочу рассказать, как мы проектировали кэш поиска отелей и почему за полтора года прошли путь от Infinispan к managed Redis а затем к Postgres. По стеку java-21, spring-boot-3, 1 вендор отелей, расчетная нагрузка 1000 RPS и 10M запросов в сутки. Читать далее Read more

0

Habr
Ungated @ Habr · 05/03/2026 12:11 EDT

Как устроен Meshtastic, зачем он нужен и как я подключил его к локальной модели на ноутбуке

Практический эксперимент с Meshtastic: две Heltec ESP32 LoRa 32 V4, связь на 702 м в городской среде, разбор LoRa-настроек, ролей нод, MQTT и Python-мост к локальной LLM через Ollama. Читать далее Read more

0

Habr
IASIVAn @ Habr · 05/03/2026 12:42 EDT

Бесплатное восстановление информации из OST файла Outlook

Да, есть много платных приложений и сервисов, которые сделают всё красиво.Но этот ручной способ выручит, когда покупать или пиратить недопустимо. Например в организациях. Читать далее Read more

0

Most popular sources

  • You see 328 news out of 328.
  • Sources 61 out of 61.
MacRumors 0%
The Information 0%
Irish Tech News 0%
Ubergizmo 0%
VentureBeat 0%
View sources »

LIKE us on Facebook so you won't miss the most important news of the day!

10.05.2026 10:09
Last update: 10:01 EDT.
News rating updated: 17:03.

What is Times42?

Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.


Times42 © 2026