11 place 0

815 [Перевод] Нехватка CUDA-памяти при обучении с GRPO: как перестать гадать и начать считать

Habr
kmoseenk (OTUS) @ Habr · 05/21/2026 07:22 EDT

[Перевод] Нехватка CUDA-памяти при обучении с GRPO: как перестать гадать и начать считать

Ошибка CUDA out of memory при обучении LLM обычно превращается в бесконечный цикл случайных правок: уменьшили batch size, урезали sequence length, снизили LoRA rank — и всё равно где-то снова падает. Особенно весело становится в RL-сценариях с GRPO, vLLM и генерацией нескольких ответов на один промпт. Поговорим о том, как перестать гадать и начать считать потребление GPU-памяти: от чтения самого текста ошибки до оценки вклада vLLM, активаций и параметров обучения. С формулами, реальными конфигами и объяснен

To see detailed statistics for the news please log in »

Read the original

Add your comment
You must be logged in with Facebook to read and write comments.

A newsletter a day!

You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.

or register

LIKE us on Facebook so you won't miss the most important news of the day!

News from the same source
Habr Habr
Silicon Valley
George Avalos @ Silicon Valley 1 place · 02/07/2106 01:28 EDT

Newark apartment complex bought for much less than prior value

An East Bay apartment complex has been bought at a price that's well below its prior value. Read more

0

🔮
01.07.2026 ♑︎ Dear Capricorn, today awaits you an amazing day filled with bright emotions and opportunities for... Read more ›
Silicon Valley
George Avalos @ Silicon Valley 2 place · 02/07/2106 01:28 EDT

PG&E buys San Jose building to bolster South Bay operations

A PG&E Corp. unit has bought a San Jose building in a move to bolster the utility's South Bay operations. Read more

0

Tech.eu
Cate Lawrence @ Tech.eu 1 place · 07/03/2026 05:36 EDT

Pytorch: the software layer underpinning Europe's AI ambitions

Europe has emerged as one of the world's leading centres for open-weight AI, with companies including Mistral, Black Forest Labs and Helsing contributing to a growing ecosystem focused on open models ... Read more

0 fresh

Slashdot
BeauHD @ Slashdot 1 place · today 16:00 EDT

Scientists Made a Cell From Scratch For First Time

AleRunner writes: The first fully synthetic cell ("SpudCell") has been created in the Department of Genetics at the University of Minnesota. Strictly speaking, it's described as a "cell-like system constructed entirely from known chemical components that can perform a complete cell cycle." It is able to replicate, but only for approximately five generations. The key advance is that the cell is "built entirely bottom-up from individually purified, non-living components," although... Read more

0 newcommer

TechRadar
TechRadar 1 place · today 16:00 EDT

The Razer Iskur V2 NewGen gaming chair shows that for premium comfort you really do have to pay a premium price

The Razer Iskur V2 NewGen gaming chair builds on an already decent seat by adding an impressive bunch of new features to help justify its premium price. Read more

0 newcommer

Gizmodo
Germain Lussier @ Gizmodo 1 place · today 16:00 EDT

Zach Cregger to Write What Could Potentially Be the Next ‘Backrooms’

Cregger and Brian Duffield will co-write 'Siren Head,' based on the viral YouTube horror short. Read more

0 newcommer

Digital Trends
Shikhar Mehrotra @ Digital Trends 1 place · today 15:58 EDT

The iPhone 18 Pro could launch in these three colors, and black still isn’t one of them

Dark Cherry, Light Blue, and Silver-Gray could be the only iPhone 18 Pro colors, and black is once again absent from the lineup, according to the latest leak. Read more

0 newcommer

Gizmodo
Gayoung Lee @ Gizmodo 2 place · today 15:55 EDT

Physicists Devise Black Hole Alternative With a ‘Mini Universe’ at Its Center

A new paper tries to show how 'gravastars' might mimic black holes without breaking relativity. Read more

0 newcommer

Droid Life
Tim @ Droid Life 1 place · today 15:55 EDT

Samsung Begins Teasing ‘New Shape’ for Galaxy Z Fold 8

Samsung recently wiped its Instagram feeds, but now the company is posting again, teasing its upcoming foldables. The company is going hard on the “new shape” for Galaxy Z Fold 8, which will be the wide body foldable that we’ve seen already quite a few times. We have gone ahead and linked to a few... Read the original post: Samsung Begins Teasing ‘New Shape’ for Galaxy Z Fold 8 Read more

0 fresh

Digital Trends
Sudhanshu Kumar Mangalam @ Digital Trends 2 place · today 15:53 EDT

Elon Musk’s SpaceX could be making an AI device that’s slimmer than iPhone

Elon Musk’s SpaceX has reportedly shown investors an early handset-like AI device prototype, though it is unclear whether it will become a product. Read more

0 newcommer

Business Insider
Julia Hood @ Business Insider 1 place · today 15:53 EDT

PepsiCo's Mark Kirkham says making the "simple special" drives results

In an interview at the 2026 Cannes Lions Festival, Mark Kirkham, CMO at PepsiCo US, said simple ideas like the Pepsi Challenge are still effective. Read more

0 newcommer

Business Insider
Julia Hood @ Business Insider 2 place · today 15:52 EDT

CMOs today need to disrupt themselves, says Adobe's top marketer Lara Balazs

Lara Balazs, CMO of Adobe, interviewed at the 2026 Cannes Lions, said CMOs need to disrupt themselves in response to constant change. Read more

0 fresh

Droid Life
Kellen @ Droid Life 2 place · today 15:48 EDT

Your Loyalty to Verizon and T-Mobile is Meaningless

I hate to break this to you, but the US wireless carrier you subscribe to will not hesitate to remind you that your loyalty means nothing. They don’t care if you’ve been with them for 15 years, pay your bill on time, have multiple active lines, and regularly finance phones to lock you in for... Read the original post: Your Loyalty to Verizon and T-Mobile is Meaningless Read more

0 fresh

Silicon Canals
Mal James @ Silicon Canals 1 place · today 15:30 EDT

The lost art of being unreachable (and how to get a little of it back)

I am not a psychologist or a doctor, and this should not be taken as advice. The studies I mention are findings from particular groups of people, not settled science or universal rules about everyone, and nothing here is a substitute for talking to someone qualified about your own head. In the evening I often ... Read more Read more

0 fresh

Wired
Paresh Dave @ Wired 1 place · today 15:29 EDT

An Explosion Knocked Out Anduril’s Rocket Motor Test Site in Mississippi

The incident could disrupt a key part of the defense company’s rocket motor business, which designs and tests prototype motors for military customers. Read more

0 fresh

The Information
Meredith Mazzilli @ The Information 1 place · today 15:28 EDT

Financial data companies such as FactSet and Moody’s appear to have made progress reassuring investors that they won’t be replaced by finance-focused AI tools. But investors may have new questions these days around how the uncertainty of AI costs will affect usage of these businesses’ products.Investors were spooked when Anthropic and others touted AI products for finance and other professions earlier this year. Companies like FactSet, Moody’s, S&P Global and... Read more

0 fresh

The Next Web
Darius Popa @ The Next Web 1 place · today 15:26 EDT

Hyundai and Kia have unveiled an in-vehicle sanitization system that uses far-ultraviolet light to kill bacteria and viruses inside a car cabin, even while passengers are present. The technology, called Plasma Care UVC, is what the companies describe as the first system of its kind designed for production vehicles. Conventional ultraviolet sterilization poses a risk […] This story continues at The Next Web Read more

0 fresh

The most popular news from the same source for the last week
Habr Habr
Habr
timonin @ Habr · 06/24/2026 16:21 EDT

Как утки с СДВГ довели меня до опенсорса: зачем я собрал утилиту для перевода коротких видео на домашней видеокарте

Всем привет! Листал ленту тиктока и попался американский ролик про СДВГ, где всё объясняют на утках. Понравилось. И я подумал: классно было бы сделать такой же тикток, только на русском.Но я ленивый. Снимать, писать сценарии, делать всё с нуля - это скучно. А вот взять готовый ролик и перевести-переозвучить его на русский - вот это уже интересно, подумал я, а потом задумался, о том, как это автоматизировать. Это оказалось интересной... Read more

0

Habr
ToomIm @ Habr · 06/24/2026 16:26 EDT

DataSafeS3: self-hosted S3 с LDAP, аудитом и «Мои файлы» — честный разбор до релиза

За последние годы я несколько раз видел одну и ту же картину в небольших и средних компаниях. Для приложений поднимают S3-совместимое хранилище. Для людей — отдельный файловый сервис или сетевые шары. LDAP/OIDC живёт отдельно. Бэкапы — третий контур. Мониторинг — четвёртый. Всё работает, пока не приходит внутренний аудит или новый филиал с формулировкой: «нам нужен корпоративный диск с SSO, журналом и данными только у нас». Читать далее Read more

0

Habr
VitalyDeCoder @ Habr · 06/24/2026 16:35 EDT

Операционная Система Вселенной

Привет, Хабр!Сегодня я хочу поговорить об оптимизации. Но не о том, как ускорить ваш скрипт на Python или ужать базу данных. Давайте замахнемся на архитектуру повыше. Поговорим о том, как спроектирована наша реальность, если посмотреть на неё глазами хардкорного embedded-разработчика, у которого критически мало оперативной памяти, но бесконечная задача на выходе.Многие представляют Бога (или Архитектора Симуляции) как существо с безграничными вычислительными ресурсами, которое вручную рендерит каждый атом и Read more

0

Habr
RedBuilder81 @ Habr · 06/24/2026 16:40 EDT

Как собрать Telegram-бот обеспечения круглосуточной ситуационной осведомленности с нуля

Это вторая попытка опубликовать статью-туториал, целью которой является знакомство простых пользователей рунета погрузиться в автоматизацию своих рутинных задач. Одним из способов решения данной задачи является создание Telegram-ботов. Об этом далее, собственно, и пойдет речь. (Всё упоминаемое программное обеспечение в статье не является рекламой, а описывается исключтельно потому, что мы на практике успешно его применяем). Читать далее Read more

0

Habr
alexntr @ Habr · 06/24/2026 17:36 EDT

Как считается рейтинг в Яндекс Картах и почему это не среднее арифметическое

Несколько лет я занимаюсь продвижением организаций в Яндекс Картах и постоянно сталкиваюсь с одним и тем же недопониманием у владельцев бизнеса. Рейтинг воспринимают как среднее арифметическое оценок, а позицию в выдаче как прямое следствие рейтинга. Оба предположения неверны, и из-за них люди годами вкладываются не в то.Здесь разберу задачу с инженерной стороны, почему наивное среднее не работает в принципе, какими стандартными приёмами вообще решают задачу расчёта рейтингов, что из этого... Read more

0

Habr
lubezniy @ Habr · 06/24/2026 18:39 EDT

Практическое махоботоводство в 2026 году. Часть 3: подробно про загрузку файлов

Первая часть. Общие вопросы — https://habr.com/ru/articles/1047336/Вторая часть. Установка библиотеки и пример работы с ней — https://habr.com/ru/articles/1048882/В сегодняшней публикации планировалось просто сделать вторую часть учебной задачи, посвящённую загрузке файлов. Но так сложилось, что в библиотеке методы загрузки были только написаны, но ввиду отсутствия "боевого применения" на моих проектах не проверялись должным образом на практике. А проверки по ходу работы над учебным примером кода показали,. Read more

0

Habr
alexlptk (StudyAI) @ Habr · 06/24/2026 18:57 EDT

Как создать рекламный баннер с помощью нейросети — Сравниваем ТОП-6 ИИ для баннеров

Сделать рекламный баннер с помощью нейросети сегодня пытается почти каждый, однако на практике этот процесс часто превращается в бесконечную борьбу с «галлюцинациями» моделей и безуспешные попытки добиться от них корректного текста. Еще относительно недавно мы воспринимали генеративный арт как любопытную игрушку, а сегодня это уже полноценный рабочий инструмент, который либо кардинально сокращает время на прототипирование, либо заставляет часами исправлять артефакты, пытаясь «причесать» результат под станда Read more

0

Habr
FantasyDD @ Habr · 06/24/2026 20:03 EDT

Мы не выравниваем железо — мы выравниваем реальность: как превратить любой лазерный гравер в прецизионный фотоплоттер

Если вы хоть раз пытались сделать печатную плату сложнее «мигалки на светодиоде», вы знаете цену «геометрического ада».ЛУТ (лазерно-утюжная технология) — это лотерея. Классический фотометод требует идеального шаблона, а профессиональный фотоплоттер стоит как подержанный автомобиль. Казалось бы, решение на поверхности: взять доступный китайский лазерный гравер за $100 и вперёд. Но тут начинается новый «ад»: оси изначально кривые, реальный шаг моторов живёт своей жизнью, а заготовка почти всегда лежит на стол Read more

0

Habr
fognature1 @ Habr · 06/24/2026 22:30 EDT

[Перевод] Динамические иконки приложения на Flutter: подробная инструкция для ручного выбора и обновлений по воздуху

Hola, Amigos! На связи Павел Гершевич, Mobile Team Lead агентства продуктовой разработки Amiga. Мы с командой подготовили для вас перевод статьи о том, как можно кастомизировать иконку приложения динамически. Всем приятного чтения! Читать далее Read more

0

Habr
Hima_Hahahai @ Habr · 06/25/2026 01:30 EDT

Управление уязвимостями с нуля: что это, зачем и из каких этапов состоит

48 тысяч новых уязвимостей за год, по 130+ в день. Закрыть все невозможно - значит, нужен процесс. Сейчас разберемся, что такое уязвимости и эксплойты, зачем их устранять, где искать в первую очередь и из каких пяти этапов складывается работающий VM. С глоссарием, к которому будем возвращаться всю серию. Читать далее Read more

0

Most popular sources

  • You see 905 news out of 905.
  • Sources 61 out of 61.
MacRumors 0%
ScienceDaily 0%
Startup News 0%
Tech Wire Asia 0%
Irish Tech News 0%
View sources »

LIKE us on Facebook so you won't miss the most important news of the day!

01.07.2026 16:15
Last update: 16:12 EDT.
News rating updated: 23:13.

What is Times42?

Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.


Times42 © 2026