11 place 0
Ошибка CUDA out of memory при обучении LLM обычно превращается в бесконечный цикл случайных правок: уменьшили batch size, урезали sequence length, снизили LoRA rank — и всё равно где-то снова падает. Особенно весело становится в RL-сценариях с GRPO, vLLM и генерацией нескольких ответов на один промпт. Поговорим о том, как перестать гадать и начать считать потребление GPU-памяти: от чтения самого текста ошибки до оценки вклада vLLM, активаций и параметров обучения. С формулами, реальными конфигами и объяснен
A newsletter a day!
You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.
LIKE us on Facebook so you won't miss the most important news of the day!
An East Bay apartment complex has been bought at a price that's well below its prior value. Read more ›
0
A PG&E Corp. unit has bought a San Jose building in a move to bolster the utility's South Bay operations. Read more ›
0
Europe has emerged as one of the world's leading centres for open-weight AI, with companies including Mistral, Black Forest Labs and Helsing contributing to a growing ecosystem focused on open models ... Read more ›
0 fresh
AleRunner writes: The first fully synthetic cell ("SpudCell") has been created in the Department of Genetics at the University of Minnesota. Strictly speaking, it's described as a "cell-like system constructed entirely from known chemical components that can perform a complete cell cycle." It is able to replicate, but only for approximately five generations. The key advance is that the cell is "built entirely bottom-up from individually purified, non-living components," although... Read more ›
0 newcommer
The Razer Iskur V2 NewGen gaming chair builds on an already decent seat by adding an impressive bunch of new features to help justify its premium price. Read more ›
0 newcommer
Cregger and Brian Duffield will co-write 'Siren Head,' based on the viral YouTube horror short. Read more ›
0 newcommer
Dark Cherry, Light Blue, and Silver-Gray could be the only iPhone 18 Pro colors, and black is once again absent from the lineup, according to the latest leak. Read more ›
0 newcommer
A new paper tries to show how 'gravastars' might mimic black holes without breaking relativity. Read more ›
0 newcommer
Samsung recently wiped its Instagram feeds, but now the company is posting again, teasing its upcoming foldables. The company is going hard on the “new shape” for Galaxy Z Fold 8, which will be the wide body foldable that we’ve seen already quite a few times. We have gone ahead and linked to a few... Read the original post: Samsung Begins Teasing ‘New Shape’ for Galaxy Z Fold 8 Read more ›
0 fresh
Elon Musk’s SpaceX has reportedly shown investors an early handset-like AI device prototype, though it is unclear whether it will become a product. Read more ›
0 newcommer
In an interview at the 2026 Cannes Lions Festival, Mark Kirkham, CMO at PepsiCo US, said simple ideas like the Pepsi Challenge are still effective. Read more ›
0 newcommer
Lara Balazs, CMO of Adobe, interviewed at the 2026 Cannes Lions, said CMOs need to disrupt themselves in response to constant change. Read more ›
0 fresh
Xbox may offer a way to preserve physical game purchases in an increasingly digital future. Read more ›
0 fresh
I hate to break this to you, but the US wireless carrier you subscribe to will not hesitate to remind you that your loyalty means nothing. They don’t care if you’ve been with them for 15 years, pay your bill on time, have multiple active lines, and regularly finance phones to lock you in for... Read the original post: Your Loyalty to Verizon and T-Mobile is Meaningless Read more ›
0 fresh
I am not a psychologist or a doctor, and this should not be taken as advice. The studies I mention are findings from particular groups of people, not settled science or universal rules about everyone, and nothing here is a substitute for talking to someone qualified about your own head. In the evening I often ... Read more Read more ›
0 fresh
The incident could disrupt a key part of the defense company’s rocket motor business, which designs and tests prototype motors for military customers. Read more ›
0 fresh
Financial data companies such as FactSet and Moody’s appear to have made progress reassuring investors that they won’t be replaced by finance-focused AI tools. But investors may have new questions these days around how the uncertainty of AI costs will affect usage of these businesses’ products.Investors were spooked when Anthropic and others touted AI products for finance and other professions earlier this year. Companies like FactSet, Moody’s, S&P Global and... Read more ›
0 fresh
Hyundai and Kia have unveiled an in-vehicle sanitization system that uses far-ultraviolet light to kill bacteria and viruses inside a car cabin, even while passengers are present. The technology, called Plasma Care UVC, is what the companies describe as the first system of its kind designed for production vehicles. Conventional ultraviolet sterilization poses a risk […] This story continues at The Next Web Read more ›
0 fresh
Microsoft is reportedly testing a feature to digitize physical games going back to the Xbox One with digital copies tied to the owner of the physical disc. Read more ›
0 fresh
Всем привет! Листал ленту тиктока и попался американский ролик про СДВГ, где всё объясняют на утках. Понравилось. И я подумал: классно было бы сделать такой же тикток, только на русском.Но я ленивый. Снимать, писать сценарии, делать всё с нуля - это скучно. А вот взять готовый ролик и перевести-переозвучить его на русский - вот это уже интересно, подумал я, а потом задумался, о том, как это автоматизировать. Это оказалось интересной... Read more ›
0
За последние годы я несколько раз видел одну и ту же картину в небольших и средних компаниях. Для приложений поднимают S3-совместимое хранилище. Для людей — отдельный файловый сервис или сетевые шары. LDAP/OIDC живёт отдельно. Бэкапы — третий контур. Мониторинг — четвёртый. Всё работает, пока не приходит внутренний аудит или новый филиал с формулировкой: «нам нужен корпоративный диск с SSO, журналом и данными только у нас». Читать далее Read more ›
0
Привет, Хабр!Сегодня я хочу поговорить об оптимизации. Но не о том, как ускорить ваш скрипт на Python или ужать базу данных. Давайте замахнемся на архитектуру повыше. Поговорим о том, как спроектирована наша реальность, если посмотреть на неё глазами хардкорного embedded-разработчика, у которого критически мало оперативной памяти, но бесконечная задача на выходе.Многие представляют Бога (или Архитектора Симуляции) как существо с безграничными вычислительными ресурсами, которое вручную рендерит каждый атом и Read more ›
0
Это вторая попытка опубликовать статью-туториал, целью которой является знакомство простых пользователей рунета погрузиться в автоматизацию своих рутинных задач. Одним из способов решения данной задачи является создание Telegram-ботов. Об этом далее, собственно, и пойдет речь. (Всё упоминаемое программное обеспечение в статье не является рекламой, а описывается исключтельно потому, что мы на практике успешно его применяем). Читать далее Read more ›
0
Несколько лет я занимаюсь продвижением организаций в Яндекс Картах и постоянно сталкиваюсь с одним и тем же недопониманием у владельцев бизнеса. Рейтинг воспринимают как среднее арифметическое оценок, а позицию в выдаче как прямое следствие рейтинга. Оба предположения неверны, и из-за них люди годами вкладываются не в то.Здесь разберу задачу с инженерной стороны, почему наивное среднее не работает в принципе, какими стандартными приёмами вообще решают задачу расчёта рейтингов, что из этого... Read more ›
0
Первая часть. Общие вопросы — https://habr.com/ru/articles/1047336/Вторая часть. Установка библиотеки и пример работы с ней — https://habr.com/ru/articles/1048882/В сегодняшней публикации планировалось просто сделать вторую часть учебной задачи, посвящённую загрузке файлов. Но так сложилось, что в библиотеке методы загрузки были только написаны, но ввиду отсутствия "боевого применения" на моих проектах не проверялись должным образом на практике. А проверки по ходу работы над учебным примером кода показали,. Read more ›
0
Сделать рекламный баннер с помощью нейросети сегодня пытается почти каждый, однако на практике этот процесс часто превращается в бесконечную борьбу с «галлюцинациями» моделей и безуспешные попытки добиться от них корректного текста. Еще относительно недавно мы воспринимали генеративный арт как любопытную игрушку, а сегодня это уже полноценный рабочий инструмент, который либо кардинально сокращает время на прототипирование, либо заставляет часами исправлять артефакты, пытаясь «причесать» результат под станда Read more ›
0
Если вы хоть раз пытались сделать печатную плату сложнее «мигалки на светодиоде», вы знаете цену «геометрического ада».ЛУТ (лазерно-утюжная технология) — это лотерея. Классический фотометод требует идеального шаблона, а профессиональный фотоплоттер стоит как подержанный автомобиль. Казалось бы, решение на поверхности: взять доступный китайский лазерный гравер за $100 и вперёд. Но тут начинается новый «ад»: оси изначально кривые, реальный шаг моторов живёт своей жизнью, а заготовка почти всегда лежит на стол Read more ›
0
Hola, Amigos! На связи Павел Гершевич, Mobile Team Lead агентства продуктовой разработки Amiga. Мы с командой подготовили для вас перевод статьи о том, как можно кастомизировать иконку приложения динамически. Всем приятного чтения! Читать далее Read more ›
0
48 тысяч новых уязвимостей за год, по 130+ в день. Закрыть все невозможно - значит, нужен процесс. Сейчас разберемся, что такое уязвимости и эксплойты, зачем их устранять, где искать в первую очередь и из каких пяти этапов складывается работающий VM. С глоссарием, к которому будем возвращаться всю серию. Читать далее Read more ›
0
Most popular sources
|
|
0% |
|
|
0% |
|
|
0% |
|
|
0% |
|
|
0% |
| View sources » | |
LIKE us on Facebook so you won't miss the most important news of the day!
01.07.2026 16:15
Last update: 16:12 EDT.
News rating updated: 23:13.
What is Times42?
Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.