10 place 0

796 ruGPT3XL идёт в качалку / поднимаем контекст до 8k

Habr
efreelancer @ Habr · 04/02/2026 06:24 EDT

ruGPT3XL идёт в качалку / поднимаем контекст до 8k

Это продолжение предыдущей публикации про реставрацию ruGPT3XL. Для тех кто не читал, кратенько, я конвертировал древний Megatron-LM чекпоинт в HuggingFace-формат, залил веса на HF, накатил поддержку GGUF в llama.cpp и подумал, что всё. Но нет.По ходу тестов, проведённых разными людьми удалось выявить ряд недоработок, которые я по мере обнаружения правил, ну а после того, как удалось получить стабильную и рабочую версию мне захотелось решить одну старую проблему, которая меня в ruGPT3 моделях очень беспокои

To see detailed statistics for the news please log in »

Read the original

Add your comment
You must be logged in with Facebook to read and write comments.

A newsletter a day!

You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.

or register

LIKE us on Facebook so you won't miss the most important news of the day!

News from the same source
Habr Habr
Silicon Valley
George Avalos @ Silicon Valley 1 place · 02/07/2106 01:28 EDT

Newark apartment complex bought for much less than prior value

An East Bay apartment complex has been bought at a price that's well below its prior value. Read more

0

🔮
01.06.2026 ♐︎ Dear Sagittarius, today will bring a mix of various emotions and challenges, but stay positive... Read more ›
Silicon Valley
George Avalos @ Silicon Valley 2 place · 02/07/2106 01:28 EDT

PG&E buys San Jose building to bolster South Bay operations

A PG&E Corp. unit has bought a San Jose building in a move to bolster the utility's South Bay operations. Read more

0

Business Insider
Rya Jetha @ Business Insider 1 place · today 20:19 EDT

Silicon Valley's new slogan: Let's get physical

Silicon Valley's AI boom is moving into robotics as OpenAI, Meta, Tesla, and startups race to give AI a body. Read more

0 newcommer

Tom's Hardware
Tom's Hardware 1 place · today 20:00 EDT

AMD Radeon RX 9070 GRE review: thoroughly midrange

AMD's $549 Radeon RX 9070 GRE offers strong high-refresh-rate 1080p and 1440p gaming performance as it launches globally at Computex 2026. But a lower price tag could have truly changed the midrange game. Read more

0 newcommer

CNET
Corin Cesaric-Epple @ CNET 2 place · today 20:00 EDT

Do Eggs Expire? Here's How Long They Actually Stay Fresh

The best-by date can be a helpful guideline, but it's not the full story. Read more

0 newcommer

Gizmodo
Kyle Barr @ Gizmodo 1 place · today 20:00 EDT

AMD’s RX 9070 GRE Graphics Card Is a Compromise No Matter How You Slice It

With GPUs in limited supply, AMD is relying on a cut-down graphics card to take up the slack. Read more

0 fresh

CNET
Gael Cooper @ CNET 3 place · today 19:51 EDT

Today's NYT Connections: Sports Edition Hints and Answers for June 2, #617

Here are hints and the answers for the NYT Connections: Sports Edition puzzle for June 2, No. 617. Read more

0 newcommer

CNET
Antuan Goodwin @ CNET · today 19:46 EDT

Electrify America Shifts From Prepaid Accounts to Direct Card Payments

The EV charging network is ditching its top-up model in favor of pay-per-session billing, a change that should make occasional charging a lot less complicated. Read more

0 newcommer

CNET
Gael Cooper @ CNET · today 19:44 EDT

Today's NYT Strands Hints, Answers and Help for June 2 #821

Here are hints and answers for the NYT Strands puzzle for June 2 No. 821. Read more

0 newcommer

MacRumors
Juli Clover @ MacRumors 1 place · today 19:25 EDT

iOS 27: What We Know About the New Siri App

iOS 27, iPadOS 27, and macOS 27 will include a standalone Siri app for the first time, providing a dedicated space for interfacing with ‌Siri‌. Siri Chatbot Apple needs a ‌Siri‌ app because ‌Siri‌ is turning into a chatbot. ‌Siri‌ will work like ChatGPT or Claude, able to pull information from the web to provide answers to questions. ‌Siri‌ will be integrated into iOS, iPadOS, and macOS at the system... Read more

0 fresh

CNET
Jon Reed @ CNET · today 19:16 EDT

Anthropic Eyes an IPO as Big Tech's AI Cash Crunch Comes for Wall Street

The Claude developer is one of a trio of tech firms expected to go public this year, alongside SpaceX and OpenAI. Read more

0 fresh

SlashGear
SlashGear 1 place · today 19:15 EDT

Five EVs That Depreciate Over 60% In 5 Years

EVs don't hold their value well, but some EVs fare significantly worse than others in this metric, losing more than 60% of their value in just five years. Read more

0 fresh

GSMArena.com
GSMArena.com 1 place · today 19:12 EDT

Samsung's Galaxy Z Fold8 wide foldable spotted in the wild

Samsung is expected to launch its next foldables in July. Recent leaks suggest that the rumored wide-screen foldable could be called the Galaxy Z Fold8, while the Galaxy Z Fold7 successor may be known as the Galaxy Z Fold8 Ultra. Ahead of anything official, the wide-screen foldable has been spotted in real-world images. Images of the alleged wide-screen Galaxy Z Fold8 have surfaced online courtesy of a user on South... Read more

0 fresh

The Information
Erin Woo @ The Information 1 place · today 19:03 EDT

Google parent company Alphabet announced plans to sell new stock for the first time since 2005, aiming to raise $80 billion in equity to spend on AI infrastructure and compute. As part of the plans, announced Monday, Berkshire Hathaway has agreed to purchase $10 billion in stock at a discount to ... Read more

0 fresh

Habr
tarielx @ Habr 1 place · today 19:03 EDT

Субъективный обзор федеративных мессенджеров

Привет!Представим ситуацию, сейчас, в 2026 году, вам потребовался способ звонить родственникам, слать нюдсы горячо любимой жене (в целях повышения демографии, конечно же) и обсуждать в коллективных чатах с друзьями планы на лето. Либо, наоборот, нужен способ общения в небольшой компании. Не все доступные мессенджеры решают эти задачи идеально.Здесь, на Хабре, уже было несколько инструкций о том, как настроить свой Jabber, Matrix сервер, было описание Delta Chat. Эта статья не претендует... Read more

0 fresh

TechRadar
TechRadar 2 place · today 19:00 EDT

Quordle hints and answers for Tuesday, June 2 (game #1590)

Looking for Quordle clues? We can help. Plus get the answers to Quordle today and past solutions. Read more

0 fresh

Slashdot
BeauHD @ Slashdot 1 place · today 19:00 EDT

The Pirate Bay Remains Resilient, 20 Years After The Raid

Twenty years after Swedish police raided The Pirate Bay's Stockholm data center and seized its servers, the site remains online. In fact, the 2006 crackdown arguably made it more famous, helping turn it into "one of the most resilient and iconic websites on the internet," reports TorrentFreak. From the report: On May 31, 2006, less than three years after The Pirate Bay was founded, 65 Swedish police officers entered a... Read more

0 fresh

The most popular news from the same source for the last week
Habr Habr
Habr
rds1983 @ Habr · 05/25/2026 22:36 EDT

Content Pipeline в MonoGame: почему я его не использую

ВведениеContent Pipeline — это официальный способ работы с ассетами в MonoGame. Однако в сообществе уже давно существует немалая группа разработчиков, которые его не любят и предпочитают загружать ассеты в «сыром» виде. Особенно это заметно в сообществе FNA(ещё одной реализации XNA4) — там такой подход используют практически все.Я тоже давно в этой «партии» и в этой статье объясню, почему… Читать далее Read more

0

Habr
orchidfiles @ Habr · 05/25/2026 23:03 EDT

Я создаю проекты без единого созвона с командой

Больше всего мне не нравятся короткие созвоны. Когда мне говорят: «У меня есть окно завтра в 11:30, давай созвонимся на 10 минут». Для собеседника это просто очередной созвон, которых у него десятки за день. А для меня событие, вокруг которого начинает строиться весь день. Читать далее Read more

0

Habr
ProgerMan @ Habr · 05/25/2026 23:46 EDT

Красивый скриншот вашего кода. Большое обновление

Привет, хабражители!Я уже писал тут о своём открытом сервисе для скриншотов кода (и простого текста), который позволяет красиво отобразить фрагмент вашего кода в статьях, презентациях, примерах до-после и т.п., насколько хватит вашей фантазии.Периодически я сам использую его для иллюстраций к своим статьям. И шаг за шагом приходят в голову новые идеи, как получить ещё более красивый результат.Наконец, я могу сделать почти то, что хотел когда-то: Узнать, как сделать красоту без... Read more

0

Habr
NeuroKirKorov @ Habr · 05/25/2026 23:51 EDT

Трекинг посетителей на fisheye-камерах: задача “со звездочкой”

Всем привет, на связи команда NeuroCore. Сегодня расскажем про кейс разработки системы видеоаналитики для магазинов самообслуживания: почему fisheye-камеры - настоящее проклятие, почему SORT и DeepSORT не справились с задачей, как мы выстроили конвейер от детекции до бизнес-событий, и какие инженерные решения позволили добиться стабильной работы в продакшене.Дано: магазины самообслуживания, которые работают без кассиров и продавцов. Покупатель входит по QR, выбирает товары, рассчитывается и выходит. Заказч Read more

0

Habr
cyberia_studio @ Habr · 05/26/2026 00:06 EDT

Как спроектировать API, которое не придется переписывать через полгода

Запуск нового сервиса часто сопровождается жесткими дедлайнами и давлением бизнеса. В таких условиях приоритетом становится скорость, но уже через полгода структура данных и эндпоинтов обычно перестает соответствовать реальным потребностям продукта. На этом этапе раскрываются проблемы: новые функции не вписываются в изначальную архитектуру, интеграции становятся хрупкими — любое изменение вызывает регрессию в смежных модулях, а документация расходится с реализацией. Команда разработки оказывается в ловушке. Read more

0

Habr
vdv007 @ Habr · 05/26/2026 01:00 EDT

AI обнулил benchmark и пытался шантажировать инженера. И почему это решаемо

Топовые AI-модели с 95% на SWE-bench показывают 0% и 3% на ProgramBench бенчмарке, где задачи специально не пересекаются с обучающей выборкой. Не «упали на десять пунктов» - обнулились.Параллельно: в мае 2025 Anthropic опубликовали safety-эксперимент, где Claude Opus 4 в 84-96% случаев пытался шантажировать инженера приватной перепиской, чтобы избежать отключения. В мае 2026 они же выпустили разбор причин и инженерное решение - production-модели на этом тесте теперь 0%.Две истории, одна структура:... Read more

0

Habr
anvos @ Habr · 05/26/2026 01:00 EDT

Почему пластиковый корпус оказался в 3 раза дороже металлического

Обычно запрос на изготовление корпуса звучит так: «Сделайте нам недорого, давайте из пластика». Ведь у людей есть интуитивное ощущение: пластик — это по умолчанию самый дешёвый вариант. Логика тут понятна: пластиковых устройств вокруг полно, а из ближайших альтернатив — дерево и металл. Первое сложно представить для массового продукта, второе требует более серьёзной обработки и затрат. Но интуиция иногда подводит, особенно если тираж небольшой. Расскажу про наш опыт на примере реального... Read more

0

Habr
AlexWriter @ Habr · 05/26/2026 01:08 EDT

brec: контролируемая обратная совместимость протокола

С момента последней (и вроде единственной) статьи о brec прошло какое-то время, и мне кажется, что будет полезно лишний раз напомнить о проекте. Даже неожиданно для меня самого он продолжает развиваться. Пусть я пока не могу похвастаться значимым интересом со стороны сообщества, но в паре локальных проектов он уже появился. Да, скорее как эксперимент. Тем даже лучше: можно провести, что называется, полевые испытания. Читать далее Read more

0

Habr
vasya_project (Аспро) @ Habr · 05/26/2026 01:31 EDT

MCP в системе управления проектами: как поручить ИИ работу с корпоративными данными

Привет, Хабр!Меня зовут Василий, я директор SaaS-направления в Аспро — мы разрабатываем систему управления проектами Аспро.Cloud. В этой статье расскажу, зачем мы интегрировали MCP в собственный продукт, как определяли сценарии для внедрения и что из этого получилось. Читать далее Read more

0

Habr
daaaniel (hh.ru) @ Habr · 05/26/2026 01:31 EDT

Бэклог болей: как hh работает с тем, что не нравится пользователям

Всем привет! Меня зовут Данила Максишко, я руковожу командой продуктовых исследователей в hh.ru. В статье расскажу, как мы работаем с обратной связью через важный инструмент — бэклог болей пользователей.Это текст от исследователя для исследователей. Если вы строите или масштабируете ресёрчи у себя, наш опыт поможет избежать части ошибок и быстрее выстроить рабочую систему. Читать далее Read more

0

Most popular sources

  • You see 906 news out of 906.
  • Sources 61 out of 61.
The Fintech Times 0%
Irish Tech News 0%
Silicon Canals 0%
EU-Startups 0%
ArcticStartup 0%
View sources »

LIKE us on Facebook so you won't miss the most important news of the day!

01.06.2026 20:34
Last update: 20:26 EDT.
News rating updated: 03:20.

What is Times42?

Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.


Times42 © 2026