5 place 0 fresh

18 Как связывание эмбеддингов душит трансформеры и уничтожает градиенты

Habr
YH7H22 @ Habr · 05/17/2026 23:44 EDT

Как связывание эмбеддингов душит трансформеры и уничтожает градиенты

Долгие годы в NLP считалось правилом хорошего тона связывать матрицу входных эмбеддингов с матрицей выходного классификатора (Weight Tying), чтобы сэкономить память. В этой статье мы разберем геометрическую ошибку этого подхода. Вы узнаете, почему входные и выходные репрезентации имеют прямо противоположные математические цели, и как общая матрица приводит к физическому столкновению градиентов во время обратного распространения ошибки, лишая модель выразительности. Читать далее

To see detailed statistics for the news please log in »

Read the original

Add your comment
You must be logged in with Facebook to read and write comments.

A newsletter a day!

You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.

or register

LIKE us on Facebook so you won't miss the most important news of the day!

News from the same source
Habr Habr
Silicon Valley
George Avalos @ Silicon Valley 1 place · 02/07/2106 01:28 EDT

Newark apartment complex bought for much less than prior value

An East Bay apartment complex has been bought at a price that's well below its prior value. Read more

0

🔮
18.05.2026 ♏︎ Dear Scorpio, today promises a rich and multifaceted day filled with change and opportunities. Try... Read more ›
Silicon Valley
George Avalos @ Silicon Valley 2 place · 02/07/2106 01:28 EDT

PG&E buys San Jose building to bolster South Bay operations

A PG&E Corp. unit has bought a San Jose building in a move to bolster the utility's South Bay operations. Read more

0

CoinDesk
Shaurya Malwa @ CoinDesk 1 place · today 01:01 EDT

Hyperliquid's HYPE token rallied 7% over 24 hours after Trade.xyz launched the first pre-IPO perpetual market on the platform, offering synthetic exposure to SpaceX at a reference valuation of $1.78 trillion. Read more

0 newcommer

Habr
RationalAnswer @ Habr 1 place · today 00:50 EDT

Китае-американский визит десятилетия, а также первый коммерческий пилотируемый меха-робот

Самые интересные новости финансов и технологий в России и мире за неделю: встреча Трампа и Си, новый глава ФРС заступил на должность, первое крупное ИИ-IPO Cerebras, на бирже обещают сделать фьючерсы на компьют, экономика РФ замедляется, мессенджер Max хочет заменить банковские SMS, айтишники в западных компаниях жгут токены почем зря, а также хорошая новость недели для всех скуфов. Читать далее Read more

0 newcommer

CoinDesk
Omkar Godbole @ CoinDesk 2 place · today 00:37 EDT

The latest attack adds to growing string of cross-chain infrastructure exploits. Read more

0 fresh

Habr
Diamant_storage @ Habr 2 place · today 00:35 EDT

Иллюзия сохранности, или Бэкап, который не спасает

Случай, произошедший со стартапом PocketOS, выглядел бы комичным, если бы не обернулся реальной катастрофой. ИИ-агент Cursor, работавший на базе Claude Opus, за девять секунд уничтожил не только основную базу данных компании, но и все резервные копии. Читать далее Read more

0 fresh

Android Authority
Adamya Sharma @ Android Authority 1 place · today 00:26 EDT

Walmart just launched two surprisingly loaded Android tablets under $300

Leading Walmart's 2026 Onn tablet refresh is a 13-inch Pro model with a MediaTek processor and a bundled stylus. Read more

0 fresh

Habr
viktdo @ Habr 3 place · today 00:03 EDT

GEO для Яндекс Нейро: 4 метрики, которые отвечают на главный вопрос «почему меня нет в выдаче»

Когда в 2023-2024 году Яндекс и Google запустили генеративные ответы поверх поисковой выдачи, классические SEO-метрики начали ломаться по одной. Позиция «1 место в SERP» больше ничего не значит, если 40-70% коммерческих запросов в нише триггерят AI-ответ выше первой ссылки. Click-through rate упал даже у тех, кто формально сохранил топ-3 - AI-ответ перехватывает часть кликов, и появляется новый класс источников: домены, которые AI цитирует в своём ответе. Туда вы либо попадаете... Read more

0 fresh

Habr
zzeng @ Habr · today 00:01 EDT

Насколько многомерным может быть многомерный точный индекс?

Вот, например, Milvius(DiskANN) рассчитан на вектора размерности до 32 768, но это приближенный поиск.  Но как насчёт поиска точного?В данной статье рассматривается работоспособность 1024 мерного индекса, хранилищем которого служит обычное B-дерево (насколько вообще может быть обычным такое дерево). Используемый диск - вполне себе “железный” старый добрый WD Purple, оперативная память сознательно ограничена 8 Гб. Можно ли что-то из этого выжать на рядовом десктопе за приемлемое время? Читать далее Read more

0 fresh

Habr
shanker @ Habr · today 00:00 EDT

Wayback Machine как архив IDOR: как временные ссылки перестали быть временными

В марте 2026 многие обсуждали ситуацию с доступом к изображениям из ЛС мессенджера MAX по ссылкам, сохранённым через WebArchive. Тогда же многих не устроил ответ компании.К сожалению, ситуация хуже, чем кажется. Т.к. проблемы не видят не только в MAX, но и в других компаниях (столкнулся с этим, оповещая компании о похожих проблемах). В статье я расскажу, почему считаю ситуацию - проблемой для всех: пользователей, компании, багхантеров. И как связка "WebArchive... Read more

0 fresh

CoinDesk
Sam Reynolds @ CoinDesk 3 place · 05/17/2026 23:52 EDT

Long-term holders are still sitting tight and exchange balances remain near six-year lows, Binance Research data shows, but underwater short-term holders leave BTC vulnerable to macro shocks. Read more

0 fresh

SlashGear
SlashGear 1 place · 05/17/2026 23:45 EDT

Mazda Is Slowly Changing Its Logo, And It's Starting To Pop Up In More Places

Mazda's familiar emblem is beginning to look a little different in more places, reflecting a broader change in how automakers are thinking about branding. Read more

0 fresh

CNET
Gael Cooper @ CNET 1 place · 05/17/2026 23:43 EDT

Today's NYT Mini Crossword Answers for Monday, May 18

Here are the answers for The New York Times Mini Crossword for May 18. Read more

0 fresh

Slashdot
EditorDavid @ Slashdot 1 place · 05/17/2026 23:34 EDT

Linus Torvalds: AI-Detected Bug Reports Make Kernel Security List 'Almost Entirely Unmanageable'

Today Linus Torvalds announced another Linux release candidate on the kernel mailing list. But he also highlighted "documentation updates" to address a new problem. "The continued flood of AI reports has basically made the security list almost entirely unmanageable, with enormous duplication due to different people finding the same things with the same tools." (The new documentation says the security team has found "bugs discovered this way systematically surface simultaneously... Read more

0 fresh

The most popular news from the same source for the last week
Habr Habr
Habr
RationalAnswer @ Habr · 05/11/2026 01:02 EDT

Хантавирусный круиз у берегов Испании, а также целевая блокировка VPN на 92%

Самые интересные новости финансов и технологий в России и мире за неделю: заявка на новую пандемию, кибердружины из студентов, национализация Русагро, параллельный импорт заменят на отечественные компы, Пентагон публикует фотки НЛО, срок португальских гражданств удлинили, а также альтманофон от OpenAI. Читать далее Read more

0

Habr
EvgeneKopylov @ Habr · 05/11/2026 01:16 EDT

Как заставить ИИ-рекрутера читать мой профиль так, как нужно мне

Некоторое время назад я зарегистрировался на одной фриланс-бирже. Указал: коммерческий опыт на Rust — 1.5 года. Так и было на тот момент.Шло время, я довёл до релиза два сложных проекта. Но тот старый профиль остался висеть в интернете.И вот я подаю резюме на позицию Senior Rust-разработчика. Рекрутер использует ИИ-ассистента для первичного скрининга. Ассистент читает цифровой след и выдаёт вердикт: «Junior+/Middle». Читать далее Read more

0

Habr
EugeneSizikov @ Habr · 05/11/2026 01:39 EDT

Почему сильный сотрудник в новой компании может не давать результат (и это не его вина)

Покупка профессионала из другой компаний — это не приобретение готового решения.Я разделяю мнение автора, изложенное в книге «В погоне за звездами» (Chasing Stars) Бориса Гройсберга: успех «звезды» на 70% зависит от среды, а не от самого человека. И ведь действительно, когда «звезда» переходит в другую компанию, её эффективность часто падает из‑за выхода из зоны комфорта. Читать далее Read more

0

Habr
Zmey56 @ Habr · 05/11/2026 01:57 EDT

Code Review Horror Stories. Часть 2: API, ошибки и graceful shutdown

Продолжение разбора реального кода с собеседования. В первой части разобрали 8 проблем concurrency и memory: race conditions, утечки горутин, проигнорированный mutex, TOCTOU. Это была первая половина из 21 бага в одном сервисе на 150 строк.Сегодня — вторая часть. Тут нет страшных race conditions, но есть то, что выдаёт уровень разработчика на собесе: отношение к ошибкам, валидация, API design, graceful shutdown, observability. Эти баги не упадут “вдруг” в продакшене — они... Read more

0

Habr
razetdinov @ Habr · 05/11/2026 02:00 EDT

Как руководители используют Obsidian

Полтора года назад выступал на конференции TeamLead Conf с докладом «Второй мозг для руководителя» (YouTube, VK). Позже несколько коллег признались, что ведение заметок в Obsidian помогло им разгрузить голову и упорядочить работу. Попросил их поделиться своим опытом. Читать далее Read more

0

Habr
sound_right @ Habr · 05/11/2026 02:19 EDT

AI Review не делает код лучше. И вот почему

Я делал AI Review как простой инженерный инструмент. Но реальный фейл оказался не в архитектуре и не в LLM — а в том, чего люди от него ждали. Читать далее Read more

0

Habr
ASabramova @ Habr · 05/11/2026 02:30 EDT

Почему мозг избегает именно того, что его развивает?

У мозга есть механизмы действия. Их можно понять. И с этим пониманием можно уже изменить то, как вы принимаете решения, строите отношения и справляетесь с собой в сложные моменты. Этим занимается нейробиология последние несколько десятилетий. И этим же — хотя совсем другими методами и другим языком — психоанализ занимается больше ста лет.Дэвид Иглмен — нейробиолог из Стэнфорда, автор книги «Мозг. Ваша личная история» (переведена на русский) и нескольких документальных сериалов... Read more

0

Habr
basalykor @ Habr · 05/11/2026 02:30 EDT

Почему техподдержка работает, как пожарная команда — и как это исправить

Всем привет, я Роман Басалыко. Последние двадцать лет работаю с командами продуктовой технической поддержки. Эта статья — попытка честно описать, почему одни команды масштабируются без потери качества, а другие нанимают людей и всё равно не справляются. По данным индустриальных исследований, одна заявка, решенная без участия инженера техподдержки — экономит в среднем $15–20. При потоке в тысячи заявок в месяц это уже существенные цифры.Есть три признака того, что в техподдержке что‑то... Read more

0

Habr
andy-takker @ Habr · 05/11/2026 02:45 EDT

Логин через Telegram по-новому: разбираем OIDC-флоу oauth.telegram.org и собираем его на Python

Telegram теперь полноценный OpenID-провайдер: oauth.telegram.org, JWKS, JWT, claims. Туториалы на GitHub при этом массово показывают старый виджет с HMAC от bot-token и /setdomain в BotFather. Я разобрался с новым флоу и собрал PoC на Python — рассказываю, как устроен обмен между фронтом, Telegram и бэком, чем Login library через telegram-login.js отличается от manual OIDC code flow с PKCE, что настраивать в BotFather (спойлер: не в чате, а в его mini-app),... Read more

0

Habr
sergeytolkachyov @ Habr · 05/11/2026 02:49 EDT

Переопределение классов ядра Joomla с помощью плагина на примере MVCFactory

Разработчики сайтов, веб-мастера, рассматривая Joomla как CMS, чаще всего используют компоненты ядра такими, какие они есть. Но компоненты ядра, обеспечивающие CRUD-ы в Joomla, следует рассматривать ещё и как примеры использования Joomla в качестве фреймворка. Иногда реалии проекта таковы, что требуется внести изменения именно в логику классов ядра Joomla. Я покажу это на нескольких примерах: как исхитрялись раньше и какие возможности появились в современных версиях Joomla.Сразу оговорюсь: речь не о том,... Read more

0

Most popular sources

  • You see 331 news out of 331.
  • Sources 61 out of 61.
Inc42 Media 0%
The Fintech Times 0%
Ars Technica 0%
Wired 0%
ScienceDaily 0%
View sources »

LIKE us on Facebook so you won't miss the most important news of the day!

18.05.2026 01:17
Last update: 01:10 EDT.
News rating updated: 08:11.

What is Times42?

Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.


Times42 © 2026