4 place 0 fresh

17 Кастомный пайплайн BERTopic: как кластеризовать тексты и получить интерпретируемые темы с помощью LLM

Habr
AntonyZak (Ростелеком) @ Habr · today 13:16 EDT

Кастомный пайплайн BERTopic: как кластеризовать тексты и получить интерпретируемые темы с помощью LLM

Привет, Хабр! Меня зовут Антон и я занимаюсь задачами NLP в компании Ростелеком Информационные технологии. Если вам приходилось разбирать большие массивы текстов: отзывов, обращений в поддержку или комментариев, то вы знаете, насколько это трудоемкий процесс.В статье я покажу, как автоматизировать этот процесс с помощью пайплайна BERTopic: от эмбеддингов и кластеризации до интерпретации тем. Особое внимание уделим тому, как встроить локальную LLM в пайплайн и получить человекочитаемые названия тем. Читать д

To see detailed statistics for the news please log in »

Read the original

Add your comment
You must be logged in with Facebook to read and write comments.

A newsletter a day!

You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.

or register

LIKE us on Facebook so you won't miss the most important news of the day!

News from the same source
Habr Habr
Silicon Valley
George Avalos @ Silicon Valley 1 place · 02/07/2106 01:28 EDT

Newark apartment complex bought for much less than prior value

An East Bay apartment complex has been bought at a price that's well below its prior value. Read more

0

🔮
16.05.2026 ♉︎ Dear Taurus, today your day promises to be busy and, at the same time, a... Read more ›
Silicon Valley
George Avalos @ Silicon Valley 2 place · 02/07/2106 01:28 EDT

PG&E buys San Jose building to bolster South Bay operations

A PG&E Corp. unit has bought a San Jose building in a move to bolster the utility's South Bay operations. Read more

0

Habr
AkaneKuroshiki (Timeweb Cloud) @ Habr 1 place · today 14:05 EDT

Как Nintendo придумала половину фишек современного гейминга, а мы все об этом стали забывать

Компания Nintendo в наше время имеет довольно… странную репутацию. Одни до сих пор упорно игнорируют её существование, другие все еще ненавидят по очень надуманным причинам, а третьи фанатично сражаются за ее честь в интернете, когда кто-то снова спиратил Зельду.И, как правило, все три категории геймеров делятся на два лагеря, когда слышат один тезис: Nintendo придумала всю современную игровую индустрию и львиную долю актуального геймдизайна.Что? Вы тоже не верите? Тогда давайте... Read more

0 fresh

Digital Trends
Rachit Agarwal @ Digital Trends 1 place · today 14:00 EDT

I can’t live without iPhone shortcuts. These 7 are my favorites that you must try, too.

iPhone shortcuts can save you a surprising amount of time. Here are 7 of my personal favorites that I rely on every single day, and I think you will love them too. Read more

0 fresh

TechRadar
TechRadar 1 place · today 14:00 EDT

I went inside FIFA's secret World Cup lab, and the 3D scanning tech I found there could change football forever

A rare behind-the-scenes visit to FIFA HQ in Zurich reveals the AI and 3D technology that will change the World Cup — and football — forever. Read more

0 fresh

TechRadar
TechRadar 2 place · today 13:55 EDT

Amazon's Memorial Day sale feels like Prime Day — up to 63% off Fire TV Sticks, Ring Doorbells, Echo, Blink cameras, and more

Amazon's Memorial Day sale feels like Prime Day, with up to 60% off best-selling devices like Fire TV Sticks, Ring Doorbells, Echo speakers, and more. Read more

0 fresh

Habr
asigatchov @ Habr 2 place · today 13:55 EDT

fast-volleyball-tracking-inference — детектор волейбольного мяча на скорости 80 fps (CPU). Или «не YOLO единым»

Так сложилось, что я люблю играть в волейбол и активно снимаю свои игры и тренировки.У любителей обычно стоит стационарная камера на штативе, которая захватывает всю площадку (или почти всю) в формате 16:9. При этом современные соцсети потребляют контент вертикально (9:16) и короткими роликами около минуты.Задача: быстро делать вертикальные видео из любительских волейбольных съёмок.Центральный объект внимания в волейболе — мяч. Значит, нужно определять начало розыгрыша и дальше уверенно следить за мячом.... Read more

0 fresh

Habr
Tehnoblog1 (StudyAI) @ Habr 3 place · today 13:48 EDT

Claude Opus 4.7, Sonnet 4.6 и Haiku 4.5 — одно имя, разные возможности. Два теста для каждой

Когда видишь три модели с одним именем — первая мысль: «наверное одно и то же, просто разные версии». На практике разница между ними примерно как между стажёром, опытным сотрудником и старшим аналитиком. Формально все делают одну работу. Но то как они с ней справляются — совсем другая история. Читать далее Read more

0 fresh

Habr
VOrlyanskiy @ Habr · today 13:47 EDT

Выделение одного значащего признака из набора данных с помощью машинного обучения. Используется Apache Spark

В первой части была создана инфраструктура для запуска машинного обучения. Там же была создана БД с данными для использования в примерах.В данной части будет искаться, какой тип файлов вызывает увеличение нагрузки. При этом, зная, какой именно тип файла был указан как вызывающий нагрузку.Будет использоваться машинное обучение в Apache Spark. Читать далее Read more

0 fresh

SlashGear
SlashGear 1 place · today 13:45 EDT

What's The Average Lifespan Of A Weed Eater Engine?

Gas-powered weed eaters can last for years, but the engine's lifespan depends on more than the tool itself. A few upkeep habits can make a real difference. Read more

0 fresh

Slashdot
EditorDavid @ Slashdot 1 place · today 13:34 EDT

The Search for the Next 'James Bond' Actor Has Begun

Variety reports: Amazon MGM Studios started auditioning actors for the part of 007 in the past few weeks, Variety has learned... The next James Bond film will be directed by Denis Villeneuve, the filmmaker behind the "Dune" franchise, "Arrival" and "Sicario." Amy Pascal of the "Spider-Man" films and David Heyman of the "Harry Potter" series will produce the picture, which will feature a script from "Peaky Blinders" creator Steven Knight.... Read more

0 fresh

GSMArena.com
GSMArena.com 1 place · today 13:17 EDT

Samsung Galaxy S24 series, Fold6, and Flip6 are receiving One UI 8.5 stable update in the US

The One UI 8.5 stable update released by Samsung for the Galaxy S24 series, Galaxy Z Fold6, and Galaxy Z Flip6 globally earlier this week is now rolling out in the US. [#InlinePriceWidget,13147,1#] [#InlinePriceWidget,12771,1#] The update comes with firmware versions S928USQU5DZDR for the Galaxy S24 Ultra, S721USQUBDZDP for the Galaxy S24 FE, F956USQU3DZDQ for the Galaxy Z Fold6, and F741USQU3DZDP for the Galaxy Z Flip6. The One UI 8.5 stable... Read more

0 fresh

Mashable
Mashable 2 place · today 13:03 EDT

How to watch the 2026 Eurovision Song Contest online for free

How to watch Eurovision for free. Live stream the 2026 Eurovision Song Contest for free from anywhere in the world. Read more

0 fresh

CNET
Kevin Lynch @ CNET 1 place · today 13:00 EDT

Preakness Stakes 2026: How to Watch This Year's Race Without Cable

There's a $1.2 million prize up for grabs for the winner of this year's Run for the Black-Eyed Susans. Read more

0 fresh

TechRadar
TechRadar · today 12:59 EDT

How to watch Eurovision 2026 online for FREE– stream Grand Final live from Vienna

The grand final of the Eurovision Song Contest 2026 in Vienna takes place on Saturday, May 16. Here's how to watch Eurovision 2026 online and for free – from anywhere in the world Read more

0 fresh

The most popular news from the same source for the last week
Habr Habr
Habr
voronkovich @ Habr · 05/09/2026 13:44 EDT

Набор шорткодов для Joomla

Приветствую, коллеги!После нашумевшей публикации о плагине Joomla Shortcoder я получил множество вопросов (в математике такое множество называется «пустым») о том, как быстро начать использовать шорткоды в Joomla для типовых задач: вставить видео с YouTube или Rutube, документ Google Docs или просто сгенерировать «рыбу» для вёрстки. Поэтому сегодня я хочу представить вам Joomla Shortcodes — плагин, который содержит набор готовых шорткодов для вставки контента от популярных сервисов. Читать далее Read more

0

Habr
stago @ Habr · 05/09/2026 14:18 EDT

Экономика Бытия, Этика Демиургов или Почему нейросетям не позволено воспроизводить обнаженное человеческое тело

Началось все с того, что однажды я задумался над последним вопросом заголовка: почему генеративным нейросетям не позволено воспроизводить обнаженное человеческое тело? Ну, понятно, что цензура, и понятно, что в открытом доступе лежит куча моделей, которые развращай обучай как хочешь.  Но откуда взялось само убеждение, что человеческое тело не может быть воспроизведено во всем своем великолепии? Почему его можно показывать в музее и спальне, например, а urbi et orbi друзьям и... Read more

0

Habr
slavaln @ Habr · 05/09/2026 14:16 EDT

Kaiten → коробочный Bitrix24: как мы переносили не задачи, а память команды

На первый взгляд миграция из Kaiten в Bitrix24 выглядит как обычная интеграционная задача: прочитать данные из одного REST API и записать в другой REST API.Но это впечатление быстро проходит, когда начинаешь переносить не демо-доску, а живую проектную систему.В Kaiten уже накоплены пользователи, пространства, карточки, комментарии, файлы, ссылки внутри описаний, пользовательские поля, стадии, архивные задачи, связи между карточками и исторический контекст работы команды. Если перенести только названия карто Read more

0

Habr
nlaik @ Habr · 05/09/2026 14:27 EDT

LazyWeb: 257 тысяч экранов реальных приложений как контекст для AI-агентов

Если вы хоть раз просили Claude Code, Cursor или Codex сделать интерфейс — то знаете эту проблему. Код модель пишет неплохо, но визуально результат выглядит как “сайт, сгенерированный AI”. Одинаковые карточки, одинаковые градиенты, одинаковый набор паттернов из топа поиска. Несколько недель назад вышел LazyWeb — MCP-сервер, который даёт агенту 257k экранов реальных приложений как визуальный контекст. Установил, прогнал на pricing-странице для своего пет-проекта, разбираю, что получилось. Читать далее Read more

0

Habr
marmeladigital @ Habr · 05/09/2026 15:27 EDT

Прототипирование сайта на Тильде: какие ограничения нужно учесть до дизайна и сборки

Прототип сайта на Тильде нельзя рассматривать только как черновик будущего дизайна. Тильду часто воспринимают как инструмент, где можно быстро собрать сайт из готовых блоков. Это правда, когда структура заранее ложится на логику платформы. Но если сначала нарисовать свободный макет, а потом пытаться перенести его в конструктор без учета стандартных блоков, Зеро-блока, адаптива, форм, SEO-структуры и будущего редактирования, скорость быстро исчезает. Читать далее Read more

0

Habr
tcs_mining @ Habr · 05/09/2026 15:41 EDT

Сравнили системы мониторинга ASIC-майнеров: Hive OS, Awesome Miner и Monito

Когда у тебя 40 ASIC-ов на двух площадках, а часть стоит у хостера, без системы мониторинга начинаются проблемы. Перегрев замечаешь через сутки, падение хешрейта на одной плате — через неделю. Я полгода назад оказался в этой ситуации и перебрал три варианта: Hive OS с ASIC Hub, Awesome Miner и Monito. Рассказываю, чем они реально отличаются, и почему “лучшая система мониторинга” — это вопрос вашего сценария, а не списка фич. Читать... Read more

0

Habr
RJME @ Habr · 05/09/2026 15:51 EDT

Как я использовал Cursor для онбординга

Привет! Меня зовут Родион, и я фронтенд-разработчик. Когда-то в 2022 году писал свои первые сайты на нативном HTML, CSS и JavaScript. С тех пор успел поработать в стартапах и на фрилансе.Я работаю в проектах, которые пишутся уже не первый год. И каждый раз, когда я сталкиваюсь с новым, впервые вижу его структуру, то думаю, что разбираться в нем буду несколько месяцев. Нужно понять логику всех вложенностей, правил, «исторических особенностей», но... Read more

0

Habr
VitaliySemenov @ Habr · 05/09/2026 15:51 EDT

Memory MCP Server, часть 2: как проект вырос из semantic search в memory backbone для инженерных агентов

В первой части я показывал agent-memory-mcp v0.1.0: MCP-сервер на Go + SQLite, который даёт AI-агентам persistent memory, semantic search и RAG по документации проекта.Во второй части разбираю, что изменилось после нескольких месяцев реального использования. Почему fallback между embedding-моделями оказался опаснее отказа, зачем понадобились local-only режим и reembed, почему одного semantic search мало для инженерной памяти, как появились session close, Claude Code hooks, canonical knowledge, stewardship,. Read more

0

Habr
tcs_mining @ Habr · 05/09/2026 16:05 EDT

Лучшие ASIC-майнеры для добычи криптовалют в 2026 году

ASIC-майнер (Application Specific Integrated Circuit) — это специализированное оборудование, предназначенное для добычи криптовалют. В отличие от видеокарт и процессоров, такие устройства создаются для выполнения одной конкретной задачи — вычисления хеш-функций в сети блокчейн. Читать далее Read more

0

Habr
Vlad441 @ Habr · 05/09/2026 16:40 EDT

ncpp: Как создать самодостаточную экосистему на С++98 в 2026 году, которая запустится даже на железе со свалки

Современная разработка удобная, все сделано для программиста - последние версии компилятора, последние версии ОС, удобный синтаксический сахар.Однако что если ли у вас нет доступа к последним новшествам? Если у вас на руках только кусок металлолома 20-ти летней давности? А все вендоры и поставщики давным-давно от вас отвернулись? Давай почитаем, какой велосипед нагородили Read more

0

Most popular sources

  • You see 404 news out of 404.
  • Sources 61 out of 61.
Android Authority 0%
MacRumors 0%
VentureBeat 0%
Droid Life 0%
BetaKit 0%
View sources »

LIKE us on Facebook so you won't miss the most important news of the day!

16.05.2026 14:38
Last update: 14:30 EDT.
News rating updated: 21:31.

What is Times42?

Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.


Times42 © 2026