4 place 0

347 Семантический поиск vs полнотекстовый: сравниваем три embedding-модели на 10 000 категорий Ozon

Habr
kotafey @ Habr · 03/14/2026 08:40 EDT

Семантический поиск vs полнотекстовый: сравниваем три embedding-модели на 10 000 категорий Ozon

Сравнил полнотекстовый поиск PostgreSQL (tsvector/tsquery + GIN-индекс) с семантическим поиском через pgvector (cosine distance) на датасете из 10 019 товарных категорий Ozon.Три embedding-модели:GigaChat EmbeddingsGigaR (Сбер, 2560-мерные векторы, API)Qwen3-Embedding-0.6B (Alibaba, 1024-мерные, локальный инференс через HF Text Embeddings Inference на GPU)text-embedding-3-small (OpenAI, 1536-мерные, API)Прогнал 18 запросов в пяти категориях: синонимы и сленг, intent-запросы в свободной форме, подарочная тем

To see detailed statistics for the news please log in »

Read the original

Add your comment
You must be logged in with Facebook to read and write comments.

A newsletter a day!

You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.

or register

LIKE us on Facebook so you won't miss the most important news of the day!

News from the same source
Habr Habr
Silicon Valley
George Avalos @ Silicon Valley 1 place · 02/07/2106 01:28 EDT

Newark apartment complex bought for much less than prior value

An East Bay apartment complex has been bought at a price that's well below its prior value. Read more

0

🔮
03.04.2026 ♒︎ Dear Aquarius, today you may experience a mixed range of emotions and events that will... Read more ›
Silicon Valley
George Avalos @ Silicon Valley 2 place · 02/07/2106 01:28 EDT

PG&E buys San Jose building to bolster South Bay operations

A PG&E Corp. unit has bought a San Jose building in a move to bolster the utility's South Bay operations. Read more

0

Business Insider
Graham Flanagan @ Business Insider 1 place · today 17:30 EDT

The White House requests $66 billion for Trump's 'Golden Fleet'

The White House is requesting $66 billion in funding to build 34 new Naval ships, including what President Trump calls "The Golden Fleet." Read more

0 fresh

Wired
Maxwell Zeff, Zoë Schiffer, Lily Hay Newman @ Wired 1 place · today 17:28 EDT

Meta Pauses Work With Mercor After Data Breach Puts AI Industry Secrets at Risk

Major AI labs are investigating a security incident that impacted Mercor, a leading data vendor. The incident could have exposed key data about how they train AI models. Read more

0 fresh

Android Authority
Matt Horne @ Android Authority 1 place · today 17:26 EDT

Netflix may have to pay back years of price hikes to some subscribers — but probably not you

The court ruling only applies in Italy, and lands just days after Netflix pushed through another round increases in the US. Read more

0 fresh

Wired
Marta Musso @ Wired 2 place · today 17:23 EDT

Scientists Have Made French Fry Breakthrough

Researchers have developed a method of making french fries that results in a healthier bite without sacrificing crispiness. Read more

0 fresh

150sec
Polya Pencheva @ 150sec 1 place · today 17:19 EDT

EU makes a move to streamline company rules with EU Inc. framework

The European Commission presented its proposal for new rules, dubbed EU Inc., on March 17, 2026, aiming to make the process for businesses to start, operate, and grow across the EU swifter.  EU Inc. is expected to function as an optional harmonised EU framework that allows companies to operate under a single set of rules ... Read more

0 fresh

SlashGear
SlashGear 1 place · today 17:15 EDT

Not LG, Not Samsung: This Refrigerator Brand Ranks The Highest For Customer Satisfaction

A recent customer satisfaction study ranked one refrigerator brand above several major competitors, including some of the biggest names in appliances. Read more

0 fresh

Engadget
Devindra Hardawar @ Engadget 1 place · today 17:14 EDT

AI animation studio Toonstar will turn books into digital shows for HarperCollins

HarperCollins is tapping into AI to bring some of its book franchises to life. Specifically, the publisher is teaming up with Toonstar, an AI animation studio, to turn them into digital shows. The first project will be an adaptation of Lisa Greenwald’s “Friendship List” series, which will also be joined by a graphic novel. You’d be forgiven for being unaware of Toonstar, a studio that received some buzzy early on... Read more

0 fresh

Habr
Aurun @ Habr 1 place · today 17:13 EDT

12 недорогих VPS/VDS-хостингов (2026)

Выбираем дешевый и надежный VPS-сервер по ценам, отзывам и возможностям. Многим пользователям и компаниям требуется дешевый хостинг, который при этом остается стабильным и работает без сбоев — то есть надежный хостинг. Такие решения подходят для разных задач: разместить сайт компании, запустить блог, настроить бот, развернуть виртуалку или использовать сервер в учебных целях. В подобных ситуациях чаще всего выбирают VPS-сервер.В этом материале мы разобрали 13 VPS-хостингов. Собрали ключевые параметры: цены, Read more

0 fresh

Gizmodo
Germain Lussier @ Gizmodo 3 place · today 17:00 EDT

Here’s the Perfect Excuse to See ‘Project Hail Mary’ Again

Directors Phil Lord and Chris Miller recorded a director commentary you can listen to in the theater. Read more

0 fresh

Slashdot
BeauHD @ Slashdot 1 place · today 17:00 EDT

Netflix Must Refund Customers For Years of Price Hikes, Italian Court Rules

A Rome court ruled that several Netflix price hikes in Italy were unlawful because the company's contracts didn't adequately explain or justify future pricing changes. As a result, Netflix has been ordered to issue refunds that could total roughly 500 euros for some long-term subscribers. Ars Technica reports: The lawsuit was brought by Italian consumer advocacy group Movimento Consumatori, which alleged that the price hikes violate the Consumer Code, Italian... Read more

0 fresh

CNET
Gael Cooper @ CNET 1 place · today 16:59 EDT

'You Guys Look Great': Artemis Astronauts Share Earth's Out-of-This-World Views

"That's us!" NASA says in a post showing one of the photos taken on the lunar journey. Read more

0 fresh

The Verge
Stevie Bonifield @ The Verge 1 place · today 16:53 EDT

NASA did eventually solve Artemis II’s Outlook glitch

On Thursday, during Artemis II's journey to the Moon, commander Reid Wiseman ran into a tech issue some of us back on Earth can relate to: Microsoft Outlook wasn't working. In a conversation captured in NASA's Artemis livestream and shared on Bluesky, Wiseman reported to Mission Control: "I also see that I have two Microsoft […] Read more

0 fresh

Digital Trends
Manisha Priyadarshini @ Digital Trends 1 place · today 16:51 EDT

Maul – Shadow Lord is returning for a second season to expand the Star Wars lore

Star Wars: Maul – Shadow Lord has been renewed for Season 2 before Season 1 even airs, with Dave Filoni confirming the continuation at Lucasfilm Animation ahead of the April 6 Disney+ debut. Read more

0 fresh

The most popular news from the same source for the last week
Habr Habr
Habr
efreelancer @ Habr · 03/27/2026 19:39 EDT

Воскрешение ruGPT-3 XL или как я вернул к жизни забытую русскую языковую модель

Несколько дней к ряду я занимался реставрацией легаси модели ai-forever/rugpt3xl, это классическая языковая модель от SberDevices на 1.3B параметров, крошка по современным меркам, на которой сберовцы обкатывали свои научные наработки аж в далёком 2021м году. Подробнее о ней можно почитать в статье “A family of pretrained transformer language models for Russian” на Google Scholar.Да, она foundation, то есть умеет только продолжать текст, не может выполнять инструкции или работать в режиме... Read more

0

Habr
Blizna @ Habr · 03/27/2026 23:00 EDT

Как выучить Active Directory и групповые политики

Темы статьи1. Аналог AD DS: Samba DC2. Активация, лицензирование и законодательство3. Правильный подход и автоматизация4. Список литературы, методы её изучения5. Синхронизация времени в домене6. 50 примеров задач, решаемых при помощи GPO Читать далее Read more

0

Habr
Kir_Moisha @ Habr · 03/28/2026 00:28 EDT

Я протестировал 30+ голосовых AI-движков и собрал переводчик быстрее Google Meet. Бенчмарки, цены, грабли

30+ движков за две недели, реальные замеры на Apple M4, и почему ElevenLabs за $5.57/час — это приговор для бизнесаСижу на очередном рабочем созвоне. Обсуждаем архитектуру нового сервиса. Технически я всё понимаю — документацию на английском читаю без словаря, код ревьюю, в слаке переписываюсь нормально. А вот когда надо открыть рот и сказать что‑то сложнее «I agree» — начинается цирк. Пауза. Подбираю слова. Коллега уже ответил за меня.Знакомо?Я CTO, серийный... Read more

0

Habr
klimenkome @ Habr · 03/28/2026 01:30 EDT

Max.ru Bot API: Пишем своего бота для обратной связи. Часть 1. MVP

Привет, Хабр! С выходом платформы MAX у разработчиков появилось новое игровое поле. Пока комьюнити спорит о шансах на победу в гонке мессенджеров, маркетологи уже начали переливать туда трафик.Самая типовая задача для бизнеса сейчас — бот обратной связи. В Telegram эту нишу давно занял Olgram, а вот в Max — чистый лист. Давайте вместе напишем свой аналог. Это отличный кейс, чтобы разобраться с новым API, не углубляясь в лишнюю инфраструктуру.Стек: Почему... Read more

0

Habr
Yakwilik @ Habr · 03/28/2026 01:43 EDT

Как пережить блокировку GitHub-аккаунта и почему к ней лучше подготовиться заранее

Как пережить блокировку Github-аккаунтаи почему к ней лучше подготовиться заранеечто делать, если вы не можете войти аккаунт и что стоит сделать, чтобы уменьшить последствия в случае блокировки Читать далее Read more

0

Habr
TAU15 @ Habr · 03/28/2026 01:43 EDT

RAG или умный поиск по документам: как это работает

Хотите за секунды находить точный ответ в сотнях закрытых корпоративных PDF, Excel и презентаций, вместо того чтобы часами копаться в «мусорном» поиске по ключевым словам?В статье разберем новую архитектуру RAG — система, которая сначала молниеносно находит нужные куски документов по смыслу, а потом объясняет их человеческим языком строго по источникам, практически без галлюцинации.В статье мы раскрыли всю «кухню» от семантической нарезки и эмбеддингов до HyDE, RRF и итеративного поиска —... Read more

0

Habr
ternaus @ Habr · 03/28/2026 01:57 EDT

[Перевод] Как подбирать аугментации: гипотезы, протокол и метрики

Новый пайплайн аугментаций редко собирается за один раз: базовые кропы и отражения, потом куски из старых проектов, статей и соревнований — и в какой-то момент уже много трансформаций, а ясной логики выбора нет.Статья про то, как к этому подойти системно: зачем конкретная трансформация, что она симулирует, насколько сильно её включать и какое допущение о данных она закладывает. Ключевая мысль: аугментация — явное утверждение о том, какие вариации не должны менять... Read more

0

Habr
Adjuster2004 @ Habr · 03/28/2026 02:02 EDT

РС БР ИББС-2.8-2015

Ниже представлен алгоритм построения архитектуры информационной безопасности (ИБ) при использовании технологии виртуализации на основе документа РС БР ИББС-2.8-2015.Алгоритм построен по принципу разветвляющейся блок-схемы, аналогичной приведённому примеру. Он учитывает ключевые требования: разделение контуров безопасности, изоляцию, сертификацию средств защиты информации (СЗИ) и разграничение ролей. Читать далее Read more

0

Habr
ARad @ Habr · 03/28/2026 02:08 EDT

Шахматная партия архитекторов: Arm разрушает 35-летний нейтралитет для собственных ИИ-процессоров

Представьте себе автоспортивное конструкторское бюро, которое тридцать пять лет чертило безупречные двигатели для всего пелотона Формулы-1, но никогда не выставляло на трассу собственный болид. Британская Arm Holdings десятилетиями была такой абсолютной «Швейцарией» Кремниевой долины. Она была невидимым фундаментом вычислений, продавая интеллектуальную собственность и лицензии на архитектуру всем: от Apple до Qualcomm и Nvidia. Никакого физического производства, только идеальные чертежи.Но эволюция технолог Read more

0

Habr
Andrey_Popov30 @ Habr · 03/28/2026 02:13 EDT

Вайбкодинг с Claude | Создание Telegram-ботов

Программирование прямо сейчас переживает сдвиг в подходе к работе.Если раньше основной процесс выглядел как «сел и пишешь код руками», продумываешь архитектуру, разбираешься с документацией и часами ищешь ошибки, то теперь всё чаще сценарий другой: ты формулируешь задачу, а реализацию на себя берёт ИИ.Это и называют вайбкодингом.Ты не работаешь на уровне синтаксиса — ты работаешь на уровне идеи. Задаёшь направление, описываешь поведение, уточняешь детали, а модель превращает это в код и... Read more

0

Most popular sources

  • You see 664 news out of 664.
  • Sources 61 out of 61.
ScienceDaily 0%
MacRumors 0%
Tech Wire Asia 0%
Eurogamer.net 0%
EU-Startups 0%
View sources »

LIKE us on Facebook so you won't miss the most important news of the day!

03.04.2026 17:54
Last update: 17:45 EDT.
News rating updated: 00:41.

What is Times42?

Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.


Times42 © 2026