9 place 0 fresh

49 OCR для Data Lakehouse: от Apache Tika к собственному решению на базе Docling

Habr
diasoft (Диасофт) @ Habr · today 09:00 EDT

OCR для Data Lakehouse: от Apache Tika к собственному решению на базе Docling

Привет, Хабр!Это Андрей Ловлин, руководитель команды «Фабрика данных. Платформа» компании Диасофт. В предыдущей статье мы рассказывали про S3 Архипелаг – слой хранения для нашей «Фабрики данных» (Digital Q.DataFactory). Сегодня речь пойдет о другой задаче: построение конвейера интеллектуального распознавания документов, загружаемых в нашу «Фабрику данных».PDF-файлы, сканы, фотографии договоров – все это накапливается в организациях годами. Для построения RAG-систем и работы с LLM эти данные необходимо извле

To see detailed statistics for the news please log in »

Read the original

Add your comment
You must be logged in with Facebook to read and write comments.

A newsletter a day!

You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.

or register

LIKE us on Facebook so you won't miss the most important news of the day!

News from the same source
Habr Habr
Silicon Valley
George Avalos @ Silicon Valley 1 place · 02/07/2106 01:28 EDT

Newark apartment complex bought for much less than prior value

An East Bay apartment complex has been bought at a price that's well below its prior value. Read more

0

🔮
25.05.2026 ♋︎ Horoscope for the Cancer Zodiac Sign Today The day promises to be quite diverse and... Read more ›
Silicon Valley
George Avalos @ Silicon Valley 2 place · 02/07/2106 01:28 EDT

PG&E buys San Jose building to bolster South Bay operations

A PG&E Corp. unit has bought a San Jose building in a move to bolster the utility's South Bay operations. Read more

0

Habr
d_suslov @ Habr 1 place · today 10:18 EDT

VSCode как IDE для embedded разработки

В данной статье рассматривается процесс настройки vscode для разработки встроенного ПО на базе ядер cortex-M и процессе превращения редактора в полноценную IDE. При этом большинство представленных расширений являются универсальными и применимы в широком спектре задач программирования.В отличии от проприетарных решений, таких как Keil, подход использования редактора vscode + компилятор gcc позволяет гибко настроить каждый пункт от начала разработки до релиза продукта. За время своей работы мною было опробова Read more

0 newcommer

SlashGear
SlashGear 1 place · today 10:15 EDT

Not Toyota, Not Ford: This Brand Dominated KBB's 2026 Consumer Choice Awards

Think Toyota or Ford still rules the auto market? Discover the surprising automaker that completely swept Kelley Blue Book's 2026 consumer awards. Read more

0 newcommer

GSMArena.com
GSMArena.com 1 place · today 10:14 EDT

Xiaomi 17T and 17T Pro show up in more premature retailer listings

Xiaomi is unveiling the 17T and 17T Pro this week, on May 28, before taking the former to India next month. We've already seen the duo in some premature retailer listings, and today it's more of the same. This time around, the listings come from Saudi Arabia. We'll start with the prices, though as always keep in mind that these don't usually translate well into other currencies due to differences... Read more

0 newcommer

Business Insider
John Lynch,James LaForge @ Business Insider 1 place · today 10:12 EDT

The most popular album the year you were born

Business Insider compiled each year's best-selling album dating back to 1956. See which album was the soundtrack to your birth year. Read more

0 fresh

Habr
GeegaGertz @ Habr 2 place · today 10:12 EDT

Моделирование широкополосной антенны с двойной круговой поляризацией и высокой изоляцией

Об антеннах круговой поляризацииАнтенны с круговой поляризацией занимают особое место в современных системах беспроводной связи. В отличие от линейно поляризованных систем, круговая поляризация обеспечивает устойчивый приём сигнала вне зависимости от взаимной ориентации антенн, что критически важно в условиях подвижных платформ - спутников, БПЛА, мобильных наземных комплексов и носимого оборудования.Особый интерес представляют антенны с двойной круговой поляризацией - то есть одновременно поддерживающие пра Read more

0 newcommer

Business Insider
Alcynna Lloyd @ Business Insider 2 place · today 10:09 EDT

My mother wanted independence, not assisted living. So we're building her a 2-bedroom home in our backyard.

Shalini Karnani Bonjour knew moving her mom from Michigan to California would be hard. She didn't expect building her mom an ADU in her backyard would be even harder. Read more

0 fresh

Habr
KarimAbushaev @ Habr 3 place · today 10:05 EDT

Ваше прошлое физически существует прямо сейчас. И вы заморожены там навсегда

Я несколько лет работал аниматором — делал VFX-эффекты: взрывы, пыль, разлёт частиц. Весь день я работал с таймлайном. Перемещался по нему туда-сюда, разворачивал камеру в 3D-пространстве под любым углом, возвращался в прошлое сцены одним кликом.Я подумал, что начать эту статью я хочу с именно такой аналогией: сцена всегда существовала целиком — каждый кадр, каждый момент взрыва, каждая пылинка. Я просто перемещал ползунок и смотрел на разные моменты. Прошлое сцены не... Read more

0 fresh

Habr
D3One @ Habr · today 10:02 EDT

От списка инструментов к technical output: как security engineer’у описывать hands-on опыт в CV и на интервью

Многие специалисты в кибербезопасности умеют делать нормальную hands-on работу: разбирать findings, настраивать SAST/SCA/DAST, проверять API, ковырять CI/CD, писать скрипты, закрывать cloud misconfigurations, помогать разработчикам исправлять уязвимости ит.д. Но при поиске работы такой опыт (а, точнее его подача, упаковка) часто описывается слишком слабо.В резюме получается что-то вроде этого микса: Читать далее Read more

0 fresh

Inc42 Media
Gaurav Bagur @ Inc42 Media 1 place · today 10:02 EDT

Paytm To Invest €9 Mn To Expand Europe Operations

Paytm announced on Friday that it would invest €9 Mn (around ₹99.8 Cr) in its European subsidiary, according to its… Read more

0 fresh

Habr
Lhody (MWS AI, МТС) @ Habr · today 10:00 EDT

I just want an agent. Часть 1. Как я научил ИИ собирать ИИ-агентов за пользователей и выиграл конкурс

Привет, Хабр! Меня зовут Данила Катальшов, я технический лидер команды промпт-инженеров MWS AI. В конце прошлого года мы (в значении MWS AI) выпустили собственную платформу для сборки ИИ-агентов — MWS AI Agents Platform. Платформа избавляет от необходимости разбираться в программировании — можно собирать нужного бота, ИИ-агента или мультиагентную систему, просто перетаскивая блоки в визуальном конструкторе. Однако для работы на ней все равно нужно было инженерное мышление, по меньшей мере на... Read more

0 fresh

Habr
vbracyhina (Цифровой СИБУР) @ Habr · today 10:00 EDT

Вайбкодинг спас меня от подрядчиков. А потом я поняла, что сама стала подрядчиком для своих агентов

На одной из встреч с агентством-подрядчиком мы обсуждали Telegram-бота для транскрибации видео. Отправляешь файл, бот обрабатывает его, возвращает подробную расшифровку и саммари. Я попросила добавить поддержку аудио: чтобы можно было отправлять не только видео, но и аудиозапись. В ответ услышала: две недели и 300 тыс. рублей.На уровне здравого смысла у меня возник вопрос: если из видео все равно извлекается аудиодорожка, почему аудиофайл на входе превращает задачу почти в отдельный проект?... Read more

0 fresh

Gizmodo
Madeline Ricchiuto @ Gizmodo 1 place · today 10:00 EDT

Health Trackers Are Finally Outgrowing Their Battery Problem

Smart health-tracking devices have always struggled to balance battery life and continuous monitoring, but new advances may close that gap. Read more

0 fresh

TechRadar
TechRadar 2 place · today 10:00 EDT

The death of the deep dive — why Google’s new AI search wants to do your thinking for you

Google’s new AI search tools promise to save time, but they may also reshape how we think, explore and navigate the internet. Read more

0 fresh

Business Insider
Amanda Geffner @ Business Insider 3 place · today 09:55 EDT

VHS tapes and landlines are having a resurgence. Here's the '90s tech we want back next.

The '90s introduced tech, from VHS to landlines, that shaped how we lived. There's been a resurgence of some of this tech among younger audiences. Read more

0 fresh

Habr
DigitalPsychiatry @ Habr · today 09:50 EDT

Святой Августин и GAN: почему борьба добра и зла — это генеративная состязательная сеть

Аннотация Посмотрите на эту обложку. Слева — Рай. Справа — Ад. Между ними — вся жизнь.Иероним Босх написал «Сад земных наслаждений» больше пяти веков назад. Он показал, как человек движется от гармонии через свободу к коллапсу. Но можно ли измерить этот путь? Можно ли выразить в битах то, что художник изобразил красками?Эта статья — эксперимент. Мы возьмём старую идею Августина Блаженного (зло — это не активная сила, а отсутствие добра)... Read more

0 fresh

The most popular news from the same source for the last week
Habr Habr
Habr
Flameborn (ГК ICL) @ Habr · 05/18/2026 10:23 EDT

Как я сделала первую визуальную новеллу на Ren’Py с помощью ИИ

Когда ты «одиночка», но с идеей, базовым кодом и кистью в руках, сложные движки пугают, а выбор парализует. Но если у тебя есть ИИ, который не решает за тебя, а помогает думать — ты можешь создать что-то настоящее.Я хотела сделать первую в жизни игру. Теорию геймдизайна знаю, амбиции переполняют, намерения тверды, как гномья сталь. Разработчик на уровне «знаю Python, но Unity для меня — лес». Рисую — да, но не... Read more

0

Habr
d_n_trunov @ Habr · 05/18/2026 10:40 EDT

Тестирование случайности самодельного ГПСЧ и сравнение с эталонами

Самодельный генератор псевдослучайных чисел (ГПСЧ) стал побочным продуктом работы над любительским шифром, а шифры для меня всего лишь хобби и поле для творчества и экспериментов. Поскольку в своём шифре я делал упор на заранее непредсказуемые динамические связи, которые зависят от промежуточных состояний шифра, сама собой напросилась идея о применении этой непредсказуемости для генерации псевдослучайных чисел. Нужно было лишь оценить степень случайности полученного генератора. Как выполнялась оценка, что п Read more

0

Habr
StudyQA @ Habr · 05/18/2026 10:52 EDT

Собрал MCP-сервер для Windows-администрирования: 42 инструмента, от Event Viewer до диагностики служб

Собрал MCP-сервер для Windows: 42 инструмента в 8 модуляхТут собраны Services, Event Viewer, Task Scheduler, Processes, Network, Diagnostics, Observability, Safety. Одна команда npx windows-admin-mcp, и Claude Desktop / Cursor / Claude Code получают полный доступ к администрированию Windows. TypeScript, MIT, npm. Внутри: диагностика служб за один вызов, анализ трендов ошибок, отслеживание изменений в системе, защита от случайных bulk-операций.Пользуюсь сам каждый день. Буду рад фидбеку: что добавить, что ли Read more

0

Habr
ElenaMuhitova @ Habr · 05/18/2026 11:06 EDT

Рейтинг технологий для мобильной разработки для банков в 2026 году

Сейчас рынок переживает не лучшие времена. Уже несколько лет заблокированы основные магазины приложений. В последнее время сильно участились кибератаки на приложение банков. Но технологии могут решить эти проблемы. В этой статье я расскажу про:·       Наш топ технологий·       Как улучшить кибербезопасность в приложении·       Последние функциональные трендыНаш топ технологийSwift – 5 звездKeychain и биометрия Face ID/Touch ID работают на уровне аппаратного шифрования, и разработчикам не нужно придумывать в Read more

0

Habr
inSales_team (inSales) @ Habr · 05/18/2026 11:14 EDT

Дайджест: топ-5 инструментов Сбер2В для роста продаж на маркетплейсах и в интернет-магазине

Сбер2В Онлайн-продажи — платформа для управления продажами на маркетплейсах и в интернет-магазинах, раньше известная как inSales. С помощью неё можно создать интернет-магазин, контролировать заказы с остатками товаров и получать аналитику от Wildberries, Ozon и Яндекс Маркета.Рассказываем о пяти инструментах платформы, которые вышли относительно недавно: ИИ-аналитик на основе чата с доступом к API маркетплейсов, обновлённый фоторедактор, два блока в аналитике для учёта расходов и себестоимости, а также новы Read more

0

Habr
Tehnoblog1 (StudyAI) @ Habr · 05/18/2026 11:17 EDT

Mimo V2 Pro от Xiaomi — что умеет нейросеть от производителя смартфонов? 4 интересных теста

Xiaomi у большинства людей ассоциируется с доступными смартфонами, умными пылесосами и колонками за разумные деньги. Нейросети — последнее что приходит в голову когда слышишь это название.Но вот факт: у Xiaomi есть собственная языковая модель. Называется Mimo. И вторая версия с приставкой Pro — уже вполне серьёзный инструмент который стоит рядом с продуктами компаний занимающихся ИИ профессионально.Как показали тесты - данная модель очень достойная, и справляется с задачами не хуже Claude... Read more

0

Habr
Aidar22 (Кэмп ex Кампус) @ Habr · 05/18/2026 11:22 EDT

Генерация дипломной работы нейросетью: какие ИИ помогают студентам в 2026 году

ТОП ИИ для генерации учебных работТОП ИИ для генерации презентацийГенерация текстовых работНейросеть КэмпОсобенно активно в последние месяцы обсуждают сервисы, ориентированные именно на студентов. Причина простая: нагрузка в вузах растёт, требований становится больше, а времени — меньше. На этом фоне нейросети начинают восприниматься уже не как способ «схитрить», а как инструмент для ускорения рутинной работы. Читать далее Read more

0

Habr
Kaspersky_Lab («Лаборатория Касперского») @ Habr · 05/18/2026 11:51 EDT

Security Week 2621: три уязвимости нулевого дня в Windows

На прошлой неделе стало известно о трех новых уязвимостях нулевого дня в Windows. Обычно термин zero-day применяется в случае, если уязвимость на момент обнаружения используется в реальных атаках, но в данном случае имеет место другая ситуация. Данные о проблемах в открытом доступе опубликовал аноним, называющий себя Nightmare Eclipse. Уязвимости снабжены демонстрационным кодом, который вполне возможно применить для реальных атак, — и это при отсутствии патча от производителя. Отсюда и квалификация... Read more

0

Habr
python_leader @ Habr · 05/18/2026 11:52 EDT

[Перевод] Каждая AI-подписка — это бомба замедленного действия для корпоративного сектора

Каждая AI-лаборатория прямо сейчас работает себе в убыток, обслуживая вашу компанию. Они это знают. И делают это намеренно.OpenAI, Anthropic, Google и остальные реализуют отраслевую программу субсидирования в масштабах, не имеющих прецедента. Они продают предприятиям вычислительные мощности по ценам ниже себестоимости, называя это бизнес-моделью. Разрыв между тем, что ваша компания платит за AI-подписки, и тем, во что реально обходится их обслуживание, — это не погрешность округления, а пропасть. И любая ор Read more

0

Habr
skovalev (Selectel) @ Habr · 05/18/2026 11:57 EDT

Самый настоящий FP64 для ядерных расчетов? Анонс AMD Instinct MI430X

На майском HPC User Forum в Остине AMD рассказали о MI430X — ускорителе серии MI400, который позиционируется как инструмент для научных вычислений. Пока индустрия увлечена инференсом и считает токены в секунду на FP4, AMD напомнила, что CFD-код (Computational Fluid Dynamics) не интересует, насколько быстро чип умножает восьмибитные числа.Привет, Хабр! Меня зовут Сергей Ковалёв, я менеджер выделенных серверов в Selectel. В этой статье мы мысленно «разберем» MI430X и обсудим, насколько новинка... Read more

0

Most popular sources

  • You see 486 news out of 486.
  • Sources 61 out of 61.
The Verge 0%
VentureBeat 0%
Droid Life 0%
Sifted 0%
MacRumors 0%
View sources »

LIKE us on Facebook so you won't miss the most important news of the day!

25.05.2026 10:36
Last update: 10:30 EDT.
News rating updated: 17:31.

What is Times42?

Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.


Times42 © 2026