357 place 0
В предыдущих статьях Intro Reinforcement Learning и Reinforcement Learning: Model-free & Deep RL были рассмотрены подходы, в которых оптимальные действия находились косвенно через оценку полезности состояний или пар «состояние–действие». Такие методы принято называть value-based. Однако возникает вопрос: зачем строить сложные цепочки через value-функции, если можно напрямую обучать агента выбирать правильные действия? Такой policy-based подход интуитивно кажется проще и естественнее.Здесь о том, как это дел
A newsletter a day!
You may get 10 most important news around midday in daily newsletter. Press the button and we will send you the most important news only, no spam attached.
LIKE us on Facebook so you won't miss the most important news of the day!
It looks like scammers are using smart glasses in a bid to capture IMEI details. Read more ›
771 fresh
Micron has responded to criticism over its decision to exit the consumer memory business and warns that shortages may last until 2028. Read more ›
618 fresh
Windows 11’s Resume feature may finally matter for Android users. Microsoft is outlining broader support for third party apps, which could make it easier to continue tasks on your PC with fewer dead ends. Read more ›
510 fresh
Tom Clancy's The Division 2 is still trucking along, and with an ambitious 2026 roadmap to boot, while development on the third game continues. More shocking, though, is the apparent tease that The Division 1 is making a return for its 10th anniversary. Read more Read more ›
450 fresh
High school teachers say that teaching capitalism has become increasingly politicized, with students drawn to figures like Zohran Mamdani and AOC. Read more ›
425 fresh
The Motorola Moto G Power (2026) launched just last week – it’s a $300 phone with an IP69 rating and a MIL-STD-810H compliant design. It has a 6.8” LCD and is powered by the Dimensity 6300 paired with expandable storage, plus a 5,200mAh battery with 30W wired and 15W wireless charging. If you ever need to repair the latest G Power model, you may want to consult this disassembly video... Read more ›
392 fresh
As competing narratives and interpretations of viral videos muddy the investigations of the fatal shooting of Renee Nicole Good by an Immigration and Customs Enforcement officer in Minneapolis last week, there’s at least one thing that can’t be denied: the Department of Homeland Security’s operations in American cities are a sharp departure from how its […] Read more ›
354 fresh
SoFi CEO Anthony Noto said that enacting Trump's credit card interest cap would cause a void in the industry that could be filled by personal loans. Read more ›
338 fresh
Malaysia and Indonesia are the first countries to block Grok, claiming that X’s chatbot does not have sufficient safeguards in place to prevent explicit AI-generated deepfakes of women and children from being created and disseminated on X. Indonesia temporarily blocked access to Grok on Saturday, as did Malaysia on Sunday, the Associated Press reports. Meanwhile, UK media regulator Ofcom has opened a formal investigation into X under the Online Safety... Read more ›
334 fresh
At some point today, EA will turn the Anthem servers off, rendering BioWare's multiplayer online shooter inaccessible and unplayable, presumably forever. And fond farewells have already started to pour in. Read more Read more ›
313 fresh
Powell described the move as a part of a broader effort to pressure the central bank on monetary policy. Read more ›
265 fresh
Miles Guo was convicted of fraud. Now his formerly luxurious lifestyle is being broken down and sold for parts in bankruptcy court. Read more ›
248 fresh
167 software engineers responded to Business Insider's vibe-coding survey. Over 45% reported "keeping up" with AI tools. Almost 17% feel behind. Read more ›
247 fresh
A tech CEO put together a dream board of directors with AI representing famous leaders. Here's how he uses it. Read more ›
245 fresh
McKinsey & Company CEO Bob Sternfels says he wants every employee working alongside an AI agent within a year and a half. Read more ›
219 fresh
The NIMA Gluten Sensor is 99% accurate at detecting gluten in your food. All it takes is three minutes. Read more ›
205 fresh
When Cyberpunk 2077 was sort of relaunched with its 2.0 update and the Phantom Liberty expansion, female V took over as the face of the game. More than two years later, and with the RPG still selling well and attracting new players, that hasn't changed. Read more Read more ›
202 fresh
Ларингалы – самые загадочные звуки праиндоевропейского языка, не сохранившиеся ни в одном из живых индоевропейских языков. Звуки-призраки, которых никто из ныне живущих не слышал. И звуки-атланты, на которых держатся все реконструкции праиндоевропейского. Почему учёные так уверены в их существовании? Можем ли мы хотя бы представить себе их звучание? И как их можно записать, кроме нижних индексов? Обо всём по порядку – в этой особой статье по заявкам читателей. Читать далее Read more ›
15
История с тем, что украинский президент установил на 7 января «День программиста» слегка взбудоражила общественность, но не с той стороной, которую я считаю самой интересной.Вобщем, сперва будет рассказ о том, откуда берутся всякие там «Международные дни» и какова их ценность, а затем будет вопрос, на который я не смог найти ответа. Читать далее Read more ›
8
Как жадные до прибыли торгаши и спекулянты привели планету к прогрессу, и почему девайс с которого вы читаете эту статью заслуга капитализма. Об эпидемии чумы, Ост-Индской компании и ростовщиках с патентным правом. 1/3 статей из цикла истории Капитализма. Читать далее Read more ›
3
В телеграмме есть способ раскрыть IP собеседника в 1 клик, не скидывая ему никаких файлов, картинок и даже не заставляю его переходить по сомнительным ссылкам.Телеграм даже не предупреждает о том, что вас скамят. Но как? Читать далее Read more ›
3
Каждый раз, когда мы пишем «быстрый скрипт на коленке», мы тратим время на одни и те же вещи: настройку логов, парсинг конфигов и создание прогресс-баров. В этой статье разберем 10 легковесных утилит (от tqdm до beartype), которые закроют рутинные задачи и позволят вам сфокусироваться на логике, а не на «обвязке». Читать далее Read more ›
1
Современные подходы к безопасности ИИ часто сводятся к внешним запретам и попыткам заставить системы выглядеть «этичными». Однако системный анализ и опыт биологической эволюции указывают на то, что подобные методы прямого ограничения могут оказаться неэффективными при масштабировании систем до уровня искусственного интеллекта общего назначения (AGI).В данной статье анализируется переход от биологических основ принятия решений к математическим моделям кооперации искусственного интеллекта. Мы рассмотрим, поче Read more ›
1
У меня нет классического образования в области радиотехники, но связь представлений сигнала во временной и частотной областях меня сильно интересует. При попытке сформировать в голове ясное представление возникают примерно такие вопросы.Рассмотрим базовую ситуацию для любого радиоканала.Передатчик излучает немодулированную несущую (Рис. 1) Читать далее Read more ›
2
Приветствую всех! Два года назад я уже рассказывал о том, как запустить у себя дома базовую станцию 4G LTE. Тем не менее, в той сети работал только мобильный интернет, тогда как при попытке позвонить или отправить SMS связь немедленно обрывалась.Самое время восполнить это упущение. Сегодня мы поднимем сеть, в которой будут работать все эти функции. Заодно разберёмся, как работают звонки в LTE-сетях, как запустить такую сеть при помощи SDR и... Read more ›
2
Доброго времени суток, «Хабр»!На дворе 2026 год, когда люди применяют нейросети в разных сферах своей жизни: от помощи в обучении до решения достаточно сложных задач.Программирование - область, требующая солидного запаса знаний и, конечно же, опыта их применения. Не каждая модель способна продемонстрировать даже относительно качественный результат.Сегодня мы сравним ChatGPT 5.2 Pro, Claude Opus 4.5 и Gemini 3 Pro в области программирования. Мне не интересно оценивать лишь написание программ под конкретные... Read more ›
1
Предисловие: вся информация находится в открытом доступе. Статья написана с целью привлечения внимания к общественно важной теме.Я хочу всесторонне разобраться в ситуации, услышать комментарии всех участников (особенно компаний «Яндекс» и «Авито») и только после этого делать какие-либо выводы, и вас к этому тоже призываю.Недавно вышло интервью HR из Яндекса основателю сообщества «Осознанная меркантильность». В нём говорилось о найме, «красных флагах» в резюме соискателей и другом булщите о найме, от которог Read more ›
2
Most popular sources
|
|
26% 17 |
|
|
23% 8 |
|
|
7% 0 |
|
|
6% 3 |
|
|
5% 1 |
| View sources » | |
LIKE us on Facebook so you won't miss the most important news of the day!
12.01.2026 08:45
Last update: 08:36 EDT.
News rating updated: 15:31.
What is Times42?
Times42 brings you the most popular news from tech news portals in real-time chart.
Read about us in FAQ section.