From Tokens to Thinking: How Reinforcement Learning Fuels Reasoning in LLMs / Миле Митрович

Компьютерные науки

Это выступление на Data Fest в гостях у Яндекса в секции Advanced LLMs. Миле Митрович прочитал доклад на английском языке на тему: From Tokens to Thinking: How Reinforcement Learning Fuels Reasoning in LLMs. #LLMarchitecture

Скачать видео с
Дзен, Dzen

Borealis — как обучить аудио-LLM по цене MacBook

Borealis — как обучить аудио-LLM по цене MacBook

2026-06-19 16:26

Как найти правильную организацию на фото / Константин Гордеев

Как найти правильную организацию на фото / Константин Гордеев

2025-11-01 16:48

Поиск по архивам: как мы переходим к осознанному распознаванию текста

Поиск по архивам: как мы переходим к осознанному распознаванию текста

2026-06-22 06:50

AI-тьютор и методы его оценки

AI-тьютор и методы его оценки

2026-06-19 15:46

ML Global Recap'25

ML Global Recap'25

2025-12-14 12:05

Как мы обучили и внедрили VLM в контентные процессы Яндекс Маркета / Игнат Полежаев и Егор Горбунов

Как мы обучили и внедрили VLM в контентные процессы Яндекс Маркета / Игнат Полежаев и Егор Горбунов

2025-10-23 20:22

Как мы обучаем Алису предсказывать мемы / Арсений Нестюк

Как мы обучаем Алису предсказывать мемы / Арсений Нестюк

2025-10-20 21:39

Главные тренды рекомендательных систем / Николай Савушкин

Главные тренды рекомендательных систем / Николай Савушкин

2025-12-23 17:59

AI-агенты для оптимизации бизнеса Яндекс Лавки

AI-агенты для оптимизации бизнеса Яндекс Лавки

2026-06-22 09:42

Real-time video generation: where we are and what comes next

Real-time video generation: where we are and what comes next

2026-06-19 15:24

Оптимизация обучения и инференса моделей для генерации видео на множестве GPU / Мария Ковалева

Оптимизация обучения и инференса моделей для генерации видео на множестве GPU / Мария Ковалева

2025-10-09 17:25

Память и online-RL: опыт YandexGPT 5.1 / Алексей Колесов

Память и online-RL: опыт YandexGPT 5.1 / Алексей Колесов

2025-10-16 19:44

AgentOps в продакшене: LLM-агенты и автоматизация поддержки

AgentOps в продакшене: LLM-агенты и автоматизация поддержки

2026-06-19 04:21

Гибридная генеративно-ранжирующая модель в рекомендациях Яндекс Музыки

Гибридная генеративно-ранжирующая модель в рекомендациях Яндекс Музыки

2026-06-22 12:49

Библиотека для создания рекомендательных систем RePlay / Алексей Васильев

Библиотека для создания рекомендательных систем RePlay / Алексей Васильев

2025-06-10 16:26

Data Fest. Трек Practical ML

Data Fest. Трек Practical ML

2026-06-09 23:44

Как ML помогает снизить аварийность в Яндекс Go / Филипп Ульянкин

Как ML помогает снизить аварийность в Яндекс Go / Филипп Ульянкин

2025-10-19 16:29

Practical ML Conf 2025. Зал "Код"

Practical ML Conf 2025. Зал "Код"

2025-10-01 00:20

HGRPO: Hierarchical Grouped Reward Policy Optimization for Multi-Turn Conversational Agents

HGRPO: Hierarchical Grouped Reward Policy Optimization for Multi-Turn Conversational Agents

2026-06-19 15:06

Секция на проверку базовых технических навыков ML-инженеров

Секция на проверку базовых технических навыков ML-инженеров

2025-12-01 15:33

0/0

Скачать Видео с Дзена по ссылке

256×144	▬
424×240	▬
640×360	28.27MB
848×480	73.41MB
1280×720	▬
1920×1080	227.18MB

Скачать Клипы

Музыка

Олег Семенов - Попутчица (Премьера клипа 2026)

Олег Семенов - Попутчица (Премьера клипа 2026)

2026-05-26 11:26

Соня Белькевич, КРЕСТОВ - Станцуем (Премьера клипа 2026)

Соня Белькевич, КРЕСТОВ - Станцуем (Премьера клипа 2026)

2026-04-30 11:44

Ислам Итляшев - Сердце (Премьера клипа 2026)

Ислам Итляшев - Сердце (Премьера клипа 2026)

2026-06-14 11:29

Xhensila – Gjuma (Official Video 2026)

Xhensila – Gjuma (Official Video 2026)

2026-05-10 12:39

Руслан Шанов, Amina T - Не верну я (Премьера клипа 2026)

Руслан Шанов, Amina T - Не верну я (Премьера клипа 2026)

2026-05-16 13:10

Рустам Нахушев - Жизнь как будто хороша (Премьера клипа 2026)

Рустам Нахушев - Жизнь как будто хороша (Премьера клипа 2026)

2026-06-21 19:45

Юлия Имранова - Держи меня за руку (Премьера клипа 2026)

Юлия Имранова - Держи меня за руку (Премьера клипа 2026)

2026-05-26 11:32

Руслан Добрый - Итальянка (Премьера клипа 2026)

Руслан Добрый - Итальянка (Премьера клипа 2026)

2026-05-24 15:19

Рейсан Магомедкеримов - На рахате (Премьера клипа 2026)

Рейсан Магомедкеримов - На рахате (Премьера клипа 2026)

2026-06-02 12:46

Ислам Итляшев - Ай да она (Премьера клипа 2026)

Ислам Итляшев - Ай да она (Премьера клипа 2026)

2026-06-18 15:43

Cvetocek7 - Близкий человек (Премьера клипа 2026)

Cvetocek7 - Близкий человек (Премьера клипа 2026)

2026-05-24 15:25

Дана Лахова - Найдём нашу любовь (Премьера клипа 2026)

Дана Лахова - Найдём нашу любовь (Премьера клипа 2026)

2026-05-12 12:35

Светлана Ларионова - Разбитая луна (Премьера клипа 2026)

Светлана Ларионова - Разбитая луна (Премьера клипа 2026)

2026-06-17 11:05

Соня Белькевич - Давай, танцуй (Премьера клипа 2026)

Соня Белькевич - Давай, танцуй (Премьера клипа 2026)

2026-05-22 10:17

Mavik, Лолита - Журналистка (Премьера клипа 2026)

Mavik, Лолита - Журналистка (Премьера клипа 2026)

2026-05-23 16:52

Enrasta - Бейби ту найт (Премьера клипа 2026)

Enrasta - Бейби ту найт (Премьера клипа 2026)

2026-06-21 19:48

Murat Gamidov - По ночам (Премьера клипа 2026)

Murat Gamidov - По ночам (Премьера клипа 2026)

2026-05-21 14:27

Рейсан Магомедкеримов - Роза алая (Премьера клипа 2026)

Рейсан Магомедкеримов - Роза алая (Премьера клипа 2026)

2026-05-09 18:11

Arujan - Koz tiydime (Премьера клипа 2026)

Arujan - Koz tiydime (Премьера клипа 2026)

2026-05-16 13:20

Группа КАРОЛИНА - Розовые краски (Премьера клипа 2026)

Группа КАРОЛИНА - Розовые краски (Премьера клипа 2026)

2026-05-24 15:36

0/0

Скачать Фильмы

Фильмы

GOAT: Мечтай по-крупному | GOAT (2026)

GOAT: Мечтай по-крупному | GOAT (2026)

2026-06-01 17:19

В чужой шкуре | Swapped (2026)

В чужой шкуре | Swapped (2026)

2026-05-06 10:44

Полный такос | Operation Taco Gary's (2026)

Полный такос | Operation Taco Gary's (2026)

2026-04-07 11:13

Йети | The Yeti (2026)

Йети | The Yeti (2026)

2026-04-15 12:24

Крик 7 | Scream 7 (2026)

Крик 7 | Scream 7 (2026)

2026-04-22 11:21

Супер Марио: Галактическое кино | The Super Mario Galaxy Movie (2026)

Супер Марио: Галактическое кино | The Super Mario Galaxy Movie (2026)

2026-05-12 16:55

Мандалорец и Грогу | The Mandalorian & Grogu (2026)

Мандалорец и Грогу | The Mandalorian & Grogu (2026)

2026-06-21 22:48

Вершина | Apex (2026)

Вершина | Apex (2026)

2026-04-30 16:00

Мать Мария | Mother Mary (2026)

Мать Мария | Mother Mary (2026)

2026-05-26 13:06

Грация | La grazia (2025)

Грация | La grazia (2025)

2026-06-17 13:01

Мумия | The Mummy (2026)

Мумия | The Mummy (2026)

2026-05-21 11:56

Глубокие воды | Deep Water (2026)

Глубокие воды | Deep Water (2026)

2026-06-21 22:48

Майк и Ник и Ник и Элис | Mike & Nick & Nick & Alice (2026)

Майк и Ник и Ник и Элис | Mike & Nick & Nick & Alice (2026)

2026-04-03 12:10

Частная жизнь | Vie privée (2025)

Частная жизнь | Vie privée (2025)

2026-04-09 22:40

Тайны моей сестры | My Sister's Bones (2026)

Тайны моей сестры | My Sister's Bones (2026)

2026-05-28 20:15

Последствия | Outcome (2026)

Последствия | Outcome (2026)

2026-04-17 14:43

Я иду искать 2 | Ready or Not 2: Here I Come (2026)

Я иду искать 2 | Ready or Not 2: Here I Come (2026)

2026-04-12 17:20

Обитель зла 4: Жизнь после смерти 3D | Resident Evil: Afterlife (2010)

Обитель зла 4: Жизнь после смерти 3D | Resident Evil: Afterlife (2010)

2026-06-01 17:18

Невеста! | The Bride! (2026)

Невеста! | The Bride! (2026)

2026-04-22 11:21

Хищный рывок | Thrash (2026)

Хищный рывок | Thrash (2026)

2026-04-29 20:33

0/0

Скачать Мультики

Мультфильмы

Кэрри и Супер Кола

Кэрри и Супер Кола

2026-05-18 16:32

Минифорс. Сила динозавров

Минифорс. Сила динозавров

2024-11-27 16:39

Мартышкины

2025-12-30 18:33

Космический рейнджер Роджер Сезон 1

Космический рейнджер Роджер Сезон 1

2021-09-22 21:49

Команда Дино. Исследователи Сезон 2

Команда Дино. Исследователи Сезон 2

2021-09-22 22:54

2026-01-20 10:00

Забавные медвежата

Забавные медвежата

2024-12-02 13:15

2022-03-29 19:16

Чемпионы

2025-03-28 14:36

Люк - путешественник во времени

Люк - путешественник во времени

2024-12-17 16:00

Кадеты Баданаму Сезон 1

Кадеты Баданаму Сезон 1

2021-09-22 21:17

2025-12-30 21:34

Кэрри и Суперкола

Кэрри и Суперкола

2026-05-07 16:33

Простоквашино. Финансовая грамотность

Простоквашино. Финансовая грамотность

2024-12-07 11:00

Мультфильмы военных лет | Специальный проект к 80-летию Победы

Мультфильмы военных лет | Специальный проект к 80-летию Победы

2025-05-03 12:34

Паровозик Титипо

Паровозик Титипо

2024-11-28 14:12

Лудлвилль

2025-12-30 20:49

Маугли и Акира. Новые приключения

Маугли и Акира. Новые приключения

2026-06-25 15:08

Сборники «Зебра в клеточку»

Сборники «Зебра в клеточку»

2025-12-11 18:53

Команда Дино Сезон 2

Команда Дино Сезон 2

2021-09-22 22:40

0/0

Скачать популярное видео

Популярное видео

Зверополис 2 | Zootopia 2 (2025)

Зверополис 2 | Zootopia 2 (2025)

2025-12-25 17:49

Хищник: Планета смерти | Predator: Badlands (2025)

Хищник: Планета смерти | Predator: Badlands (2025)

2025-11-27 03:58

Малыш. / 2026./ Россия / Боевик Драма Война

Малыш. / 2026./ Россия / Боевик Драма Война

2026-04-23 21:12

Ми–Ми–Мишки 💫 Звездная история 🙃 Все серии ✨ Мультики для детей

Ми–Ми–Мишки 💫 Звездная история 🙃 Все серии ✨ Мультики для детей

2024-01-17 17:34

Форсаж 9 | F9 (2021)

Форсаж 9 | F9 (2021)

2023-04-25 23:06

Ми–Ми–Мишки 💫 Звездная история 🙃 Все серии ✨ Мультики для детей

Ми–Ми–Мишки 💫 Звездная история 🙃 Все серии ✨ Мультики для детей

2024-01-17 17:34

Сборник Топ 20 Номеров за 2024 год - Уральские Пельмени

Сборник Топ 20 Номеров за 2024 год - Уральские Пельмени

2025-01-13 14:00

КОРОЛЬ и ШУТ /Сборник видеоклипов/

КОРОЛЬ и ШУТ /Сборник видеоклипов/

2022-09-14 19:48

Дьявол носит Prada | The Devil Wears Prada (2006)

Дьявол носит Prada | The Devil Wears Prada (2006)

2023-04-27 15:40

Лучшие в Аду (2022)

Лучшие в Аду (2022)

2022-10-20 11:01

🚀 ТОП Музыка 2026: Хиты на Все Времена! 🎵 Твои Любимые Исполнители 💎

🚀 ТОП Музыка 2026: Хиты на Все Времена! 🎵 Твои Любимые Исполнители 💎

2026-04-24 09:34

Буба - Все серии подряд - Сезон 1

Буба - Все серии подряд - Сезон 1

2026-02-19 12:00

Дискотека 80-х 90-х Сборник видеоклипов (продолжение)

Дискотека 80-х 90-х Сборник видеоклипов (продолжение)

2022-09-19 10:59

ТОП ЛУЧШИХ КЛИПОВ ШАНСОНА - Слушать шансон лучшее.

ТОП ЛУЧШИХ КЛИПОВ ШАНСОНА - Слушать шансон лучшее.

2026-02-02 14:57

Рыцарь семи королевств. Все серии

Рыцарь семи королевств. Все серии

2026-02-24 11:12

Маша и Медведь. Серия 1. Первая встреча

Маша и Медведь. Серия 1. Первая встреча

2015-02-06 15:18

Антиреспект - Тишины хочу

Антиреспект - Тишины хочу

2019-12-02 21:15

Кей-поп-охотницы на демонов | KPop Demon Hunters (2025)

Кей-поп-охотницы на демонов | KPop Demon Hunters (2025)

2025-10-29 16:30

Давид | David (2025)

Давид | David (2025)

2026-01-29 11:25

КАМИН 4К 🔥 FIREPLACE 4K | Звуки камина и Треск огня

КАМИН 4К 🔥 FIREPLACE 4K | Звуки камина и Треск огня

2024-12-19 00:00

0/0