Добрый день!
Если мы знаем, куда стремиться, то нередко можем научить достигать этого и компьютер. Например, имея цель поставить мат в шахматах, компьютер вполне способен научиться его ставить. Здесь вполне понятная система поощрения, поэтому машина даже на такой сложной игре способна эффективно обучаться. Но как быть, если цель так и не удалось сформулировать? За что награждать?
Люди придумали такую штуку — Curiosity-Driven Learning. Если говорить грубо, то идея в следующем: система старается попасть в состояния, в которых ранее не была. И вот за достижение нового состояния робот получает награду (т.е. он продолжает заниматься привычным делом — максимизирует какую-то характеристику).
И тут мы подходим к жестокому эксперименту над бедным роботом-младенцем. Юный и любопытный он старательно занимается чем угодно. Чем? Например, проходит компьютерные игры. Но не с целью «набрать как можно больше очков», а потому что ему «интересно» увидеть новое. И вот он уже вполне способен пройти десять уровней Марио, а также сделать многое другое.
А потом его пускают исследовать лабиринт. О, бродить по лабиринту, как же это здорово! Но что это? Пульт от телевизора и сам телевизор на стене... Что же будет дальше?
Посмотрите на беднягу (интересен весь ролик, но я сейчас пишу о моменте с 1:40):
https://youtu.be/l1FqtAHfJLI
Оказалось, что самый простой и быстрый способ для получения новой информации — переключение каналов. Робот забрасывает исследование лабиринта, ему хватает кнопок пульта. Забавно? Видели уже подобное?
Как вы понимаете, лента и уведомления социальной сети нередко выполняют для нас роль такого же телевизора. На что ещё мы столь же бессмысленно отвлекаемся от дела? Например, процесс доказательства великой теоремы Ферма можно отнести к этому? Или даже сам этот результат? Большинство ведь какую-то пользу народному хозяйству от этой теоремы никогда не ощутит, в отличие от многих других научных результатов. Какие можете предложить менее спорные примеры?
Хорошего завершения недели!
27 дек. 2018 г.
Любопытство и ТВ
Подписаться на:
Комментарии к сообщению (Atom)
Понравилась заметка? Подпишитесь на
RSS-feed или email-рассылку.
Хотите поделиться ссылкой с другими? Добавьте в закладки:
Есть вопросы или предложения? Пишите письма на адрес mytribune АТ yandex.ru.
С уважением,
Илья Весенний
Хотите поделиться ссылкой с другими? Добавьте в закладки:
Есть вопросы или предложения? Пишите письма на адрес mytribune АТ yandex.ru.
С уважением,
Илья Весенний
Я бы вспомнил майнинг криптовалют.
ОтветитьУдалитьСпасибо за пример. Смысл в них мы как раз пытались искать год назад - https://my-tribune.blogspot.com/2017/12/Cryptocurrency.html
УдалитьОчевидно, нужен какой-то баланс между временем, отводимым на получение новой информации и временем, отводимым на ее обработку. Но вот критерий? Если критерием избрать денежный доход, то робота надо отправить на фондовый рынок (там, правда, роботов и так хватает). А какой еще может быть критерий? Количество просмотров в интернетах?
УдалитьПримеров море! Скажем, изучение мертых языков (от эсперанто до фортрана), решение японских кроссвордов, шахматы те же и так далее. Вопрос-то в другом - а в чем смысл жизни? Если смотреть телек интереснее, чем бродить по миру/лабиринту, то в этом же нет ничего плохого.
ОтветитьУдалитьСпасибо за примеры. Вопросы Вы поднимаете очень глубокий, но при этом правильный. Есть или нет в этом что-то плохое? Это зависит от того, что такое хорошо и что такое плохо.
УдалитьСмотрящий телек получит, в конце концов, премию Дарвина
ОтветитьУдалитьЭтот бот и так не умел размножаться, поэтому избегание телевизора его от этой премии бы не уберегло. А вот с более живыми штуками такая опасность, конечно, есть.
Удалить