27 дек. 2018 г.

Любопытство и ТВ

Добрый день!

Если мы знаем, куда стремиться, то нередко можем научить достигать этого и компьютер. Например, имея цель поставить мат в шахматах, компьютер вполне способен научиться его ставить. Здесь вполне понятная система поощрения, поэтому машина даже на такой сложной игре способна эффективно обучаться. Но как быть, если цель так и не удалось сформулировать? За что награждать?

Люди придумали такую штуку — Curiosity-Driven Learning. Если говорить грубо, то идея в следующем: система старается попасть в состояния, в которых ранее не была. И вот за достижение нового состояния робот получает награду (т.е. он продолжает заниматься привычным делом — максимизирует какую-то характеристику).

И тут мы подходим к жестокому эксперименту над бедным роботом-младенцем. Юный и любопытный он старательно занимается чем угодно. Чем? Например, проходит компьютерные игры. Но не с целью «набрать как можно больше очков», а потому что ему «интересно» увидеть новое. И вот он уже вполне способен пройти десять уровней Марио, а также сделать многое другое.

А потом его пускают исследовать лабиринт. О, бродить по лабиринту, как же это здорово! Но что это? Пульт от телевизора и сам телевизор на стене... Что же будет дальше?

Посмотрите на беднягу (интересен весь ролик, но я сейчас пишу о моменте с 1:40):



https://youtu.be/l1FqtAHfJLI

Оказалось, что самый простой и быстрый способ для получения новой информации — переключение каналов. Робот забрасывает исследование лабиринта, ему хватает кнопок пульта. Забавно? Видели уже подобное?

Как вы понимаете, лента и уведомления социальной сети нередко выполняют для нас роль такого же телевизора. На что ещё мы столь же бессмысленно отвлекаемся от дела? Например, процесс доказательства великой теоремы Ферма можно отнести к этому? Или даже сам этот результат? Большинство ведь какую-то пользу народному хозяйству от этой теоремы никогда не ощутит, в отличие от многих других научных результатов. Какие можете предложить менее спорные примеры?

Хорошего завершения недели!

7 комментариев:

  1. Я бы вспомнил майнинг криптовалют.

    ОтветитьУдалить
    Ответы
    1. Спасибо за пример. Смысл в них мы как раз пытались искать год назад - https://my-tribune.blogspot.com/2017/12/Cryptocurrency.html

      Удалить
    2. Очевидно, нужен какой-то баланс между временем, отводимым на получение новой информации и временем, отводимым на ее обработку. Но вот критерий? Если критерием избрать денежный доход, то робота надо отправить на фондовый рынок (там, правда, роботов и так хватает). А какой еще может быть критерий? Количество просмотров в интернетах?

      Удалить
  2. Анонимный29.12.2018, 08:13

    Примеров море! Скажем, изучение мертых языков (от эсперанто до фортрана), решение японских кроссвордов, шахматы те же и так далее. Вопрос-то в другом - а в чем смысл жизни? Если смотреть телек интереснее, чем бродить по миру/лабиринту, то в этом же нет ничего плохого.

    ОтветитьУдалить
    Ответы
    1. Спасибо за примеры. Вопросы Вы поднимаете очень глубокий, но при этом правильный. Есть или нет в этом что-то плохое? Это зависит от того, что такое хорошо и что такое плохо.

      Удалить
  3. Смотрящий телек получит, в конце концов, премию Дарвина

    ОтветитьУдалить
    Ответы
    1. Этот бот и так не умел размножаться, поэтому избегание телевизора его от этой премии бы не уберегло. А вот с более живыми штуками такая опасность, конечно, есть.

      Удалить

Понравилась заметка? Подпишитесь на RSS-feed или email-рассылку.

Хотите поделиться ссылкой с другими? Добавьте в закладки:



Есть вопросы или предложения? Пишите письма на адрес mytribune АТ yandex.ru.

С уважением,
      Илья Весенний