ІІ від Google навчили бути «вкрай агресивним» при стресових ситуаціях

Дата:

2018-06-17 11:10:07

Перегляди:

Рейтинг:

1Дизлайк 0Любити

Поділитися:

Main/
dosl-dzhennya/
ІІ від Google навчили бути «вкрай агресивним» при стресових ситуаціях

ІІ від Google навчили бути «вкрай агресивним» при стресових ситуаціях

Source:

У минулому році відомий фізик-теоретик Стівен Хокінг заявив, що вдосконалення штучного інтелекту стане «кращим або гіршим подією для всього людства». Всі ми дивилися «Термінатора» і всі ми чудово уявляємо, яким апокаліптичним пеклом може стати наше існування, якщо така володіє самосвідомістю ІІ-система, як «Скайнет», одного разу вирішить, що в людстві вона більше не потребує. І останні результати роботи нової ІІ-системи від компанії DeepMind (належить Google) лише черговий раз нагадують нам про необхідність бути вкрай обережними при виробництво роботів майбутнього.

У дослідженнях, що проводилися в кінці минулого року, ІІ від DeepMind знайшов і продемонстрував незалежно від того, що закладено в його пам'ять, а ще переміг кращих в світі гравців . Крім цього, він вдосконалював свої навички і имитировании людського голосу.

В рамках останніх випробувань системи дослідники перевіряли «прагнення» до співпраці. Тести показали, коли ІЇ DeepMind відчуває, що ось-ось програє, то для уникнення програшу він починає вибирати нові і «вкрай агресивні» стратегії. Команда Google провела з ІІ 40 мільйонів сесій в простій комп'ютерній грі Gathering, де від гравця потрібно було зібрати якомога більше потрібних фруктів. ІІ DeepMind керував двома гравцями-агентами» (синім кубиком і червоним кубиком). Інженери Google дали системі завдання влаштувати змагання між «агентами» і зібрати стільки віртуальних яблук (зелених квадратиків), скільки вийде.

До пори До часу, поки «агенти» могли без проблем збирати фрукти, наявні у великій кількості, все йшло гладко. Але як тільки запас яблук скорочувався, поведінка «агентів» ставало «агресивним». Вони стали активніше використовувати засіб (лазерний промінь), яке допомагало вибити супротивника за ігровий екран і потім самому зібрати всі яблука:

Що цікаво, за вибивання супротивника з поля за допомогою лазерного променя ніякої додаткової нагороди не пропонувалося. Вибитий супротивник лише деякий час знаходиться за межами екрана, у той час як більш успішний противник мав можливість безперешкодно зібрати побільше віртуальних яблук.

Якщо б «агенти» не використовували лазерні промені, то теоретично кількість зібраних ними яблук було б однаковим. Це в принципі і відбувалося, коли в якості «агентів» використовувалися більш низькорівневі і «менш інтелектуальні» варіанти DeepMind. Більш агресивна поведінка, шкідництво і жадібність стали виявлятися тільки тоді, коли команда Google стала використовувати більш і більш складні форми DeepMind.

Коли дослідники використовували в якості «агентів» більш прості мережі DeepMind, то між ними зазначалося наявність «атмосфери більш дружнього співіснування на ігровому полі». Однак, коли управління агентами передавалось все більш і більш складним формам мереж, ІІ ставав агресивніше і став намагатися заздалегідь вибити супротивника з ігрового поля, щоб першим швидше дістатися до левової частки видобутку з віртуальних яблук. Вчені Google припускають, що чим розумніша «агент», тим він ефективніше здатний навчатися, адаптуватися до умов середовища і доступних методів, і в кінцевому підсумку приходити до використання найбільш агресивну тактику для перемоги.

«Ця модель показує, що результатом навчання та адаптації до умов навколишнього середовища є прояв деяких аспектів, властивих людському поведінці», — говорить Джоель З. Лейбор, один з дослідників, які проводили цей експеримент.

«Менш агресивна поведінка проявлялося тільки при навчанні та знаходженні у відносно безпечному середовищі, з меншою ймовірністю наслідків тих або інших дій. Жадібність ж, в свою чергу, відбивалося в прагненні обігнати суперника і самостійно зібрати всі яблука».

Після «збору урожаю» DeepMind запропонували зіграти в іншу гру, під назвою вовчої зграї. Цього разу в ній були присутні відразу три ІІ-агента: два грали роль волков, а решту – роль видобутку. На відміну від гри Gathering, нова гра всіляко сприяла співробітництву між вовками. По-перше, так легше зловити здобич, а по-друге, якщо обидва «вовка» знаходилися поряд з загнаної здобиччю, вони обидва отримували якусь нагороду, в незалежності від того, хто саме її спіймав.

«Ідея полягає в тому, що видобуток може бути небезпечною. Крім того, може самотній вовк і здатний її загнати, але є ризик її втрати в результаті нападу падальщики», — пояснює команда.

«Але якщо обидва вовка заганяють видобуток разом, то вони здатні краще її захищати від падальщики і завдяки цьому отримують підвищену нагороду».

У загальному і цілому з гри Gathering ІІ DeepMind усвідомив, що агресія і егоїзм є найбільш ефективними стратегіями для отримання потрібного результату в конкретно взятій середовищі. З вовчої зграї та ж система зрозуміла, що співпраця, на відміну від індивідуальних спроб, може стати ключем до більш цінною нагороду в певних ситуаціях. І хоча описані вище тестові середовища є лише елементарними комп'ютерними іграми – основний посил зрозумілий вже зараз. Візьміть різні ШІ, які мають конкуруючими інтересами в реальній ситуаціях, помістіть в одну середовище, і, можливо, якщо їх завдання не компенсуються загальною метою, результатомможе стати справжня війна. Особливо якщо людина, як один з ланок у досягненні цієї мети, буде виключений.

В якості прикладу просто уявіть собі світлофори, керовані ШІ, і безпілотні автомобілі, намагаються самостійно знайти найшвидший маршрут. Кожен виконує свої завдання з метою отримання найбільш безпечного і найбільш ефективного результату для суспільства.

Незважаючи на «дитячі» роки DeepMind і відсутність якого б то не було стороннього критичного аналізу його можливостей, результати його випробувань наводять на наступні думки: навіть якщо ми їх створюємо, це зовсім не означає, що в роботах і ІІ-системах автоматичним чином буде закладено прагнення ставити наші людські інтереси вище своїх власних. Тому нам самим необхідно закладати доброзичливість» в природу машин і передбачати будь-які «лазівки», які можуть дозволити їм дістатися до тих самих лазерних променів.

Один з основних тез ініціативної групи OpenAI, спрямованої на вивчення питань етики штучного інтелекту, як-то пролунав у 2015 році наступним чином:

«Сьогоднішні ІІ-системи володіють дивовижними, але вузькоспеціалізованими можливостями. І найімовірніше, ми ще довгий час не будемо їх стримувати в своєму вдосконаленні. Принаймні до тих пір, поки їх можливості у вирішенні практично кожної інтелектуальної задачі не будуть перевершувати людські. Складно уявити, який саме рівень користі зможе принести ІІ людського рівня для суспільства, так само як і важко уявити, якої шкоди він зможе завдати суспільству при недбалому ставленні до його створення і використання».

Більше:

Венера має газ, вироблений мікробами. Вчені знайшли іноземців?

Був припущення, що може бути життя на Венери Протягом багатьох років вчені шукають життя на Марсі. Але хто знає, може вони там не дивляться? У 2017 році дослідники з США та Великобританії почали шукати ознаки життя на Венері, яка є другою за величино...

Чи може мелатонін допомогти лікувати коронавірус?

Деякі лікарі вважають, що гормон сну допомагає при коронавірусі Схоже, що в переліку потенційних методів лікування COVID-19, які дослідники запропонували протягом декількох місяців пандемії, ще одне поповнення: мелатонін. Лікар в Техасі каже, що він ...

Що таке "гормон любові" і хто його не вистачає?

Окситоцин - гормон любові Людське тіло виробляє величезну різноманітність гормонів, кожен з яких виконує своє завдання. Наприклад, багато відомих ендорфінів приносять людям відчуття радості, а надлишок кортизолу сигналізує про стресовий стан людини. ...

Примітка (0)

Ця стаття не має коментарів, будьте першим!

Додати коментар

Новини

Біологи продовжують досліджувати процес клітинного воскресіння

Незважаючи на те, що сучасна наука безсила проти загибелі клітин живого організму, деякі дослідники з оптимізмом дивляться в майбутнє і навіть припускають, що одного разу людству стане доступна свого роду «клітинна реанімація», зд...

Майже всі нові електростанції Європи отримують енергію з відновлюваних джерел

В минулому році держави Європейського Союзу підключили багато нових електростанцій, при цьому майже вся вироблена ними енергія береться з відновлюваних джерел. Згідно з даними, наданими об'єднанням , 21 з 24 ГВт енергії, що виробл...

Вода дозволить збільшити термін служби акумуляторів

Незважаючи на те, що в сучасних нас найчастіше не влаштовує їх ємність, фахівці вважають найбільш слабким місцем їх нетривалий термін служби. Літій-іонні акумулятори служать всього кілька років, після чого їх ємність починає різко...

Створено мозкової імплант, відновлює зір

Чіп, стимулюючий зорову зону кори головного мозку і створює імітацію зору без допомоги очей, вже гарвардскими фахівцями, які збираються почати його тестувати на приматах в березні цього року. В даному випадку роль очей будуть вико...

Експеримент: водорості вижили після 450 днів, проведених у відкритому космосі

У рамках експерименту на борту Міжнародної космічної станції два види зустрічаються в природі водоростей весь час перебували фактично у відкритому космосі. Експеримент завершився успішно: обидва види в результаті вижили. Результат...

Телескоп Хаббл допоміг астрономам виявити «вбивство» мега-комети «білим карликом»

Космічний телескоп Хаббл продовжує виявляти цікаве. Кілька днів тому йому зафіксувати момент смерті зірки, розташованої на відстані більше 5000 світлових років від Землі в сузір'ї Корми, а вчора астрономи за допомогою цього телеск...

В університеті штату Орегон зробили робота-ходуна

Навчити роботів ходити на своїх двох — не найпростіше завдання, але Cassie, здається, зовсім не напружується з цього приводу і відмінно справляється із завданням. На відео, опублікованому нижче, розробники з Agility Robotics...

Чому нам боляче від гарячого і холодного?

На перший погляд, у гарячого металу чайника і кубики льоду немає нічого спільного. Але ці два об'єкти можуть заподіювати біль. Сильне тепло і сильний холод роблять на шкіру людини вкрай неприємне вплив — це ми знаємо з дитинства. ...

Проксіма b: планета нездійснених надій?

У нас погані новини для тих, хто вже розпланував свій тріп до найближчої до Землі экзопланете. Згідно з новим дослідженням аерокосмічного агентства NASA, що планети, розташовані у жилих зонах зірок класу «червоний карлик» — ...

Під льодовиками Аляски виявлена стародавня піраміда

Глобальне потепління, безсумнівно, становить чималу небезпеку для нашої планети. Але є в цього явища й інша, більш позитивна сторона. Через танення льодовиків дослідникам представилася унікальна можливість побачити під товщею льод...

Астрономи з МДУ склали каталог на 800 тисяч галактик

Існує багато каталогів, які містять в собі інформацію про різні світила, галактик і зірок. Ними регулярно користуються, але всі вони недостатньо об'ємні, інформативні і точні, тому астрономам часто не вистачає інформації звідти, щ...

Компанії Volgabus виділять 200 мільйонів рублів на розробку і тестування безпілотних автобусів

Не так давно ми про електричну модульну платформу , концепт якої представила російська компанія . Універсальність платформи полягає в тому, що на її базі можна швидко зробити невеликий, але функціональний спецтранспорт або пасажир...

Студенти Стенфорда приготували пиво по 5000-річному рецептом

Ми знаємо, що наші предки навчилися готувати алкоголь багато тисяч років тому. Але до наших днів практично не збереглися оригінальні рецепти стародавніх хмільних напоїв, а за вцілілими описами їх характеристик вкрай складно зрозум...

У Бразилії виявлено десятки давніх будівель, схожих на Стоунхендж

За повідомленням журналу Proceedings of the National Academy of Sciences, нещодавно у Бразилії, в районі тропічних лісів Амазонської низовини, групою, що складається з бразильських, британських і канадських дослідників-археологів,...

Створено крихітний генератор, що виробляє енергію з шлункового соку

Шлунковий сік має досить складний склад, що включає соляну кислоту (його найважливішу складову), бікарбонати, пепсиноген і пепсин, слиз, а також фермент Фактор Касла. Присутня в шлунку кислота здатна досить ефективно розкладати їж...

Дослідження: сидячий спосіб життя не такий шкідливий, як вважалося

Напевно багато з вас чули про те, що так званий сидячий спосіб життя – тобто коли людина більшу частину свого часу (як правило, на роботі) проводить в сидячому положенні – дуже шкідливий для здоров'я. Так от виявляється, що все це...

У штучному мозку змогли виростити кровоносні судини

Дослідники Браунівського університету, розташованого в місті Провіденс, США, створили лабораторний , в якому потім змогли виростити мережа кровоносних судин. Зараз вони сподіваються, що з допомогою цього досягнення зможуть краще в...

#Відео | SpaceX виклала панорамне відео з труби Hyperloop

Нещодавно компанія SpaceX провела конкурс, в ході якого 27 команд розробників представили свої варіанти прототипів капсул для Hyperloop. Мета заходу — підстьобнути ззовні інтерес до проекту Hyperloop, простимулювати інженері...

Вогонь, вода, повітря, земля: найнебезпечніші для життя місця на Землі

Багатьох з нас погода заставала зненацька, будь то раптова злива по дорозі додому чи на роботу або палюче сонце відсутність пляжу або якого-небудь укриття. Але це все можна пережити. Є на нашій планеті місця, де матінка-природа во...

Що ми знаємо про переховуються доісторичних монстрів?

Вже більше ста років історії про озерного монстра під назвою «Мокеле-мбембе» хвилюють дослідників глибоких лісів Африки. Що вони знайшли з тих пір? У 1981 році повідомлення про що живе в озері монстрі привернули увагу Германа Рега...