(Зображення надано: Google DeepMind. Отримано з Youtube.)
Компанія Google DeepMind представила пару моделей штучного інтелекту (ШІ), які дозволять роботам виконувати складні загальні завдання та міркувати так, як раніше було неможливо.
Раніше цього року компанія представила першу версію Gemini Robotics, моделі штучного інтелекту, заснованої на її великій мовній моделі Gemini (LLM), але спеціалізованої для робототехніки. Це дозволило машинам міркувати та виконувати прості завдання у фізичних просторах.
Вам може сподобатися
-
Вчені щойно розробили новий штучний інтелект, змодельований за зразком людського мозку, — він перевершує LLM, такі як ChatGPT, у завданнях мислення.
-
Штучний інтелект не може розв'язати ці головоломки, які займають у людей лише секунди
-
Знайомтесь, робот-барабанщик: вчені навчають штучний інтелект грати на барабанах, як Linkin Park та AC/DC, але, схоже, йому ще є чим зайнятися
Базовим прикладом, на який вказує Google, є тест з бананом. Оригінальна модель штучного інтелекту була здатна отримувати просту інструкцію, таку як «покладіть цей банан у кошик», і керувати роботизованою рукою для виконання цієї команди.
Завдяки двом новим моделям робот тепер може брати вибрані фрукти та сортувати їх в окремі контейнери на основі кольору. В одній демонстрації пара роботизованих рук (робот Aloha 2 від компанії) точно сортує банан, яблуко та лайм на три тарілки відповідного кольору. Крім того, робот пояснює природною мовою, що він робить і чому, під час виконання завдання.
Gemini Robotics 1.5: Мислення під час дії – YouTube
Дивитися далі
«Ми даємо йому змогу думати», – сказав у відео Цзе Тан, старший науковий співробітник DeepMind. «Він може сприймати навколишнє середовище, мислити крок за кроком, а потім завершувати це багатоетапне завдання. Хоча цей приклад здається дуже простим, ідея, що лежить в його основі, справді потужна. Та сама модель живитиме більш досконалих людиноподібних роботів для виконання складніших щоденних завдань».
Робототехніка майбутнього на базі штучного інтелекту
Хоча демонстрація може здаватися простою на перший погляд, вона демонструє низку складних можливостей. Робот може просторово знаходити фрукти та тарілки, ідентифікувати фрукти та колір усіх об'єктів, зіставляти фрукти з тарілками відповідно до спільних характеристик та надавати вивід природною мовою, що описує його міркування.
Все це можливо завдяки тому, як взаємодіють новітні версії моделей штучного інтелекту. Вони працюють разом так само, як керівник і працівник.
Google Robotics-ER 1.5 («мозок») — це модель зору-мови (VLM), яка збирає інформацію про простір та об’єкти, розташовані в ньому, обробляє команди природної мови та може використовувати розширені методи мислення та інструменти для надсилання інструкцій до Google Robotics 1.5 («руки та очі»), моделі зору-мови-дії (VLA). Google Robotics 1.5 зіставляє ці інструкції зі своїм візуальним розумінням простору та створює план перед їх виконанням, надаючи зворотний зв’язок про свої процеси та міркування протягом усього процесу.
Ці дві моделі мають більше можливостей, ніж попередні версії, і можуть використовувати такі інструменти, як Пошук Google, для виконання завдань.
Вам може сподобатися
-
Вчені щойно розробили новий штучний інтелект, змодельований за зразком людського мозку, — він перевершує LLM, такі як ChatGPT, у завданнях мислення.
-
Штучний інтелект не може розв'язати ці головоломки, які займають у людей лише секунди
-
Знайомтесь, робот-барабанщик: вчені навчають штучний інтелект грати на барабанах, як Linkin Park та AC/DC, але, схоже, йому ще є чим зайнятися
Команда продемонструвала цю здатність, попросивши дослідника використовувати правила переробки на основі її місцезнаходження, щоб сортувати деякі предмети за контейнерами для компосту, переробки та сміття. Робот розпізнав, що користувач знаходиться в Сан-Франциско, і знайшов правила переробки в Інтернеті, щоб допомогти йому точно сортувати сміття у відповідні контейнери.
Ще одним досягненням, представленим у нових моделях, є здатність навчатися (і застосовувати ці знання) в різних робототехнічних системах. Представники DeepMind заявили, що будь-які знання, отримані в ході роботи Aloha 2 (пара робототехнічних рук), гуманоїдного робота Apollo та дворукого робота Franka, можна застосувати до будь-якої іншої системи завдяки узагальненому способу навчання та розвитку моделей.
ПОВ'ЯЗАНІ ІСТОРІЇ
— Новий штучний інтелект MIT може навчитися керувати роботами, спостерігаючи за світом їхніми очима — йому потрібна лише одна камера
— Штучний інтелект Google «має свідомість», стверджує розробник-програміст перед відстороненням від роботи
— Роботизована рука Google DeepMind тепер може перемагати людей у настільному тенісі
«Роботи загального призначення потребують глибокого розуміння фізичного світу, розвиненого мислення та загального й спритного керування», – йдеться у технічному звіті команди Gemini Robotics про нові моделі. Такий вид узагальненого мислення означає, що моделі можуть підходити до проблеми з широким розумінням фізичних просторів та взаємодій і вирішувати проблеми відповідно, розбиваючи завдання на невеликі окремі кроки, які можна легко виконати. Це контрастує з попередніми підходами, які спиралися на спеціалізовані знання, що застосовувалися лише до дуже специфічних, вузьких ситуацій та окремих роботів.
Вчені навели додатковий приклад того, як роботи можуть допомогти в реальних умовах. Вони показали роботу Apollo два контейнери та попросили його сортувати одяг за кольором — білий одяг потрапляв в один, а інші кольори — в інший. Потім вони додали додаткову перешкоду, переміщуючи одяг та контейнери, змушуючи робота переоцінювати фізичний простір та реагувати відповідно, з чим він успішно впорався.
Алан Бредлі, позаштатний автор
Алан — позаштатний журналіст у сфері технологій та розваг, який спеціалізується на комп’ютерах, ноутбуках та відеоіграх. Раніше він писав для таких сайтів, як PC Gamer, GamesRadar та Rolling Stone. Якщо вам потрібна порада з питань технологій або допомога у пошуку найкращих пропозицій у сфері технологій, Алан — це саме те, що вам потрібно.
Ви повинні підтвердити своє публічне ім'я, перш ніж коментувати
Будь ласка, вийдіть із системи, а потім увійдіть знову. Після цього вам буде запропоновано ввести своє ім'я для відображення.
Вийти Читати далі
Вчені щойно розробили новий штучний інтелект, змодельований за зразком людського мозку, — він перевершує LLM, такі як ChatGPT, у завданнях мислення.
Штучний інтелект не може розв'язати ці головоломки, які займають у людей лише секунди
Знайомтесь, робот-барабанщик: вчені навчають штучний інтелект грати на барабанах, як Linkin Park та AC/DC, але, схоже, йому ще є чим зайнятися
Мета-ШІ робить перший крок до суперінтелекту — і Цукерберг більше не випускатиме найпотужніші системи для публіки
Агент ChatGPT від OpenAI може керувати вашим ПК, щоб він виконував завдання від вашого імені, але як це працює і в чому сенс?
Штучний інтелект незабаром зможе мислити так, як ми навіть не розуміємо, — уникаючи наших зусиль щодо його узгодження — попереджають провідні вчені у сфері штучного інтелекту
Найновіше в галузі робототехніки
Китайська технологічна компанія розробила моторошне ультрареалістичне обличчя робота — спостерігайте, як воно моргає, смикається та киває
Вчені навчили «робота-собаку» на базі штучного інтелекту грати в бадмінтон проти людей — і це насправді дуже добре
Знайомтесь, робот-барабанщик: вчені навчають штучний інтелект грати на барабанах, як Linkin Park та AC/DC, але, схоже, йому ще є чим зайнятися
Роботи незграбно змагалися, билися та переверталися на перших у Китаї Всесвітніх іграх гуманоїдних роботів
Дивіться, як цей робот-“канібал” стає більшим і сильнішим, поглинаючи менших роботів
Студенти створили новий «гібридний дрон» — спостерігайте, як він літає в повітрі, а потім плавно пірнайте під воду
Останні новини
Новий водневий акумулятор може працювати в чотири рази холодніше, ніж раніше, що означає щільніші та довговічніші акумулятори для електромобілів.
Зв'язок між землетрусами в Каскадії та розломі Сан-Андреас виявлено через 30 років після того, як загублене судно натрапило на ключові дані
Штучний інтелект виявляє прихований «кільцевий розлом», який спричиняє землетруси на вулкані Кампі-Флегрей в Італії
«Зростаючий напад на водні ресурси з кількох фронтів»: Вчені попереджають, що «посухи нульового дня» можуть статися до 2030 року
«Крижане цунамі» у 2024 році прорвалося через Юкон з такою силою, що вирвало дерева та русло річки.
Загадкові шматочки ДНК, які називаються «щепленнями», можуть ховатися у вашому роті.
ОСТАННІ СТАТТІ
Новий водневий акумулятор може працювати в чотири рази холодніше, ніж раніше, що означає щільніші та довговічніші акумулятори для електромобілів.
Live Science є частиною Future US Inc, міжнародної медіагрупи та провідного цифрового видавництва. Відвідайте наш корпоративний сайт.
- Про нас
- Зверніться до експертів Future
- Умови та положення
- Політика конфіденційності
- Політика щодо файлів cookie
- Заява про доступність
- Рекламуйтеся у нас
- Веб-сповіщення
- Кар'єра
- Редакційні стандарти
- Як запропонувати нам історію
© Future US, Inc. Повний 7-й поверх, 130 West 42nd Street, Нью-Йорк, штат Нью-Йорк, 10036.
var dfp_config = { “site_platform”: “vanilla”, “keywords”: “тип-новини-щоденно,serversidehawk,відеоартикл,van-enable-adviser-
Sourse: www.livescience.com