Přihlásit

Roboti řízení umělou inteligencí - budoucnost lidstva?

47

Nová metoda vytvořená na univerzitě v Berkeley, učí roboty za pomoci umělé inteligence, jak provádět složité úkoly, jako je sestavení základové desky počítače nebo police z IKEA, se 100% úspěšností!

vp131_roboti_uceni (1)

Na Kalifornské univerzitě v Berkeley výzkumníci z laboratoře robotické umělé inteligence a učení Sergeye Levina sestavili věž z 39 dokonale naskládaných kostek Jenga. Pak k věži nasměrovali robota s bičem. Bič udeřil přesně na správné místo a vyslal jeden kostku ven, zatímco zbytek věže zůstal v poklidu stát. Tento úkol, známý jako „Jenga whipping“, je koníčkem lidí s mimořádnou obratností a reflexy. Roboti jej zvládli díky nové metodě tréninku s využitím umělé inteligence, kterou vytvořil Levine a další členové týmu. Nový systém s názvem Human-in-the-Loop Sample Efficient Robotic Reinforcement Learning (HiL-SERL) je popsán ve studii, která vyšla v časopise Science Robotics. Metoda učí roboty, jak provádět složité úkoly, jako je „Jenga whipping“, se 100% úspěšností. Roboti se učí působivou rychlostí, která jim umožňuje naučit se během jedné až dvou hodin, jak dokonale sestavit základovou desku počítače, postavit polici a další.

vp131_roboti_uceni (2)
„Když robot poprvé zvládl výzvu Jenga, „opravdu mě to šokovalo,“ řekl hlavní autor studie Jianlan Luo, postdoktorandský výzkumník na Kalifornské univerzitě v Berkeley. „Úkol Jenga je pro většinu lidí velmi obtížný. Zkoušel jsem to a měl jsem 0% úspěšnost.“ (My jsme v redakci sestavovali stěnu z Ikea. Úspěšnost byla 72% po pěti dnech...) V posledních letech se oblast učení robotů snaží vyřešit problém, jak naučit stroje nepředvídatelným nebo složitým činnostem, na rozdíl od jediné akce, jako je opakované zvedání předmětu z určitého místa. Aby se tento problém vyřešil, Levineova laboratoř se zaměřila na takzvané „učení se zpětnou vazbou“. Při učení se zpětnou vazbou, se robot pokouší o úkol v reálném světě a s využitím zpětné vazby z kamer se učí ze svých chyb, aby tuto dovednost nakonec zvládl.
vp131_roboti_uceni (2)
V Berkeley vstoupil do robotického učení také lidský činitel, proces učení se tak výrazně urychlil. Pomocí speciální myši, která robota ovládá, může člověk robota korigovat a tyto korekce lze začlenit do robotovy příslovečné paměťové banky. Pomocí učení zpětnou vazbou robot analyzuje součet všech svých pokusů – s asistencí i bez ní, úspěšných i neúspěšných – aby lépe vykonával svůj úkol. Luo uvedl, že člověk musel zasahovat stále méně, jak se robot učil ze zkušeností. „Musel jsem robota hlídat asi prvních 30 % pokusů“ řekl. Laboratoř podrobila svůj robotický systém řadě složitých úkolů, které překračovaly rámec „Jenga whipping“. Robot obracel vejce na pánvi, podával předmět z jedné paže do druhé, sestavil základní počítačovou desku, palubní desku auta a rozvodový řemen. Výzkumníci vybrali tyto úkoly, protože byly rozmanité a Luovými slovy představovaly „výzvy pro provádění robotických úkolů ve složitém reálném světě“. Výzkumníci také testovali přizpůsobivost robotů inscenováním nehod. Donutili robotickou ruku k otevření, aby upustila předmět nebo pohnula základovou deskou, když se robot pokoušel instalovat mikročip, a tak ho naučili reagovat na měnící se situaci, se kterou by se mohl setkat mimo laboratorní prostředí. Na konci tréninku byl robot schopen tyto úkoly provádět správně ve 100 % případů. Výzkumníci porovnali své výsledky s běžnou metodou „kopíruj mé chování“, známou jako behaviorální klonování. Jejich nový systém roboty zrychlil a zvýšil jejich přesnost. Tyto metriky jsou klíčové, uvedl Luo, protože laťka pro využití robotů je velmi vysoká. Luo zdůraznil, že zejména výrobní procesy, jako jsou ty, které se často používají pro elektroniku, automobily nebo letecké díly, by mohly těžit z robotů, kteří se dokáží spolehlivě a adaptabilně naučit řadu úkolů. Dalším krokem by podle Luo mělo být předprogamování systému se základními schopnostmi manipulace s objekty, čímž by se eliminovala potřeba učit se tyto dovednosti od nuly a místo toho by se rovnou přešlo k osvojování složitějších dovedností. Laboratoř se také rozhodla zveřejnit svůj výzkum jako open source, aby jej mohli používat a dále na něm stavět další výzkumníci. „Klíčovým cílem tohoto projektu je učinit technologii stejně dostupnou a uživatelsky přívětivou jako je třeba iPhone,“ řekl Luo. „Pevně ​​věřím, že čím více lidí ji bude moci používat, tím většího pokroku můžeme dosáhnout.“ Fotka od Bob McEvoy z Pixabay Fotka od Alexandra_Koch z Pixabay


Další články z kategorie

Život bez smrti a stárnutí do roku 2045

323

vp127_nesmrtelny1jp

Smrt bude „volitelná“ a proces stárnutí bude „reverzibilní“ do roku 2045, hlásí dva genetičtí inženýři - José Luis Cordeiro a matematik z Cambridge David Wood. Při představení jejich společné knihy „Smrt smrti“ v Barceloně uvedli, že nesmrtelnost je reálná vědecká možnost, která může nastat mnohem dříve, než se původně myslelo.

Cordeiro a Wood naznačují, že lidé budou moci...

Mozek na stráži

636

mozek_1

Dobře se vyspat je někdy věda. Doslova. Výzkumem spánku se dnes seriózně zabývají mnozí vědci a přichází se stále novými poznatky. Se zajímavou studií, která by se dala volně přeložit jako „Náš mozek na stráži”, přišli vědci z University of Salzburg.

Tato studie se věnuje tomu jakým způsobem reaguje náš mozek na známé a neznáme zvuky když se pokoušíme usnout a později ve fázi...

Každodenní návyky, které poškozují mozek

410

vp93_mozek1

Zvyk je železná košile, říká jedno krásné české přísloví. Některé zvyky máme natolik zažité, že si ani neuvědomujeme jejich škodlivý vliv na naše zdraví a zdraví mozku zejména. Některé každodenní zdánlivě neškodné návyky mohou být natolik špatné, že mohou způsobit trvalé poškození mozku. Pro příklady netřeba chodit daleko.

Lidský mozek je nejdůležitější orgán našeho...

Psaní rukou zvyšuje výkon mozku

282

vp103_mozek a psani (2)

V dnešním technologicky závislém světě chytrých telefonů a notebooků není divu, že pro většinu dětí je pohodlnější používat klávesnici než pero či tužku. V mnoha ohledech je snazší používat notebook k zapisování poznámek ve třídě, protože tato metoda umožňuje rychlé psaní poznámek a studenti je mohou v případě potřeby snadno sdílet.

Nedávné studie však ukazují, že existuje...