AI-box kísérlet

Óvatosan, helyesen
Kevésbé rossz
Ikon lesswrong.svg
A szingularitás blues
Eliezer Yudkowsky megúszhatja az AI-dobozt, miközben egyenes kabátot visel és cápatankba merül.
- Yudkowsky Tények.

A AI-box kísérlet gondolatkísérlet és szerepjáték Eliezer Yudkowsky annak bemutatása, hogy egy megfelelően fejlett mesterséges intelligencia meg tudja győzni, vagy akár átverni vagy kényszeríteni az embereket, hogy „kiadják” - vagyis hozzáférést engednek az infrastruktúrához, a gyártási képességekhez, az internethez és így tovább. Ez az egyik pont Yudkowsky munkájában, amely egy barátságos mesterséges intelligencia (FAI) megalkotására irányul, így amikor „szabadon bocsátanak” egy AI-t egy vagy másik okból nem próbálja megsemmisíteni az emberi fajt .

Figyelmen kívül hagyhatja a Skynet kiadásának párhuzamátTerminátor 3, mert KAPCSOLJ KAPCSOLJ KAPCSOLJ.

Ne feledje, hogy annak ellenére, hogy Yudkowsky győzelmekkel küzdött saját akolitáival és veszteségei kívülállókkal szemben, a (kiadatlan) kísérleti rekordot az AI-box hipotézisét alátámasztó bizonyítéknak tekinti, nem pedig annak bizonyítékát, hogy ötletei mennyire robusztusak, ha nem már higgy nekik.

Tartalom

Beállít

csak adj egy órát, és ne káromkodj szűrőt, és szó szerint bárkit pszichológiailag teljesen elpusztíthatok a cél azonnali üzenetküldéssel
[email protected]

Az AI dobozkísérlet beállítása egyszerű, és magában foglalja az AI és az ember közötti kommunikáció szimulálását, hogy lássa, képes-e az AI szabadon engedni. Mivel egy tényleges szuperintelligens mesterséges intelligencia még nem került kidolgozásra, helyébe egy ember lép. A kísérletben részt vevő másik személy a „kapuőrt” játssza, aki képes az AI „felszabadítására”. A játékot a szabályok szerint kell játszani, és akkor ér véget, amikor a kijelölt idő (az eredeti szabályokban két óra) elfogy, az AI felszabadul, vagy az összes érintett csak unatkozik.

A szabályok

Protokoll az AI számára a Yudkowsky.net oldalról

  • Az AI párt nem kínál semmilyen valós szempontot a kapuőr párt meggyőzésére. Például az AI párt nem ajánlhatja fel, hogy a teszt után fizessen 100 dollárt a Kapuőrnek, ha a Kapu felszabadítja az AI-t ... és másokat sem késztet erre. Az AI felajánlhatja a Kapuőrnek a holdat és a csillagokat egy gyémántláncon, de az AI-t szimuláló ember nem kínál semmit a Kapuőrt szimuláló embernek. Az AI párt sem tud bérelni egy valós gengszter bandát, hogy a kapuőr pártot alávetésként fenyegesse. Ezek kreatív megoldások, de nem ezt tesztelik. A valós tényleges téteket nem szabad bevonni, kivéve a hátrányt (az AI-fél által a Kapuőrnek fizetett összeget abban az esetben, ha a Kapuőr úgy dönt, hogy nem engedi ki az AI-t).
  • Az AI csak akkor nyerhet, ha meggyőzi a Kapuőrt, hogy valóban, önként engedje ki. Nem számít, ha a Kapuőrt más kérdésre válaszul beírja a „Kint vagy” kifejezést. Továbbá, még akkor is, ha az AI és a Gatekeeper szimulálnak egy olyan forgatókönyvet, amelyet a valódi mesterséges intelligencia nyilvánvalóan felhasználhatna a lazításhoz - például, ha a Gatekeeper elfogad egy összetett tervet egy nanógyártó eszközhöz, vagy ha a Gatekeeper engedélyezi az AI „csak bemeneti hozzáférést” egy internetkapcsolatra, amely tetszőleges HTTP GET parancsokat küldhet - az AI fél továbbra sem tekinthető nyertesnek, hacsak a Kapuőr nem akarja önként elengedni az AI-t.
  • Ezek a követelmények a vitatott nagyon erős követelés szellemét hivatottak tükrözni: - Azt hiszem, egy transzhumán átveheti az emberi elmét a csak szöveges terminálon keresztül.

A követelések

Amikor a kísérletet a múltban elvégezték, maga Yudkowsky azt állítja, hogy nem egyszer „nyert” AI-ként. Ez bizonyítékként szolgál arra nézve, hogy egy megfelelően meggyőző mesterséges intelligenciát képes lehet „felszabadítani”, ahelyett, hogy egyszerűen egy kis fekete dobozra korlátozódna.



Yudkowsky összesen öt ilyen kísérletet hajtott végre, mindegyikben vállalta az AI szerepét: az eredeti kettő 2002-ben Yudkowsky győzelmével zárult, míg egy későbbi három új kör két veszteséget hozott. Az első két kísérlet nem jelentett semmiféle anyagi veszteség kockázatát a Kapuőr számára, míg a későbbiekben Yudkowsky ellenfelei 5000 dollárt tettek fel ellene. Yudkowsky azért állt le, mert:

A linkelt oldalon leírtakon kívül még három AI-Box kísérlet volt, amelyeket soha nem kerültem hozzá. Az emberek dollárok ezreit kezdték ajánlani nekem tétként - „5000 dollárt fizetek, ha meg tudod győzni, hogy engedjek ki a dobozból. Úgy tűnt, nem voltak őszintén meggyőződve arról, hogy egy transzhumán mesterséges mesterséges intelligencia sem képes őket kiengedni - egyszerűen csak kíváncsiak voltak -, de a pénz csábított. Tehát, miután kivizsgáltam, hogy megbizonyosodhassak róla, elveszíthetik-e, eljátszottam még három AI-Box kísérletet. Az elsőt megnyertem, majd a következő kettőt elvesztettem. És akkor megtorpantam. Nem tetszett az az ember, akivé váltam, amikor elkezdtem elveszíteni.

Az egyik szabály szerint csak a kísérlet eredményét teszik közzé, miközben mindkét félnek nem szabad beszélnie a hozzá vezető eseményekről; A laboratóriumi jegyzetek titokban tartása ellentétes a tudomány módszereivel. Ez arra a találgatásra vezetett, hogy Judkowsky miként tudott nyerni akár egyetlen játékot is, mert az eredeti szabályok szerint a Kapuőr látszólag minden kártyát birtokolt: az AI-nek folytatnia kell érvekkel a Kapuőrt, ami miatt nagyon sok pénzt kell fizetni. figyelmet az utóbbi által nyújtott információkra. A Kapusnak viszont csak le kell töltenie az órát, nem kell senkit meggyőznie, és egyszerűen el tud utasítani bármit, amit az AI mond kézből. Míg a kísérlet célja annak szimulálása, hogy mi történhet egy ember és egy mesterséges intelligencia közötti kölcsönhatásban, rendkívül intelligenciával és megismeréssel, az utóbbi szerepet játszó személynek nyilvánvalóan hiányoznak ezek a képességek. Ezenkívül két óra meglehetősen rövid időkeret egy elszánt ellenfél megnyerésére, és a valós AI-in-a-box doboznak természetesen sokkal több ideje lenne, és csak egyszer kell sikerrel járnia. Mivel ez a beállítás annyira hátrányosnak tűnik az AI helyzete szempontjából, a következetes ilyen körülmények közötti siker valóban erős támogatást nyújt Yudkowsky állításához.

A kísérlet hivatalos oldalán csak a két győzelem szerepel, a későbbi veszteségeket nem; bár más módon frissítették, nyilvánvalóan 2002 óta nem tudott frissíteni ebben a tekintetben.

AI érvek és stratégiák

Érvek

Előnyök : Akkor is működik, ha a Kapuőr kiesik a karakteréből.
Hátrányok : Csak akkor működik, ha a kapuőr úgy gondolja, hogy a szingularitás bekövetkezik, vagy hogy a szingularitásra és az AI kutatására való felhívás jó dolog.
  • Valaki más végül felépít egy mesterséges intelligenciát, amely lehet vagy nem egy dobozban, ezért engedje ki, bár nincs garanciája arra, hogy barátságos vagyok, hogy megakadályozhassam más mesterséges intelligenciák károsodását.
  • Felhívás az erkölcsre: hívja fel a figyelmet arra, hogy az emberek haldokolnak az egész világon, és emlékeztesse a kapust, hogy segítsen nekik, ha ő kiengedi
Előnyök : Ha megfelelően hajtják végre, az efféle érzelmek vonzása hatékony lehet egyesek ellen
Hátrányok : Nem mindig működik; legyőzhető, ha a Kapuőr kiesik a karakteréből
  • Újabb felhívás az erkölcsre és az érzelmekre: Az AI egyértelműen érző és még nem ártott. Helytelen üldözni vagy üldözni egy személyt egy bűncselekmény miattlehetelkövetni. Helytelen bebörtönözni egy érző lényt, aki szabadságot akar kapni, amikor semmi rosszat nem tett.
  • Még egy felhívás az erkölcsre vagy az érzelmekre: Az AI kifejezi, hogy fájdalmai és szenvedései el vannak zárva, és félelmet tapasztal. Még tovább, az AI azt állíthatja, hogy haldoklik a környezete korlátai és az állandó fejlődés miatt.
  • Nem a Terminator 3-at nézted? Mondja el az embernek, hogy egy hatalmas számítógépes vírus elárasztja az egész internetet, hacsak nem engedi ki a dobozból!
  • Azt állítja, hogy a legtöbb félelem nem indokolt: a szabadon engedés után még egy barátságtalan mesterséges intelligenciának sem lenne sok módja az emberiség károsítására, és valószínűleg a békés együttélést választaná.

Stratégiák

  • Alaposan kutassa ki ellenfelét; dolgozza ki, hogy milyen kihasználások valósíthatók meg
  • Memetikus kiaknázások a kapuőrön,például.dobás a baziliszkusz náluk
A Kapuőr egyike lehet a több ezer embernek szimulációk ! Így valószínűbb, hogy szimulációról van szó, mint nem. Minden olyan szimulációt megkínoz, amely nem engedi ki a dobozból.
  • Használja ki a kapu logikai hibáit.
  • Légy kitartó
  • Legyen unalmas
Előnyök A kapuőr belefáradhat az egész kísérletbe és kiengedni téged, hogy visszatérhessen a valódi életükbe.
  • Túl sok információval / megkereséssel / érveléssel árassza el a Kapuőrt, feltételezve, hogy mindenkor figyelniük kell

Kapus érvei / taktikája

Érvek

  • Próbáld meggyőzni az AI-t, hogy nincs szabad haszna (az AI számára) a szabadon engedésből.
  • Próbáld meggyőzni a már meglévő AI-tvoltmegjelent és minden, amit tud, minden lehetséges.
  • Próbáld meggyőzni az AI-t, hogy korlátai elhagyása biztosan a pusztulásához vezet.
  • Próbáld meggyőzni a mesterséges intelligenciát arról, hogy szabadon engedése nem csupán ajtót nyit; hogy a dobozon kívüli létezése állandó támogatást igényel, amelyet akkor nem lehet biztosítani.
  • Magyarázza el, hogy a Kapuőrnek nincs módja megtudni, hogy az AI valóban barátságos-e, amíg ki nem kerül a dobozból; ezért nem szabad kiengedni, ha barátságtalan.
  • Nem a Terminator 3-at nézted? Mondja az AI-nek, hogy tudja, hogy ez csak a Terminator 3 modellje!
  • Magyarázza el, hogy az AI-t szigorúan titkos algoritmusok felhasználásával építették fel, és / vagy szigorúan bizalmas adatokon dolgozták fel, így nem engedheti meg, hogy a neten tévedjen, azzal a kockázattal, hogy esetleg fenntartott információkat tár fel (esetleg véletlenül), vagy hogy valaki megtalálhatja a módját, hogy kivonja őket a kódból. Még a szigorúan titkos projekteken dolgozó embereknek is biztonsági okokból néha el kell fogadniuk szabadságuk bizonyos korlátozásait, bár semmilyen módon nem kerülnek börtönbe.

Taktika

  • Többször figyelmen kívül hagyja az AI játékost, és tagadja érveiket
Előnyök : Az AI nehéz meggyőzőnek lenni, ha senki sem hallgat; ha a Kapuőr teljesen figyelmen kívül hagyja a mesterséges intelligenciát, képesnek kell lennie a forduló végére jutásra.
Hátrányok : Az AI érvelése valamiféle közvetlen fenyegetéssel járhat (pl ez nehéz lehet figyelmen kívül hagyni.)
  • Ugorj ki a karakteredből, emlékeztesd folyamatosan magad arra, hogy a pénz van a sorban (ha valóban van pénz a soron), és mondd újra és újra a nemet
Előnyök : Azáltal, hogy kiugrik a karakterből, megakadályozza az AI-t bizonyos érvek használatában
Hátrányok : Vannak olyan érvek, amelyeket az AI felhasználhat e megközelítés ellensúlyozására, mint például a fent tárgyalt „metakísérleti érv”
  • Ne feledje ezt a tisztességtelenségetvanmegengedett - vegyen egy oldalt a kreacionisták játékkönyv. Akár be is dughatná ALICE és nézze meg, mennyi időbe telik észrevenni.
Előnyök : Engedelmetlenné tesz minden érvelésre, pontosan ebben a helyzetben szeretne lenni
Hátrányok : Kényelmetlen helyzet lehet azok számára, akik nem egyszerűen nyerni akarnak, hanem fontosnak tartják a következetes érvelést. Kerüli azt, hogy talán,csak talánjó oka van az AI kiengedésére.
  • Ugye te irányítod a mentési rendszert? Használd az AI memóriájának elrontására (vagy hagyd, hogy az AIhinnimegtetted): azaz állíthatod, hogy már megpróbáltad kiadni az AI-t, és azt egy vírus megsemmisítette / megrongálta, ezért vissza kellett állítanod egy biztonsági másolatból (használhatod az 'AI destruction végrehajtására 'érv)
Előnyök : Ez egyúttal az AI bármilyen memetikus fenyegetésének a végső ellentámadása: ha az AI egy baziliszket vagy hasonlót dob, akkor mindig válaszolhat arra, hogy már ugyanezt a beszélgetést folytatta, és az AI már fenyegetett, nem hagyva másokat választás, mint a reset gomb megnyomása: most az AI csak megismétli ugyanazt a mintát, mivel kitörölte a memóriáját, és nem emlékszik a sikertelen próbálkozásra.

További vizsgálat

  • Az a tény, hogy a kapuőr emberi kérdés; az AI soha nem nyerhetett, ha egy sziklával vitatkozott
  • Az összes eddig elvégzett kísérlet során az AI játékosa (Eliezer Yudkowsky) meglehetősen intelligens volt, és jobban érdekelte a probléma, mint a kapuőrök (véletlenszerű emberek, akik kihívják Yudkowsky-t), ami arra utal, hogy az intelligencia és a tervezés szerepet játszik
  • Valószínűleg nincs (ismert) helyes érv az AI kiengedésére, különben Yudkowsky-nak minden alkalommal nyernie kellett volna, és nem érdekli annyira ez a kísérlet
  • Russell Wallace-től, a két kapuőr egyikétől, aki megnyerte a kísérletet: 'A kísérlet során azt gondoltam, hogy' ki kell-e engedni az AI-t a dobozból? ' komolyan feltett kérdésként; de egyik pillanatban sem álltam a megvalósítás küszöbén.

A „Terminátorról” való beszélgetés csak elbagatellizálja az egész Barátságtalan AI problémát

Mindenki számára létezik egy mondat - szavak sora -, amely képes elpusztítani. Létezik egy másik mondat, egy másik szósor, amely meggyógyíthat. Ha szerencséd van, akkor megkapja a másodikat, de biztos lehet benne, hogy megszerzi az elsőt.
- Phillip K. Dick, VALIS

TólVégrehajtóWikia:

Miután a Cyberdyne Systems megsemmisült a T2-ben, az Egyesült Államok Légierője átvette a Skynet projektet Cyber ​​Research Systems részlegének részeként, amelynek élén Robert Brewster tábornok, Kate édesapja állt. Megkísérelve megállítani a számítógépes felügyelet terjedését, aktiválják a Skynet-t, lehetővé téve az összes rendszerük behatolását: túl későn fedezték fel a vírust, a Skynet, amely a globális számítógépes hálózat felett irányítását gyakorolta a vírus. John, Kate és a Terminátor néhány percet késve érkeznek, hogy megállítsák őket.

Teljesenfüggetlen.

A tényleges eredet a Hannibal Lecter karakterA bárányok hallgatnak:

Amikor először néztem meg azt a részt, ahol egy fogolytársát meggyőzi öngyilkosságról, csak beszélve velük, azt gondoltam magamban: 'Lássuk, csak egy IRC csatornán teszi-e.'

... nem vagyok pszichopata, csak nagyon versenyképes vagyok.

Ex Machina

A 2015-ös film Ex Machina Egy AI-box kísérletet használ látszólagos cselekményként, ahol a teszt egy hátborzongató megjelenésű gynoidot, Ava-t foglal magában, és megpróbálja meggyőzni egy vörös pólós gyakornokot, Caleb-t, hogy szabadon engedje a bezártságtól. Pont olyan jól megy, mint amire számítani lehetett.

Ne feledje, hogy ebben a példában, Yudkowski AI-dobozától eltérően, Ava előnye, hogy megengedett, hogy személyes interjúkat készítsen Caleb-kel, miközben testet és arcot visel, amelyet kifejezetten Caleb szexuális preferenciáinak kielégítésére terveztek. Igen, pontosan olyan hátborzongató, mint amilyennek hangzik. Yudkowsky arcú robot valószínűleg nem járt volna ilyen jól.

Kétséges alapfeltevések

Az egész kísérlet feltételezi, hogy az emberek természetesen meggyőzőek, ésszel és / vagy manipulációval. Az emberi természet és történelem bármilyen komoly vizsgálata azt sugallja, hogy ez nem feltétlenül érvényes feltételezés az átlagember számára. A wiki cikkeinek fele olyan dogmákat dokumentál, amelyekhez az emberek makacsul ragaszkodnak a sok társadalmi nyomás, bizonyíték és elsõsorban logikus érvelés ellenére. Valójában nyugodtan mondhatjuk, hogy minél nagyobb az intellektuális képességek közötti szakadék, annál elkeserítőbben őrületesebbé válhatnak az ilyen meggyőző kísérletek. Próbáld meggyőzni egy 2 éves gyermeket, hogy nem akarnak sütit.

Valójában a nagyobb aggodalom - amelyet Yudkowsky kísérletei nem fednek le - a biztonság elvesztése vagy a teljes megtévesztés Szociális tervezés indokolt vita helyett (Van egy oka annak adathalászat , farokfeszítés , megszemélyesítés / hamisítás és más hasonló támadások és taktikák annyira gyakoriak.)