The Open Interpreter - The First Open Source Language Model Computer

Hozzászólások

A Szép új világozás (a Hitlerezéshez, kommunistázáshoz, 1984-ezéshez, Terminátorozáshoz, atomháborús/zombivírusozós rettegtetéshez) hasonlóan teljesen kiüresedett és elhasznált mém, amit ráragasztunk kb mindenre. Minden találmány egy idő után vagy megy a kukába (mert eleve szar ötlet volt, leggyakoribb eset), egy ideig káros lesz, aztán megregulázzuk, és akkor jó lesz (második legvalószínűbb), esetleg eleve telitalálatként rögtön jó lesz (ritka eset).

Szerkesztve: 2024. 03. 22., p – 07:12

Végignézni azért nem fogom, de átolvasva a Docs rész elejét, megpróbálom összefoglalni és bullshitmentesíteni magamnak:

írtak egy szöveges/beszédalapú shellt, amely meglehetősen korlátozott fájl és internetes kommunikációs feladatokat képes végrehajtani viszonylag sok idő alatt. Kb lefedi az olyan Unix alapparancsokat, mint ed, mail, cp, ..., de kiterjesztve grafikus dolgokra is, böngésző, PDF nézegetőre, kb úgy, ahogy egy AppleScript vagy VBScript képes interakcióba lépni GUIs alkalmazásokkal.

De, mint shell, sehol nincs még a Windowsban benne lévő explorer.exé-hez (volt File/Program Managerhez) képest sem, bár a MS dolgozik azon, hogy egyre lassabb szar legyen a Windows desktop, de még mindig sokkal egyszerűbb egy dokumentumra duplakattintani, beleírni, menteni, és beleejteni egy emailbe (vagy jobb klikk, küldés), mint mindezt elmondani.

A videóba belenézve kicsit az az érzésem, mint amikor az okosotthonnál valaki Alexán és a világ másik végén lévő AWS instancokon keresztül próbálja széles nyelvcsapásokkal artikulálva a lámpát felkapcsolni, ahelyett, hogy rábaszna a kapcsolóra fél másodperc alatt. Merthogy a grafikus GUI-kat nem véletlenül találták fel, nem véletlen használunk vim-et (VSCode-ot, Word-ot) ed helyett, és nem véletlen vált az Excel, World Wide Web, Photoshop kultúrálisan elfogadott eszközökké: az embernek van két keze, tíz ujja, meg előrenéző szeme, amelyekkel hatékonyabban és gyorsabban tud bizonyos feladatokat végrehajtani, mint körülírni.

Gondoljunk már bele, egy mozijegy vásárlásakor hány oldalt kell végignézni, melyik moziban megy, hol van jó hely, ne a szélén jegyen, jegy vásárlásakor Simple fiókba belépni, nyilván megoldható beszélgetve, de kinek van erre ideje, előveszem az iPadet, és megoldom negyedidő alatt.

Szóval nem vagyok meggyőzve túlságosan.

Esetleg, ha mindez cloud nélkül, lokálisan is tud futni, akkor bizonyos speciális esetekben (nem vagyok gép előtt, vezetek) bizonyos dolgok elvégzésére alkalmas, de akkor meg kb egy feljavított Siri/Alexa. Azok se váltották meg a világot.

De jelen formájában csak meglovagolja a trendet, ha az NVDA ötszörösére nő éppen, akkor a hátán utazva minimális erőfeszítéssel is el lehet néhány kockázatitőke-befektető fejét (és pénztárcáját) csábítani.