Miután előző cikkünkben részletesen foglalkoztunk a mesterséges intelligencia (MI/AI) várható hatásaival az üzleti életre, most végigmegyünk a fontosabb MI-alkalmazások, szolgáltatások listáján. Lássuk is, mutatjuk a szolgáltatásokat és összefoglaljuk, mi mindenre használhatod és mennyibe kerül, ha – teljesen vagy részben – fizetős.
Felsorolásunkban persze a nyilvánosan, bárki számára elérhető szolgáltatások egy részét tudtuk számba venni, számos cég saját rendszereket használ egyrészt adatvédelmi okokból, másrészt a saját igényeikre, illetve egy-egy szakterületre szabva. Saját például a Telekom Vandája, amely idehaza már hat éve működik. Sőt, a mára publikusan elérhető megoldásokat egy részét is a cégek belül kezdték el előbb használni, mielőtt már eljutott olyan szintre, hogy értékesítsék is azt.
ChatGPT (OpenAI)
Az úttörő. Értelemszerűen a generatív, azaz szöveget vagy egyebeket létrehozó MI-t, illetve az azt működtető, eszméletlen mennyiségű feldolgozott szövegen alapuló nagy nyelvi modellt (large language model, LLM) nem ők találták fel, viszont amikor 2022 fagyos novemberében rászabadították a világra, egy csomó olyan ember kezdett el hamar éjájozni, aki előtte nem is hallott ilyesmiről. Már kipróbálható a GPT-4o, amely az előzetes ígéretek szerint valós időben tud kommunikálni hanggal (ahogyan mondjuk Siri), illetve kamerakép alapján is.
Mire jó? A ChatGPT alapvetően egy csetbot, amitől kérdezel és válaszol. Megkérdezheted tőle, hogy milyen ebédet főzz a fiad vegán barátnőjének, mi Kanada valutája és mennyi 263 a 26-odikon, de ennél szofisztikáltabb kérdésekre is válaszol. Például megkérheted, hogy magyarázza el neked a HTML alapjait úgy, hogy egy ötéves is megértse, egy hosszabb interjúból javasoljon egy idézetet címnek, fogalmazzon át neked egy e-mailt hivatalosra és van, aki fordításra is használja, bár erre vannak jobb, dedikált programok (például a DeepL). Emellett a kódírásban is segít, vagy éppen ötletelésre, hosszabb szövegek összefoglalására, felturbózásához is használható.
Mennyibe kerül? A GPT-3.5-ös modellt alkalmazó alap verzió ingyenes. A GPT-4-eset használó Plus változat 20 dollárba, azaz mintegy 7220 forintba fáj havonta. Ez nem csak újabb és színvonalában jobb, de kiegészítőket is fel lehet rá tenni (akárcsak a böngésződben), amivel internetes linkeket, PDF-eket, YouTube-videókat is tud értelmezni, a DALL-E segítségével képeket is tud alkotni és így tovább. A GPT-4o-ról a cég korábban azt jelentette be, hogy ingyenes lesz. Ez annyi kitétellel igaz, hogy az ingyenes verzióban is használható és itt is tud már csatolmányokkal dolgozni (egy feltöltött képről felismerte például Orbán Viktort), viszont ott korlátozott alkalommal.
Copilot (Microsoft)
Ez valójában nem egy program, hanem egy kiegészítő-rendszer az összes megszokott Microsoft 365 (vagy ahogyan már nem nevezik, de mindenki ismeri: Office) alkalmazáshoz. Az egész a Microsoft és az OpenAI nagyszabású egüyttműködésének eredménye. Van is a rendszernek egy ChatGPT-szerű csetfelülete is, ahol nem csak klasszikus kérdéseket tehetünk fel, hanem egyfajta kezdőlapként onnan elérhetjük a főbb Microsoft-appokkal kapcsolatos információinkat is.
Mire jó? Ez programfüggő. A Wordben például vázlatot ír a korábbi jegyzeteinkből, megformázza és illusztrálja úgy, ahogyan a korábbi doksijaid kinéztek. Az Excelben kimutatásokat, grafikonokat készít adatsorokból és kiemeli a fontosabb összefüggéseket. PowerPointban egy nyers szövegből vázlatosan elkészíti helyetted a diákat, segít azokat illusztrálni, vizuálisan feltölteni és animálni. A GitHub kódíró oldalon pedig besegít a programok írásába. A csetfelületnek van Designer néven egy képalkotó rendszere is. Emellett fontos még megemlíteni a Bing keresőbe beépített csetbotot, aminek a nagy előnye több hasonló rendszerhez képest, hogy – egy keresőtől elvárható módon – mindenhol linkeli a válaszok forrását is.
Mennyibe kerül? Ennek is van egy ingyenes változata, de abban az irodai appok MI-kiegészítői nincsenek benne. Ahhoz meg kell venni a fizetős verziót a Microsoft 365 költségén felül (hiszen ugyebár az sincs ingyen!), ami személyes használatra havi 8 790 forintba kerül felhasználónként, üzleti és nagyvállalati felhasználásra pedig évente 337,20 euróba (ez kerekítve 130 ezer forintnak felel meg) kerül, felhasználónként, áfa nélkül. A GitHub-kiegészítő magánszemélyeknek havonta 10 dollárba (mintegy 3572 forintba) vagy évente 100 dollárba (úgy 35 727 forint) kerül, az üzleti csomag 19 dollár (6 790 forint), a nagyvállalati pedig 39 dollár (13 939 forint) havonta, felhasználónként.
Claude (Anthropic)
Ez egy idehaza kevésbé ismert nagy nyelvi modell.
Mire jó? Alapvetően hasonló dolgokra, mint a ChatGPT és bár az elején kicsit tiltakozott ellene („a magyar nyelv nem volt része az eredeti nyelvképzésemnek. Azonban megpróbálom a legjobb tudásom szerint megérteni a kérdéseit, és angolul válaszolni”), egész használhatóan beszél magyarul is.
Ráadásul itt is lehet már az ingyen elérhető verzióban csatolmányokról kérdezni, noha valamiért úgy van programozva, hogy embereket ne nevezzen meg (a magyar kormányfő képére azt írta, hogy „valószínűleg egy vezető politikus vagy magas rangú kormánytisztviselő Magyarországon”, de „sajnos nem nevezhetem meg név szerint az illetőt az eredeti utasításaimnak megfelelően, annak ellenére, hogy felismerhetőnek tűnik a személye”). Kérdésekre válaszol, szövegekkel dolgozik, összefoglal, tippeket ad és így tovább, a ChatGPT-hez hasonló lehetőségekkel és korlátokkal.
Mennyibe kerül? Az ingyenes verzióval tíz parancsot adhatunk a rendszernek naponta, a 18 eurós (6 933 forint) Pro verzióval pedig ötvenet.
Alrite (Régens)
Sok program igyekszik hallott szöveget fel-, illetve leiratozni és ez angolul elég jól is működik (gondoljunk csak a YouTube automatikus felirataira), de a magyar nyelv már nehezebb dió. Mázlink, hogy van egy olyan hangfelismerő szoftver, amit egy magyar cég fejlesztett, így elbír a mi nyelvünkkel is.
Mire jó? Egy interjú hangfelvételét feltöltve például pillanatok alatt szöveges leiratot készít belőle. Ezt persze ilyenkor egy embernek még át kell néznie, de ez már sokkal kevesebb munka, mintha nekünk kell bepötyögni az egészet. A kérdés-válaszok tagolását is elég pontosan érzékelni szokta, egyedül néha kevésbé ismert intézménynevekkel gyűlik meg a baja, de ezzel együtt is meglepően pontos. Emellett élőben is diktálhatunk neki, ahogyan videókat is tudunk vele feliratozni, akár élő adást is, a magyar mellett angol, német, spanyol, francia, holland, lengyel, dán, török, portugál, olasz és svéd nyelven is.
Mennyibe kerül? Havonta fél órányi hanganyag mennyiségéig ingyenesen használhatjuk a leiratozó rendszert (ez egy megújuló keret), ezután magánszemélyként alap funkcionalitással 33, videók feliratkozásával és a felirat ráégetésével 44 forintos percdíjjal folytathatjuk. Üzleti csomagjukban ugyanez valamivel drágább, 53 és 80 forint percenként.
Dall-E (OpenAI)
Mire jó? A ChatGPT cégének képgenerátora. Szöveges utasításokból készít vizuális anyagokat.
Mennyibe kerül? Korábban elérhető volt a 2-es verziója, ezt azonban már elérhetetlenné tették. Azóta a 3-as verzió használható a havonta 20 dollárba kerülő ChatGPT Plusszal. A két rendszer között egyébként igen jelentős a minőségbeli eltérés, az újabb változat ugyanazokra a parancsokra is már sokkal élethűbb és szebb eredményeket produkál.
Firefly (Adobe)
A számos konkurens mellett természetesen a kreatív szakma igen fontos szoftvereit működtető Adobe sem mehetett el.
Mire jó? Ezzel is szöveges leírásból tudunk képet generálni, többféle stílusban. Vannak korlátai, például amikor kértem tőle egy képregényszerű alkotást, amelyen Steve Jobs Pepsit iszik Micimackóval, akkor nem teljesítette (illetve kidobott négy képet, csak semmi köze nem volt hozzájuk).
Valószínűleg azért, mert a programról szóló leírás szerint azt a már közkincsnek számító anyagok mellett az Adobe saját stockfotó-gyűjteményén tanította be (bár a szövegben használt „például” szó alapján lehetnek más „engedélyezett” források is), és a program csak olyan alapanyagból dolgozik és olyasmit hozhat létre, ami elférne a kereskedelmileg használható stockfotók gyűjteményében. Ezen kívül tényleg nagyon izgalmas és szép anyagokat köp ki, bár a szokásos MI-kép gyerekbetegségek azért láthatók rajta. A kérésemre generált, Duna felett röpködő sárkányok egyikének például egy szárnyat rajzolt (vagy csak furcsa takarásban van a másik), a szemekkel is gondban volt és a két sárkány közötti ejtőernyős-szerű figura is nehezen értelmezhető.
Külön fényképszerű grafikát is lehet kérni, itt például meglepően élethű repkedő pingvineket alkotott. (Prompt, azaz a beütött parancs: Fénykép, amelyen három ember találkozik egy kietlen pusztaság közepén, kezet fognak, átadnak egymásnak egy csomag élelmet benne kakaóval és megtekintik a fejük fölött repkedő pingvineket.)
Mennnyibe kerül? Az ingyenes verzióban havonta 25 képet készíttethetünk, havi 5,85 euróért (2 256 forint) pedig százat és vízjelet sem tesz a sarkába.
Midjourney
A talán legismertebb MI-képgenerátor.
Mire jó? Ugyanarra, mint a másik kettő, szövegből grafikákat állít elő. Annyi különbséggel, hogy ezt a Discord csetfelületen lehet használni, ahol az előfizetést követően valamelyik aktuális newbies csatornára az /imagine felütést követően lehet beütni a promptokat.
Mennyibe kerül? Ebből már nincs ingyenes verzió, az alapcsomagban havi tíz dollárért (3 554 forint) úgy kétszáz képet készíthetünk havonta, a 30 dollárnál (10 660 forint) kezdődő és 120 dollárnál (42 642 forint) végződő magasabb csomagokban ez már nincs limitálva és a készítés is gyorsabbá válik.
Grammarly
Ez a cég egyébként a Labához annyiban hasonlít, hogy szintén Ukrajnából indult. Ha angol nyelven (is) írsz, akkor a Wordhöz hasonló helyesírás-ellenőrzést végez el.
Mire jó? Különböző weblapokon és appokban (például a Google Dokumentumokkal vagy a Slackkel is össze lehet kapcsolni) tudod az angol nyelvű szövegedet vele lecsekkolni. A helyesírás mellett elemzi a szövegeid hangvételét és a nyelvhelyességre, a szebb, igényesebb megfogalmazásra is tesz javaslatokat.
Mennyibe kerül? Az ingyenes változatban ez utóbbi csak korlátozottan érhető el, a fizetős csomagban korlátlanul. Utóbbi emellett még plágiumot is ellenőriz, 12 eurós sima prémium (4 622 forint) és 15 dolláros (5 328 Ft) üzleti előfizetésért cserébe.
Suno
A pár kattintással valódinak tűnő dalokat egészen niche műfajokban is legyártó oldal hazánkban is népszerű, az egyik magyar hírportál nemrég versenyt is hirdetett a többnyire Sunóban generált MI-daloknak.
Mire jó? Megadhatjuk a szöveget és a dal elvárt stílusát, amelyből kétféle verziót is elkészít. Bár időnként nehezen találja meg, mit kéne refrénként kiemelni, olykor a végeredmény szinte olyan, mintha valamelyik rádiót kapcsoltuk volna be. (A bónusz persze az, ha a szöveget is valamelyik MI-csetbottal íratjuk meg.)
Mennyibe kerül? Míg az ingyenes verzióval naponta tíz dalt tudunk készíteni (ez a gyakorlatban öt párt jelent öt promptból), havi tíz dollárért (3 560 forint) már ötszázat, havi 30 dollárért (10 677 forint) pedig kétezret. Emellett az ingyenes verzióval szemben az így elkészült dalokat kereskedelmi célokra is felhasználhatjuk és tíz darabot is készíttethetünk belőlük egyszerre.
Canva
A többség által ismert grafikai program nem maga egy MI-szolgáltatás, hanem abba integráltak több ilyen megoldást is.
Mire jó? Például MI-vel ki lehet bővíteni a képeket – noha ennek néha vannak fura végeredményei. Ebből a képből például ezeket alkotta, egyik sem olyan igazán jó. (Itt írja amúgy a rendszer, hogy a kezeket, arcokat vagy áttetsző háttereket tartalmazó képek kiterjesztése nem mindig működik jól – de erre pont nem igaz egyik sem.)
De a Canvának is van parancsok alapján működő képgenerátora, illetve videókészítője is. Úgy tűnik, az ismert emberek nevei és a márkák ennél a képgenerátornál is le vannak tiltva. Így a Budapest felett repkedő, Dr Peppert szürcsölő Barack Obamát visszadobta, ugyanez menedzserrel és sima üdítővel átment ugyan, de elég groteszk végeredménnyel:
Vannak amúgy abszolút vállalható végeredményei is, mondjuk egy egész korrekt grafikát generált nekem az egy toll barna logója kifejezésre angolul. Jobbára amúgy is ilyesmikre szánhatták, hogy ezt utána hozzá tudjuk adni a képeslapunkhoz vagy a weblapunkhoz. (Bár a canvás tervek logóként egy az egyben történő felhasználása nem feltétlenül javasolt.)
Emellett ha a sablonkeresőbe kicsit hosszabban, promptszerűen beírjuk, hogy nyitvatartási felirat az állatorvosi rendelőmbe, akkor is egészen használható sablonötleteket dob fel, illetve a Canvának is van saját szöveggenerátora, igaz, magyarul még nem tud. Angolul egy elég átlagos, de korrekt szülinapi köszöntőt írt, igaz, a Grammarlynak azért akadt pár ötlete, hol fogalmazhatott volna választékosabban. Ezen kívül vannak egyéb, MI-megoldások is, például egyfajta elrendezésű anyagot át lehet alakítani másféle dokumentummá, az összes lehetőségből itt lehet szemezgetni. Illetve a Canvához is vannak külső kiegészítő appok, azok közt szintén találunk MI-szolgáltatásokat.
Mennyibe kerül? A kibontáshoz, illetve az olyan funkciókhoz, mint a képelemek kiradírozása vagy a háttér eltávolítása, már a fizetős verzióra lesz szükségünk 15 dollárért (5 320 forint), a kereséshez nyilván nem, a kép- és szöveggenerátort pedig használhatjuk az ingyenes változatban is, de csak kevesebbszer.
ClickUp
Itt szintén egy ismert szolgáltatás MI-integrációiról van szó. A feladatok strukturálásától azok elszámolásáig sok mindenre jó, igaz, elsősorban a nagyobb cégekre szabott ClickUp is elkészítette ugyanis saját, szerényen csak Brainnek keresztelt MI-kiegészítőjét.
Mire jó? A szokásos csetbotszerű válaszokat adja, a cégünk feladatai és azok állapota alapján. Szóval megkérdezhetjük tőle, min kéne legelsőnek elkezdeni dolgoznunk, melyik feladatainkat blokkolja valami, de összefoglalja nekünk a szabadságolási szabályokról szóló doksit, a legutolsó meetingen elhangzottakat és azt is megmondja, ki dolgozik ma a marketinges csapatból és min dolgoznak ma a dizájnerek. Szemléletesen azzal igyekeznek demonstrálni mindezt, hogy a bemutató oldalukról rögtön kérhetünk a rendszertől egy összefoglalót.
Mennyibe kerül? A ClickUp alapdíján felül (ami cégmérettől függ) 5 dollárba (1 775 forint) kerül felhasználónként havonta.
A robotkontent kiszúrható, de nehezen kiszűrhető
Bár aki egy ideje próbálgatja már mondjuk a ChatGPT-t, hamar felismeri az LLM-ek által kiköpött szövegek jellemzően pontokba szedett struktúráját, a sokszor erőlködve lazaságra törekedő, de mégis gépies megfogalmazását, az MI-tartalmak szűrése mégsem olyan egyszerű. Bár többen próbálkoznak különböző detektorokkal, ezek magyarul nem igazán működőképesek, sőt: angolul sem az igaziak. Az OpenAI például ha csak átmenetileg, további fejlesztések idejére, de vissza is vonta a saját rendszerét, mert az annyira tökéletlen volt, hogy a saját ChatGPT-jük is át tudta verni.
Az ilyen rendszerek jellemzően pont arra épülnek, hogy a gépi szöveg kiszámíthatóbb, szabályszerűbb, mint az emberi, mégis mind a fals pozitív, mind a fals negatív észlelések jelentősek és sok problémát okozhatnak. A Facebookon és a Meta más platformjain a közelmúltban megjelent egy kapcsoló, ahol önbevallásos módon kérik, hogy jelezzük a posztoknál, ha abban MI-tartalom szerepel. Ezen túl a vízjelezések jelenthetnek jó megoldást a vizuális anyagoknál, amelynek vannak láthatatlan, például a képek, videók metaadataiban tárolt változatai is, amelyet nem lehet a legegyszerűbb felhasználói szoftverrel levágni a képekről.
Bár az előző cikkünkben idézett, a Bizalmi Kör, az RSM Hungary Zrt. és az Egyensúly Intézet által készített kutatásban résztvevő 261 cégvezető 63 százaléka mondta, hogy használják szövegírásra az MI-t, jelenleg idehaza ennek az egyik legkomolyabb korlátja a nyelvünk maga. Hiszen magyarul egyelőre a ChatGPT-vel generált szövegek inkább hajaznak egy Google Fordítóval készült Facebook-posztra, mint mondjuk egy igényesen megírt újságcikkre. A Nemzeti Média- és Hírközlési Hatóság (NMHH) friss tanulmánya szerint a magyarországi média- és hírközlési piacon „a ChatGPT-t már mindenki kipróbálta, de egyelőre jellemzően inkább nehézségeket tapasztaltak vele, mintsem hatékonyságnövekedést”, aminek a kompetenciahiány mellett oka lehet, hogy magyarul még ezek a megoldások kevésbé fejlettek.
Ehhez érdemes hozzátenni, hogy a generatív rendszereknek általában közismert problémája jelenleg a hallucináció, amikor sosemvolt eseményeket is ismerni vél egy rendszer és ha olyan a beletáplált adatanyag, akkor durván elfogult is lehet a végeredmény. Mindenesetre az NMHH anyaga egy-két éven belül már életszerűnek tartja, hogy MI-t használjanak idehaza hírügyelethez, forrásellenőrzésre vagy álhírszűrésre és szerintük teljesen géppel készült, csak ellenőrzésre váró anyagok is feltűnhetnek majd. Külföldön pedig már most bizonyos cégeknél elkezdték leépíteni a foglalkoztatott szövegírókat, valahol pedig már az újságírókat is próbálják így robotra cserélni. Ugyanakkor feltételezhető, hogy ez a folyamat fel is értékelheti a „kézműves” tartalmakat. Elvégre az ideális forgatókönyvek szerint a repetitív feladatok automatizálása mellett a kreativitás marad meg az emberek kezében.
Végig kell gondolni a bevezetést
Az ígéretes reklámvideók sok cégvezetőt felvillanyozhatnak, azonban mielőtt átgondolatlanul rászabadítunk rendszereket céges folyamatokra, érdemes elolvasni pár olyan sztorit is, ahol félrement az MI-bevezetése, mert azok is igen tanulságosak. Idén februárban a kanadai nemzeti légitársaságnak például 21 millió forintnak megfelelő kártérítést kellett kifizetnie egy, a nagyanyját gyászoló férfinak. A cég csetbotja ugyanis félretájékoztatta az amerikai kontinensen bevett, gyászolóknak nyújtott rugalmasabb és olcsóbb repjegyekkel kapcsolatban. Figyelemreméltó, hogy a cég azzal védekezett, hogy szerintük nem felelősségre vonhatók a csetbotjuk állításaiért, ezt az érvelést persze a bíróság nem fogadta el.
Ha már ügyfélkapcsolat: még a tavalyi év végén több amerikai Chevrolet-kereskedésnek is kínos pillanatokat hozott, amikor ChatGPT-alapú ügyfélszolgálati csetbotot vetettek be. Az még a kisebbik probléma volt, amikor a trollkodó ügyfelek rávették a rendszert, hogy az a Teslát ajánlja és segítsen is azt megrendelni. Az már nagyobb gond, amikor sikerült azt is kimondatni vele, hogy a legújabb Tahoe SUV-t egy dollárért kínálja, kötelező érvényű egyezségként, melyből nem lehet kihátrálni. Bár végül nem okozott a kereskedésnek tényleges jogi gubancot a neten nagyot ment trollkodás, ez az eset is óvatosságra int. Szintén a ChatGPT-vel járt pórul az az amerikai ügyvéd, akinek nemlétező precedenseket dobott ki a rendszer és azokat próbálta felhasználni a tárgyalóteremben.
De nemcsak a publikus MI-rendszerek, hanem a saját fejlesztések is okozhatnak gondot. Bizonyos esetek pedig azt igazolják, hogy ha az eddig megszokott munkafolyamatainkat tápláljuk bele egy MI-be, az sajnos újratermeli az emberi elfogultságokat a rasszizmustól az életkori alapú megkülönböztetésig. Az amerikai foglalkoztatási esélyegyenlőséggel foglalkozó hatóság két éve például beperelte az iTutor Group nevű céget, állítva: a HR-es rendszerük automatikusan elutasítja az 55 év feletti nők és a 60 feletti férfiak jelentkezéseit. Bár ők ezt tagadták, végül peren kívül mai árfolyamon több mint 129 millió forintnak megfelelő összeget fizettek ki kétszáznál is több elutasított jelentkezőnek és változtatniuk kellett a működésükön.
Azt hinnénk, hogy a legnagyobb techóriások nem esnek bele abba a hibába, hogy a konkurencia utáni loholásban túl hamar élesítenek kezdetleges fázisban lévő MI-termékeket. Nos, a Google a tengerentúlon elérhetővé tett MI-válaszadása nem épp ezt mutatja. Mindez persze nem azt jelzi, hogy az MI-implementáció nem fontos, hanem hogy alaposan végig kell azt gondolni, célszerű biztosra menni és persze kellőképpen egyeztetni mindent a kollégákkal és szakemberekkel. Ahogyan azt is érdemes figyelembe venni, hogy egy-egy bevezetés tényleg növeli-e a hatékonyságot, nem öncélú-e. Itt zárásként érdemes még visszatérnünk Molly White kutató-szotvermérnők előző cikkünkben idézett írásához. „Ha MI-vel írsz e-mailt, a címzett pedig MI-vel olvassa azt el – fogalmaz –, nem lehet, hogy hanyagolnotok kéne az egészet?”