3B. Képességek & korlátok
Videó átirat
Ez a videó teljes átirata. Használd a böngésző kereső funkcióját (Ctrl+F / Cmd+F) specifikus fogalmak kereséséhez.
Bevezetés
Most vizsgáljuk meg, mit tud és mit nem tud a generatív MI.
Az LLM-ekre, mint például a Claude-ra összpontosítva, gondolj erre úgy, mint egy új kolléga megismerésére.
Az erősségeik és korlátaik megértése segít hatékonyabban együttműködni.
Generatív MI képességei
Kezdjük azzal, amiben ezek a rendszerek rendkívül jók.
Lehet, hogy meglepődsz, milyen sokoldalúak a modern nyelvi modellek.
Nyelvkezelési készségek
Olyan nyelvi készségekkel rendelkeznek, amelyek néhány évvel ezelőtt még lehetetlennek tűntek:
- Hangodhoz illő e-maileket fogalmaznak
- Hosszú jelentéseket sűrítenek világos összefoglalókba
- Nyelvek között fordítanak
- Összetett témákat magyaráznak el számtalan területen, a mikrobiológiától a marketingstratégiáig
Feladatváltási képesség
Különösen figyelemre méltó, hogy ezek a modellek hogyan tudnak váltani a különböző feladatok között anélkül, hogy további képzésre lenne szükségük.
Példa: Ugyanaz a rendszer, amely segít verset írni vagy ötleteket gyűjteni a születésnapi bulidhoz, megfordulhat, és segíthet megérteni a kvantumszámítástechnika fogalmait, vagy elemezni a negyedéves üzleti trendeket, mindezt egyszerű beszélgetésen keresztül.
Kontextuális emlékezet
Ezek a modellek képesek fenntartani a beszélgetés fonalát is, emlékezve arra, amit korábban megbeszéltetek, és építve rá.
Példa: Ha futólag megemlíted a projekt határidejét, és később a beszélgetés során visszautalsz rá, az MI általában megérti, miről beszélsz, akárcsak egy emberi beszélgetőpartner.
Külső eszközök integrációja
Sok modern LLM már képes a saját tudásán túlra is nyúlni külső eszközökhöz és információforrásokhoz csatlakozva, lehetővé téve számukra, hogy:
- A weben keressenek
- Fájlokat dolgozzanak fel
- Más alkalmazásokat használjanak képességeik bővítésére
Ez drámaian kibővíti, miben tudnak segíteni.
Generatív MI korlátai
Azonban, mint minden technológiának, az LLM-eknek is vannak bizonyos korlátaik.
1. Képzési adatok korlátai
Tudás-leállási dátum
Az LLM-eknek van egy tudás-leállási dátumuk a képzésük időpontja alapján, amely után nincs veleszületett tudásuk a világról.
Példa: Egy 2024. novemberi leállási dátumú modell azt jelenti, hogy nem képezték 2024. november utáni adatokon.
Analógia
Képzelj el valakit, aki egy adott időpontban internet-hozzáférés nélkül vonult el egy elvonulásra. Nem tudna azokról az eseményekről, amelyek távozása után történtek.
A modelleknek olyan eszközökre van szükségük, mint a webes keresés, hogy többet tudjanak meg a legújabb fejleményekről.
2. Hallucinációk
Mi a hallucinäció?
A képzési folyamat nem ellenőrzi a képzési adatok minden tényét. Ez azt jelenti, hogy a modellek:
- Néha megtanulhatnak és reprodukálhatnak pontatlanságokat
- Hibákat elkövethetnek, amikor megpróbálják összerakni a tanult információkat
Ez vezet ahhoz, amit gyakran hallucinációnak neveznek.
Hallucinációk
Az MI magabiztosan állít valamit, ami hihetőnek hangzik, de valójában helytelen.
Különbség a keresőmotoroktól
A keresőmotorokkal ellentétben, amelyek egyszerűen meglévő dokumentumokat kérnek le, az LLM-ek statisztikai mintázatok alapján generálnak válaszokat, néha hallucinációkat produkálva.
Analógia: Képzelj el egy barátot, aki teljes magabiztossággal mesél el egy történetet, csak hogy a részletek teljesen rosszak legyenek. Az MI néha ilyen lehet.
3. Kontextusablak korlátai
Mi a kontextusablak?
Emlékeztetőül, ez az az információmennyiség, amelyet egy MI egyszerre képes feldolgozni.
- Minden LLM-nek van egy maximális korlátja annak, hogy mennyi információt tud figyelembe venni egyetlen interakció során
- Ha ezt a korlátot túllépik, az MI nem fog tudni emlékezni az ablakon kívül eső információkra, általában első be, első ki alapon
Gyakorlati hatások
A modell méretétől függően ez korlátozhatja: - A nagy dokumentumok feldolgozására való képességét - A teljes beszélgetés megjegyzésére való képességét
4. Nem-determinisztikus viselkedés
Mit jelent ez?
A hagyományos szoftverekkel ellentétben, amelyek azonos bemenetekre azonos kimeneteket produkálnak, az LLM-ek alapértelmezés szerint némileg kiszámíthatatlanok (nem-determinisztikusak).
Példa: Kérdezd meg ugyanazt a kérdést kétszer, és minden alkalommal kissé eltérő válaszokat kaphatsz.
Miért van ez?
Ez a változékonyság abból adódik, ahogyan ezek a modellek szöveget generálnak:
- Valószínűségi döntéseket hoznak arról, hogy milyen szöveg következzen
- A képzési adataikban lévő mintázatok alapján
- Bizonyos, a fejlesztők által módosítható beállítások alapján
Előnyök és hátrányok
Előnyök: - Ez a kreatív változékonyság nagyszerű lehet ötleteléshez és változatos ötletek generálásához
Hátrányok: - Tudatosságot igényel, amikor a következetesség vagy a pontosság kritikus
Hőmérséklet beállítás
Néhány LLM felület beállításokat is kínál ennek a véletlenszerűségnek a szabályozására, amikor szükséges. Ezt a beállítást gyakran hőmérsékletnek nevezik.
5. Érvelési korlátok
Történelmi gyengeségek
Bár ezek a modellek gyorsan fejlődnek, történelmileg korlátokat mutattak a komplex érvelési feladatokban, különösen a több lépést igénylő matematikai vagy logikai problémákban.
Pozitív fejlődés
Jó hírek
Az újabb, lépésről lépésre történő gondolkodásra tervezett érvelési vagy kiterjesztett gondolkodású modellek erős előrehaladást mutatnak ezeken a területeken.
6. Eszköz- és adathozzáférési korlátok
Jelenlegi helyzet
Bár a Claude-hoz hasonló modellek már hozzáférhetnek külső eszközökhöz, még mindig hiányozhat a hozzáférésük bizonyos adatforrásokhoz vagy specializált eszközökhöz, amelyek bizonyos feladatokhoz szükségesek lennének.
Analógia
Olyan, mintha egy briliáns kollégád lenne, aki nem fér hozzá a céged belső adatbázisához. A segítségnyújtási képessége korlátozott lesz, bármilyen okos is.
Következmény
Ha egy modellnek nincs hozzáférése egy adathoz vagy eszközhöz, amely egy kérdés megválaszolásához szükséges, akkor nem meglepő, hogy nem fog tudni segíteni a kérdés megválaszolásában.
A jövő irányai
Folyamatos fejlődés
A generatív MI területe gyorsan fejlődik. A kutatók azon dolgoznak, hogy kezeljék a jelenlegi korlátokat olyan technikákkal, mint:
- Visszakereséssel kiegészített generálás - amely a modelleket külső tudás- és adatforrásokhoz kapcsolja
- Eszközhasználati képességek bővítése
- Érvelési képességek javítása
Realisztikus elvárások
Fontos megjegyzés
Ennek ellenére valószínű, hogy néhány korlát a belátható jövőben is megmarad, még ha nem is tudjuk pontosan, mik lesznek ezek a korlátok.
MI fluencia és a korlátok megértése
Miért fontos?
Annak megértése, hogy az MI mit tud vagy mit nem tud: - Elengedhetetlen az MI fluenciához - Segít meghatározni, mikor és hogyan lehet a leghatékonyabban beépíteni ezeket a rendszereket a munkádba és a mindennapi életedbe
Kiegészítő erősségek
A leghatékonyabb alkalmazások az emberek és az MI kiegészítő erősségeit fogják kihasználni:
Emberi erősségek
- Kritikai gondolkodás
- Ítélőképesség
- Kreativitás
- Etikai felügyelet
MI erősségek
- Sebesség
- Méretarány
- Mintafelismerés
- Hatalmas mennyiségű információ feldolgozására való képesség
Folyamatos fejlődés
Ezek a kiegészítő erősségek fejlődni fognak, ahogy a technológia fejlődik.
Ezért olyan értékes a folyamatos tanulás és kísérletezés. Segítenek: - Naprakésznek maradni ezekkel a változásokkal - Új lehetőségeket felfedezni
Gyakorlati tapasztalat
A kurzus során ezekben a gyakorlatokban lehetőséged lesz első kézből felfedezni ezeket a fogalmakat a Claude-dal folytatott beszélgetéseken keresztül.
Ez a közvetlen tapasztalat segít intuitív érzéket fejleszteni arról, hogy a generatív MI mit tud, mit nem tud, és hogyan lehet a legjobban dolgozni vele.