21 °C Budapest
Data connection speed line. Futuristic network representation. Graphic concept for your design

Bajban az AI-szektor: teljesen összezavarhatják az álinformációk a mesterséges intelligenciát

2024. augusztus 9. 15:13

Az AI világa a legértékesebb erőforrás kifogyásának küszöbén áll - ez a valódi adat. Ez a helyzet heves vitát  generál az iparág vezetői között, mert egyesek szerint a szintetikus, lényegében "hamis" adatok alternatívát jelenthetnek, mások szerint ez nem megoldás - írja a Business Insider.

Az OpenAI és a Google évek óta az internetről származó adatokat használnak mesterséges intelligencia eszközeik és funkcióik alapjául szolgáló nagyméretű nyelvi modellek (LLM) betanításához. Ezek az LLM-ek az emberek által évszázadokon keresztül előállított szövegek, videók és egyéb online médiamegjelenések tömkelegét emésztették meg - legyen szó akár kutatási tanulmányokról, regényekről vagy YouTube-klipekről. Mostanra azonban a "valódi", ember által generált adatok kínálata kezd kifogyni.

Az Epoch AI nevű kutatócég előrejelzése szerint a szöveges adatok 2028-ra elfogyhatnak. Eközben azok a vállalatok, amelyek az internet minden szegletéből kibányászták a felhasználható adatokat - és ennek érdekében néha megszegték a szabályzatukat -, egyre szigorúbb korlátozásokkal szembesülnek.

Egyesek számára ez nem feltétlenül jelent problémát. Mivel az ember által generált használható adatok kútja kiapad, egyre több vállalat vizsgálja a szintetikus adatokat használatát. A kutatók mégis vitatkoznak arról, hogy a szintetikus adatok jelentik-e a csodafegyvert.

Egy oxfordi és cambridge-i kutatócsoport által nemrégiben közzétett tanulmány felfedezte, hogy az AI által generált adatokkal táplált modell végül halandzsát produkált. "Ez egy válsághelyzet" - mondta Gary Marcus, AI-elemző és pszichológia emeritus professzor a New York-i Egyetemről, aki szerint a szintetikus adat néhány problémát megoldhat, de van ennél nagyobb gond is. "ezek a rendszerek nem igazán érvelnek vagy terveznek" - mondta.

Az olyan vállalatok mint OpenAI és Google több tízmillió dollárt fizet pl. a Reddit és hírportálok adatainak hozzáféréséért friss adatforrásként működve modellek képzéséhez. Azonban, ha elfogynak a valós adatok, akkor a szintetikus adatok felé fordulhatnak a cégek. Ezeket mesterséges intelligencia rendszerek generálják és valós adatokon alapulnak. Júniusban Nvidia kiadott olyan AI-modellt mely képes mesterséges adathalmazokat létrehozni az AI-fejlesztéshez, júliusban pedig a kínai Tencent technológiai óriás Persona Hub nevű szintetikus adatgenerátort hozott létre hasonló feladat ellátására.

Bárkinek járhat ingyen 8-11 millió forint, ha nyugdíjba megy: egyszerű igényelni!

A magyarok körében évről-évre nagyobb népszerűségnek örvendenek a nyugdíjmegtakarítási lehetőségek, ezen belül is különösen a nyugdíjbiztosítás. Mivel évtizedekre előre tekintve az állami nyugdíj értékére, de még biztosítottságra sincsen garancia, úgy tűnik ez időskori megélhetésük biztosításának egy tudatos módja. De mennyi pénzhez is juthatunk egy nyugdíjbiztosítással 65 éves korunkban és hogyan védhetjük ki egy ilyen megtakarítással pénzünk elértéktelenedését? Minderre választ kaphatsz ebben a cikkben, illetve a Pénzcentrum nyugdíj megtakarítás kalkulátorában is. (x)

Kutatók azonban figyelmeztettek: a szintetikus adatok túlhasználata visszafordíthatatlan hibákat is okozhat, modellösszeomláshoz vezethet. Jathan Sadowski, a Monash Egyetem senior elemzője ezt a jelenséget Habsburg AI-nak nevezte el, utalva ezzel az osztrák dinasztiáról egyes történészek által terjesztett nézetre, hogy a belterjesség végül elpusztította őket. Az AI kedvezőtlen mutálódására utalt ezzel, ha túl sok AI-által generált szintetikus adatot használnak a fejlesztéshez.

Kérdés azonban, hogy mi számít túl soknak. Egy áprilisi tanulmány eredményei szerint a saját generált adatokon edzett modellek nem feltétlenül omlanak össze, ha vegyesen kapnak valósi és szintetikus adatot. A hibrid adatbázisok jelenthetnek így megoldást. 

Címlapkép: Getty Images
NEKED AJÁNLJUK
Te is szégyenlős vagy a szaunában? Itt a megnyugtató megoldás! (x)

Van, aki meztelenül, törölközőbe csavarva kényelmetlenül érzi magát, míg szintetikus anyagból készült fürdőruhában beülni a gőzbe több okból sem szerencsés.

Nemes Jeles László Napszállta című filmje óta nem volt ilyen a hazai mozikban: óriási siker a magyar Kickstarteren

A Fekete pont című film kampánya hatalmas sikert aratott a Brancs közösségi finanszírozási platformon, amely minden előzetes várakozást felülmúlt.

Ezt a különleges térképet nem árt, ha megveszed a gyereknek iskolakezdésre

A legkisebbek számára is érthetővé és elérhetővé tenné a tudományt a korábban a NASA-ban is dolgozó Hargitai Henrik bolygó- és felszínalaktan-kutató.

Ilyen zseniális ötletekről pitchelnek majd a fiatalok a kezdő vállalkozóknak szóló verseny döntőjében

72 csapat regisztrált arra a befektetői pitch versenyre, amelynek döntőjét augusztus 3-án rendezik Budapesten a IV. Mindset Meetup keretében.

Erről ne maradj le!
NAPTÁR
Tovább
2024. szeptember 10. kedd
Nikolett, Hunor
37. hét
KONFERENCIA
Tovább
REA 2024 SUMMIT – Powered by Pénzcentrum
A magyar Real Estate Agent találkozó a Kalmárok közreműködésével
Future of Finance 2024
Mi lesz a szerepe a pénzügyekben az AI-nak?
Sustainable World 2024
Zöld finanszírozási lehetőségek, befektetési döntések, ESG megfelelés
EZT OLVASTAD MÁR?