Grok 2: co se stalo s kvalitou generovaných obrázků?
Před časem jsem psal článek o AI Elona Muska - Grok, který byl toho času ve 2. betě. Možná vás můj článek namlsal na to si zakoupit předplatné a získat tak přístup k funkcím chatbota, především pak k jeho schopnostem generovat obrázky v perfektní kvalitě, která si svou úrovní nezadala s konkurenční Midjourney.
Před několika dny se Grok dostal do ostré verze a stal se přístupným i pro uživatele, kteří si X Premium neplatí. Co se ale stalo s kvalitou Groka? Především pak s kvalitou generovaných obrázků? Jak se zdá, došlo k nějaké změně, ale není zatím jasné proč a k jaké. Nejen že Grok nyní generuje obrázky průměrné až podprůměrné kvality, ale obrázek generuje, jako byste byli na dial-up 56 kb/s lince v dobách úplných internetových začátků. Ve finále pak ještě zjistíte, že vám Grok obrázek opatří vodoznakem - tohle je úplná smrt .
Co pochopil je to, že se tohle bude dít u uživatelů, kteří si neplatí premium verzi, ale u platícího uživatele je to přinejmenším zvláštní a doufejme, že se jen jedná o chybu, která vznikla tím, jak byl Grok zpřístupněn všem. V opačném případě pro mne nemá smysl si premium tarif platit (modrá fajfka je pro mne to poslední, co potřebuji 😄).
Na blogu x.ai se oslavně píše, že kluci šikovní vývojářští do Groka přidali nový agresivní model s kódovým označením Aurora. Cituji článek:
Rozšířili jsme schopnosti aplikace Grok při generování obrázků o nový model s kódovým označením Aurora. Aurora je autoregresivní síť směsi expertů vycvičená k předpovídání dalšího tokenu z prokládaných textových a obrazových dat. Model jsme trénovali na miliardách příkladů z internetu, díky čemuž má hluboké znalosti o světě. Díky tomu vyniká ve fotorealistickém vykreslování a přesném dodržování textových pokynů. Kromě textu má model také nativní podporu multimodálního vstupu, což mu umožňuje inspirovat se obrázky poskytnutými uživatelem nebo je přímo upravovat. Nové možnosti aplikace Grok jsou nyní dostupné na platformě 𝕏 ve vybraných zemích a během týdne se rozšíří mezi všechny uživatele.
Pojďme se pro ilustraci podívat, jak Grok nyní "przní" obrázky, srovnání obrázků vygenerovaných před zhruba 5 měsíci a dnes. Byl použitý stejný prompt.
Tour de France cyklista
Peruánský indián
Starý vrásčitý muž
Krásná žena v ledové vodě
Jak vidíte sami, kvalita obrázků nejen že šla do "zadele", ale Grok začal být i korektní. Obrázek ženy v ledové vodě pro jistotu nevygeneroval vůbec, respektive začal generovat, ale po chvíli usoudil, že se asi jedná o nevhodné téma viz níže.
Doufejme, že se jedná jen o momentální a dočasný neduh, který kluci z X.AI brzy opraví a Grok bude zase generovat parádní výsledky stejně jako to dělal v době, kdy byl ještě v beta verzi. Strasti uživatelů, kteří jsou podobně rozčarovaní, jako já, si můžete pročíst například na síti Reddit.