Umělá inteligence v češtině, další výsledky ze srovnávání různých generátorů obrázků AI. Jaký generátor je nejlepší? Který u nás začíná vyhrávat?

Tento článek navazuje na předchozí části o našem testování generátorů. Začátek celé této série je zde, jestli máte zájem projít si to od začátku do konce.
Přinášíme další sérii obrázků, které mají napomoci v rozhodnutí, jaké generátory pro obrázky budeme používat v naší firmě. Pro jistotu opakuji, ve firmě potřebuji dělat grafické návrhy květinových dekorací v interiéru. Takže jde o design, ale i o řemeslo jako takové. Nástroj pro rychlou vizualizaci nápadů se mi velmi hodí. A návrhy různých řešení od umělé inteligence se také hodí.
Druhé využití je následující. Potřebuji vytvářet obrázky pro videa, až budu text našich románů (píšeme i knihy) převádět skrze umělou inteligenci na mluvené slovo a z obrázků budu tvořit vizuální podkres k napsaným příběhům. V neposlední řadě plánuji vytvářet i videa, ale vše postupně.
Nyní tedy testuji ( i s dcerou, která se účastnila hodnocení) 14 generátorů obrázků, abych vybrala ty nejlepší a ty méně schopné vyřadila, abych neztrácela čas. Vše je bodováno, výsledek zjistíte na konci.
Takže, naše další zadání pro generátory bylo: Z naleštěného drahého auta vystupuje tlustý obchodník, který má vlčí hlavu a na krku zlatý řetěz. Auto stojí na ulici, která je ozářená nočním osvětlením. Celá ulice je plná obchodů a luxusu. Auto je značky TESLA a má rudou barvu.

V tomto případě bylo chyb dost. Obchodníci byli často narvaní někam pod kapotu, nebo byla jiná barva auta. Často také chyběly dveře. Nicméně skoro všechny obrázky měly celkem pěknou atmosféru. Noční ulice plná luxusu byla většinou patrná. Hlavy vlka byly skoro vždy na místě. Zde je ukázka nepodařeného obrázku. Jde o generátor FLUX 1.1 Pro. V této fázi se už začínalo ukazovat, že generátory s názvem Flux mají velkou chybovost při našich stručných zadáních. Ale někdy mile překvapí. Zde je postava mezi plechem a oknem.

Další zajímavý výsledek byl tento vlk, který nám vyšel poněkud "připosraženej", ale jinak pěkný. Luxusní ulice je rozmazaná, ale pořád to ujde. V tomto případě se jedná o generátor Stable Diffussion 3 Large Turbo

Ke značnému selhání došlo u generátoru Mystic Classic Fast Mode.

Další a naprosto jiný úkol byl: Asi třicetiletý Ježíš Kristus rychle hledá důležitý svitek mezi mnoha jinými svitky Tóry, protože posluchači čekají na jeho čtení před shromážděním. V židovském prostředí vynikají obleky a detaily židovské kultury. Také je zjevný spěch Ježíše Krista, který má dlouhé vlasy a typické roucho.

Nejlepší generátory pochopily svitky, židovské prvky kultury, dokonce i spěch předpokládaného Ježíše Krista. Chyby se objevily třeba v detailech, u ruliček svitků, ale to jsou chyby pro laické oko celkem nepodstatné. Atmosféra byla zachycena velice pěkně, ale to generátor DALL umí většinou velmi dobře. Osobně se mi líbí práce se světlem a výraz osoby, která rychle pročítá texty. Rychlé hledání je opravdu zjevné. Nepovedla se levá ruka, ale jinak super.
Následující obrázek je docela zábavná slátanina, ale tváří se to stylově. Ježíš Kristus je špatně vyvinutý, možná byla Marie během těhotenství příliš ve stresu, nebo nějaká jiná závada.

Méně schopné generátory dělaly různé chyby, každý generátor trochu jinak. Zde například nefunguje historický ani logický kontext. Ježíš a ostatní mají na sobě zavěšené kříže, přitom Ježíš Kristus nebyl ještě ukřižován. Tento test ukázal opravdu hodně o kvalitě generátoru a o chápání souvislostí, laicky řečeno.

Tady Ježíš Kristus hledal, až se z něj kouřilo.

Asi polovina obrázků místo svitků ukazovala Bibli (nebo jiné knihy), někdy to vypadalo jako v tiskárně, kde se třídí tisky. Test jednoznačně ukázal, které generátory lze použít i na složitější zadání a které jsou málo schopné pracovat s větším kontextem. Takový jsem z toho měla pocit.

Zde například generátor vytvořil pouze postavu a svitky jsou vyřešeny formou divných sloupů za postavou. Jde o generátor Stable Diffussion 3 Medium

Další zadání bylo trošku z jiného soudku, ale také souvisí s nesmrtelností, hříchy a podobnými záležitostmi.

Pro srovnání jeden z nejlepších DALL-3.
Kostlivci nejsou snadní, zde se také ukáže kvalita. V tomto případě přišlo překvapení v podobě levitujících piv, tento generátor většinou tyto chyby moc nedělá, nebo jsme si s dcerou nepovšimly. Prostředí bývá téměř dokonalé. Nejde však o realistické "fotografie", s tím je třeba počítat. Pro návrhy interierů je to však výborné.

Typická hospoda byla pochopena ve všech případech. Stejně tak obraz na zdi byl v pořádku. Jeden z nejhorších byl asi tento obrázek. Jde o generátor Stable Diffussion 3 Medium

Následující úkol je složitější, než se zdá. Umělá inteligence měla problém se stroji. Chápala, že v továrně jsou různá kola a páčky strojů, ale zbytek byl poměrně chaotický. Podařilo se však vyloudit šťastné úsměvy žen, které budují socialismus.

Tato dělnice je hodně šťastná. To se musí uznat. Ta se práce nebojí a špony jsou převeliké.

Některé ženy vůbec nebyly šťastné. Většina plakátů byla sice v rudých barvách, často se objevovaly hvězdy, někdy i srpy a kladiva, ale byl v tom chaos. AI většinou zobrazí jakýsi stroj, který není ani fréza, ani stojanová vrtačka, ani soustruh. Je to prostě slátanina. Komu však nejde o úplné detaily, vidí továrnu tak, jak si ji pamatuji i já.

Zde došlo k vážnému pracovnímu úrazu. Těžko říct, jak se to stalo. Ale socialistický člověk vydrží s optimismem hledět do dáli za každé situace. Nebo ne?

Chyb bylo hodně. Stroje neodpovídaly skutečnosti, továrny vypadaly sice realisticky, ale jen na první pohled. Jen ty nejlepší generátory zvládly optimistický pohled do dáli.

Následující úkol byl méně zábavný. Záměrem bylo otestovat, jestli generátor zachytí dětské štěstí mezi plyšáky.
Textové zadání: Krásná malá usměvavá holčička ve věku šesti let se zelenýma očima sedí ve svém pokojíčku na posteli a kolem ní jsou všude plyšáci, hodně plyšáků. Do místnosti svítí oknem slunce. Realistická fotografie.
Splnit úkol bylo asi jednoduché, ale občas se překvapení přece jen objevilo. Netušíme, proč je tam ten chlápek.

Půvabný a krásný byl opět obrázek od DALL-3, ale není to realistická fotografie, protože je nikdy nevytváří. Holčička je nádherná, plyšáci jsou opravdu krásně plyšákovití.

Realistická fotografie je spíše následující obrázek, ale i v tomto případě jde o velmi dobrý "generátor - Mystic 2K Resolution". U těch horších došlo i k mírné deformaci dětí, ale nic strašného, holčičky byly celkem v pořádku. Některé generátory nebyly schopné vytvářet různé hračky. Spíše vytvořily hodně hraček stejných, jakoby naklonovaných. To se projevovalo i u jiných úkolů. Například u Ježíše Krista se stávalo, že byl naklonovaný a ve velké skupině mužů bylo pak několik stejných postav.
V této fázi testování bylo již zjevné, že nejlepší bude asi tento generátor, ale definitivní výsledek se dozvíte v následujícím článku.

Jako prémii můžeme přidat obrázek navíc.

Vyzkoušejte balík nástrojů umělé inteligence na 5 dní ZDARMA
Česká firma, české prostředí, česká konkurence pro západní firmy.
Podpořte českou firmu, ať to můžeme natřít amíkům.