Novinky / Hry

Google oznamuje Imagen, generátor obrázků založený na AI s tvrzením o „bezprecedentním fotorealismu“

Google oznamuje Imagen, generátor obrázků založený na AI s tvrzením o „bezprecedentním fotorealismu“

Google Imagen je nový generátor AI textu na obrázek. Nebylo uvolněno do veřejného vlastnictví. Ale při oznamování nového modelu umělé inteligence společnost sdílela výzkumný dokument, srovnávací nástroj nazvaný Drawbench, který umožňuje objektivní srovnání s konkurenty Imagen, a několik praštěných obrázků pro váš subjektivní požitek. Zdůrazňuje také potenciální škodlivost této technologie.

Google Imagen: Takto funguje šablona převodu textu na obrázek

Myšlenka je taková, že stačí říct, co chcete, aby generátor obrázků AI vykouzlil, a ono to přesně udělá.

Obrázky prezentované Googlem jsou pravděpodobně nejlepší ze všech a protože nástroj AI není dostupný široké veřejnosti, doporučujeme brát výsledky a tvrzení s rezervou.

Ať tak či onak, Google je hrdý na výkon Imagen a možná i důvod, proč vydal benchmark pro modely AI text-to-image s názvem DrawBench. Co to stojí za to, grafy Google odhalují náskok Imagenu před alternativami, jako je Dall-E 2 od OpenAI.

Kreslicí lavice

Nicméně, stejně jako řešení Open AI nebo jinde, všechny podobné aplikace mají vnitřní nedostatky, to znamená, že jsou náchylné ke znepokojivým výsledkům.

Podobně jako u lidí „konfirmační zkreslení“, což je naše tendence vidět to, čemu věříme, a věřit tomu, co vidíme, mohou do těchto zkreslení spadat i modely umělé inteligence, které filtrují velké množství dat. Znovu a znovu se prokázalo, že to je problém s generátory textu na obrázek. Bude tedy Imagen od Googlu jiný?

Vlastními slovy Googlu tyto modely umělé inteligence kódují „několik společenských předsudků a stereotypů, včetně obecné předpojatosti k vytváření obrázků lidí se světlejší pletí a tendence, aby obrázky zobrazující různé profese vypadaly odlišně.“ jsou v souladu se západními genderovými stereotypy“.

Společnost Alphabet mohla stále filtrovat určitá slova nebo fráze a dodávat dobré datové sady. Ale s rozsahem dat, na kterých tyto stroje pracují, nelze všechno prosít nebo ne všechny problémy vyřešit. Google to přiznává a říká, že „[T] rozsáhlé požadavky na data textových a obrazových modelů […] vedly výzkumníky k tomu, aby se do značné míry spoléhali na velké soubory dat, většinou neupravené a získané z webu […] Audity datových sad odhalily, že tyto datové soubory mají tendenci odrážet sociální stereotypy, represivní názory a znevažující nebo jinak škodlivé asociace s marginalizovanými skupinami identity.

Takže, jak říká Google, Imagen „v tuto chvíli není vhodný pro veřejné použití“. Pokud a až bude k dispozici, zkuste mu říct: "Hej Google Imagen, není nebe." Je to jednoduché, když to zkusíš. Žádné peklo pod námi. Nad námi není nic než nebe."

Pro další novinky, recenze, funkce, nákupní průvodce a všechny technické věci pokračujte ve čtení Digit.in.