Microsoft heeft de release aangekondigd van MAI-Image-2, zijn nieuwste intern ontwikkelde tekst-naar-beeldmodel. Het model is ontworpen om realistischer beeldmateriaal te creëren en creatieve workflows te stroomlijnen. Het bouwt voort op MAI-Image-1 en wordt al geïntegreerd in Microsoft producten zoals Copilot en Bing Image Creator.
Volgens Microsoft richt MAI-Image-2 zich op het genereren van beelden met natuurlijkere belichting, nauwkeurigere huidtinten en omgevingen die levensechter ogen. Het bedrijf wil daarmee de noodzaak voor uitgebreide nabewerking van gegenereerde afbeeldingen verminderen.
Hoe MAI-Image-2 realisme en bruikbaarheid verbetert
Microsoft positioneert MAI-Image-2 als een hulpmiddel voor praktisch creatief werk in plaats van experimentele beeldgeneratie. In een blogpost stelt Microsoft dat het model is ontworpen voor makers die visuals nodig hebben die aanvoelen alsof ze in de echte wereld bestaan.
Het bedrijf merkt ook op dat verbeteringen in realisme kunnen helpen om de bewerkingstijd tijdens de postproductie te verkorten. Ontwikkelaars werkten samen met fotografen, ontwerpers en visuele makers, die problemen met realisme en consistentie in eerdere systemen aankaartten.
Betere tekstweergave in MAI-Image-2
Microsoft legt uit dat MAI-Image-2 een langdurig probleem in beeldgeneratiemodellen aanpakt; het creëren van leesbare en consistente tekst. Het model kan volgens het bedrijf nauwkeuriger visuals produceren met tekstelementen zoals posters, infographics en presentatieslides.
Deze verbetering is bedoeld om scenario’s te ondersteunen waarin duidelijke tekst belangrijk is, zoals marketing- en ontwerpworkflows. Volgens Microsoft zorgt dit voor minder discrepantie tussen de ingevoerde instructies en het uiteindelijke resultaat bij visuals met tekst.
Hoe MAI-Image-2 zich verhoudt tot Google en OpenAI
Microsoft meldt dat MAI-Image-2 zijn MAI-modelfamilie naar de top drie van de Arena.ai-ranglijst heeft gebracht. Ondanks deze vooruitgang loopt het model volgens dezelfde ranglijst nog achter op concurrenten van Google en OpenAI.
Microsoft beschouwt de verbetering ten opzichte van MAI-Image-1 als een belangrijke stap vooruit in zijn interne AI-ontwikkeling. Mustafa Suleyman, CEO van Microsoft AI, gaf aan dat het bedrijf aanzienlijke vooruitgang heeft geboekt met zijn modellen en producten, en dat er meer releases worden verwacht.
Hoe je toegang krijgt tot MAI-Image-2 in Copilot en Bing Image Creator
MAI-Image-2 is nu beschikbaar via de MAI Playground en wordt geleidelijk uitgerold naar Copilot en Bing Image Creator. Microsoft stelt dat sommige zakelijke klanten via een API toegang hebben tot het model, met bredere toegang voor ontwikkelaars die wordt verwacht via Foundry.
Het bedrijf heeft geen tijdlijn gegeven voor wanneer het model wereldwijd beschikbaar zal zijn in alle diensten.