Spiel

#Wie bei Harry Potter: Nvidia will, dass sich eure Bilder bewegen – und so sieht es aus

Nvidia steigt in den KI-Markt ein und stellt ein Projekt vor, das eure Bilder in kurze Videos umwandelt. So soll es aussehen.

ChatGPT und Midjourney dürften mittlerweile den meisten Leuten ein Begriff sein. Doch es gibt natürlich noch unzählige künstliche Intelligenzen (und solche, die es werden wollen), die noch nicht so viel Bekanntheit erlangt haben. 

Das dürfte die GPU-Entwickler von Nvidia allerdings kaum stören. Immerhin genießen sie bereits einen gewissen Bekanntheitsgrad. Nvidias Toronto AI-Lab hat nun ein KI-Projekt vorgestellt, das eure Bilder bewegbar machen soll.

Harry Potter und die latenten Diffusionsmodelle

Latent Diffusion Models (LDM) sind künstliche Intelligenzen, die Videos generieren, ohne viel Rechenpower zu brauchen. Laut Nvidia basiert die Arbeit an ihrem Projekt auf Text-zu-Bild-Generatoren, wie zum Beispiel Stable Diffusion. Zusätzlich haben sie angeblich eine »zeitliche Dimension« hinzugefügt.


Empfohlener redaktioneller Inhalt

An dieser Stelle findest du einen externen Inhalt von Imgur, der den Artikel ergänzt.
Du kannst ihn dir mit einem Klick anzeigen lassen und wieder ausblenden.


Ich bin damit einverstanden, dass mir Inhalte von Imgur angezeigt werden.

Personenbezogene Daten können an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Link zum Imgur-Inhalt

Was heißt das? Einfach gesagt bedeutet das, dass Standbilder »realistisch« animiert werden sollen. Ein einzelnes Bild wird also angeblich zum Video werden – genauer gesagt zum GIF. Uns erinnert das stark an die bewegten Bilder aus Harry Potter. Aber auch das Meme-Potenzial scheint grenzenlos zu sein.

Das Projekt soll Upscaling-Technologie nutzen, um möglichst echt wirkende Bewegungen in guter Qualität darzustellen. Aus einem Bild soll so ein 4,7 Sekunden langes Video mit einer Auflösung von 1.280 x 2.048 Pixel werden. Bei einer Auflösung von 512 x 1.024 sollen die Videos auch länger werden können.


Empfohlener redaktioneller Inhalt

An dieser Stelle findest du einen externen Inhalt von Imgur, der den Artikel ergänzt.
Du kannst ihn dir mit einem Klick anzeigen lassen und wieder ausblenden.


Ich bin damit einverstanden, dass mir Inhalte von Imgur angezeigt werden.

Personenbezogene Daten können an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Link zum Imgur-Inhalt

Das bedeutet einen großen Schritt im Text-zu-Video-Bereich und könnte in Zukunft diverse Anwendungsmöglichkeiten in beispielsweise der Filmbranche bieten.

Im momentanen Zustand lässt die Qualität wohl noch etwas zu wünschen übrig, da man noch Artefakte sieht. Auch die sich ständig wandelnde Umgebung sieht im Moment stark künstlich aus, doch es ist kein Geheimnis, dass KI-Technologien die Eigenschaft haben, sehr schnell fortzuschreiten.

Wir bleiben gespannt, was in Kürze noch in diesem Bereich passieren wird.

Werdet ihr die Nvidia-technologe nutzen, um euer Meme-Game etwas aufzuwerten oder sehen euch die Videos momentan noch etwas zu gruselig aus? Bei manchen davon kann es einem ja durchaus kalt den Rücken runter laufen. Freut ihr euch auf weitere Entwicklungen im Text-zu-Video-Bereich? Schreibt es uns gerne in die Kommentare!

Wenn Ihnen der Artikel gefallen hat, vergessen Sie nicht, ihn mit Ihren Freunden zu teilen. Folgen Sie uns auch in Google News, klicken Sie auf den Stern und wählen Sie uns aus Ihren Favoriten aus.

Wenn Sie an Foren interessiert sind, können Sie Forum.BuradaBiliyorum.Com besuchen.

Wenn Sie weitere Nachrichten lesen möchten, können Sie unsere Spiel kategorie besuchen.

Quelle

Ähnliche Artikel

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Schaltfläche "Zurück zum Anfang"
Schließen

Please allow ads on our site

Please consider supporting us by disabling your ad blocker!