Dział: TECHNOLOGIE

Dodano: Marzec 01, 2024

Narzędzia:

Drukuj

Drukuj

Na początku było słowo. Tekst w obraz, obraz w wideo, a dźwięk? Meta o narzędziach

Świat sztucznej inteligencji szybko ewoluuje, a generatywna sztuczna inteligencja (Gen AI) jest na szpicy trwającej rewolucji. Gen AI to odmiana sztucznej inteligencji, która potrafi generować nowe i oryginalne treści, takie jak obrazy, filmy i muzyka, zamiast po prostu przetwarzać istniejące dane. Naturalnie, możliwości te przekładają się na to, jak pracuje się w reklamie.

W ostatnich postach blogu Meta AI zaprezentowaliśmy najnowsze osiągnięcia w badaniach nad generatywną sztuczną inteligencją, w tym możliwości edycji obrazu, tworzenia wideo z tekstu i obrazu, generowania dźwięku i ekspresyjnego tłumaczenia. Te przełomowe rozwiązania nieuchronnie zmienią sposób tworzenia treści reklamowych, więc przyjrzyjmy się każdemu z nich bardziej szczegółowo.

Edycja obrazów

Wszyscy już wiemy, jak łatwe jest generowanie obrazów z pomocą Gen AI. Wiemy też, że wygenerowanie pożądanego obrazu jest trudne. 

Mając to na względzie, opracowano Emu Edit, nowatorskie podejście, które usprawnia zadania związane z manipulacją obrazem poprzez zwiększenie jej precyzji. Chodzi o to, aby model - poza stworzeniem "wiarygodnego" obrazu, umożliwiał zmianę tylko tych pikseli, które są istotne zważywszy polecenie. Na przykład, dodanie tatuażu "Jesieniara" na bicepsie marynarza nie powinno zmieniać samego marynarza.

Emu Edit jest zdolny do swobodnej edycji za pomocą instrukcji, obejmujących zadania takie jak edycja punktowa i ogólna, usuwanie i dodawanie tła, zmiana kolorów i geometrii, wykrywanie i szparowanie oraz wiele innych. W przeciwieństwie do wielu generatywnych modeli sztucznej inteligencji, które nadmiernie modyfikują lub niedostatecznie wykonują różne zadania edycji, Emu Edit precyzyjnie wykonuje instrukcje, zapewniając, że piksele na obrazie wejściowym niezwiązane z instrukcjami pozostaną nietknięte. Nie sposób przecenić wpływu tej technologii na przyspieszenie pracy art directorów - szczególnie na początkowych etapach procesu.

Tekst na wideo

Emu Video przedstawia prostą metodę generowania wideo na bazie wsadu tekstowego, obrazu lub tekstu i obrazu jednocześnie. Wynikiem jest 4-sekundowe wideo o rozdzielczości 512x512 o 16 klatkach na sekundę. Oczywiście, model może "animować" obrazy wygenerowane przy pomocy Emu Edit. 

Technologia ta już teraz może mieć szerokie zastosowanie w reklamie - od tworzenia prostych animatików do badań lub prezentacji przetargowych, po generowanie krótkich reklam wideo do mediów społecznościowych.

Tekst na dźwięk

Zamieniliśmy tekst w obraz, obraz na wideo, ale... co z dźwiękiem? Gen AI pomoże. Audiobox to SI pozwalająca generować i edytować audio, a dokładniej mowę, efekty dźwiękowe (krótkie dźwięki, takie jak szczekanie psa, klakson samochodu, grzmot pioruna itp.) oraz dłuższe podkłady. Na przykład, monit "Płynąca rzeka ze śpiewem ptaków w tle" wygeneruje taką właśnie ścieżkę dźwiękową. Aby wygenerować głos, wprowadź "Młoda kobieta mówi szybko wysokim tonem" wraz z tekstem wypowiedzi. Narzędzie umożliwia modyfikację istniejącego nagrania głosu poprzez polecenie zmiany stylu wypowiedzi ("mówi smutno i powoli") lub efektu ("z pogłosem jak w katedrze"). 

Ekspresyjne tłumaczenie

Co zrobić, jeśli potrzebny jest francuskojęzyczny lektor, a w mieście nie ma ani jednego? Popularne generatory mowy dają efekt mniej lub bardziej robotyczny. Seamless to pierwszy publicznie dostępny system, który wychwytuje niuanse ludzkiej ekspresji. Jego celem jest zachowanie zawiłości mowy, takich jak pauzy i tempo mowy, styl wokalny i ton emocjonalny. Dla reklamodawców transgranicznych będzie to przełom. 

Przyszłość tworzenia treści cyfrowych rysuje się w jasnych barwach, a Gen AI ma odegrać główną rolę w jej kształtowaniu. Najnowsze postępy w badaniach Meta AI są świadectwem szybkiego postępu w tej dziedzinie. 

PS. Aby lepiej zrozumieć technologie opisane w tym artykule, odwiedź ai.meta.com/resources i przejdź do "demos".

(01.03.2024)

* Jeśli znajdziesz błąd, zaznacz go i wciśnij Ctrl + Enter

PODOBNE ARTYKUŁY

Ta strona korzysta z plików cookies. Korzystając ze strony bez zmiany ustawień dotyczących cookies w przeglądarce zgadzasz się na zapisywanie ich w pamięci urządzenia. Dodatkowo, korzystając ze strony, akceptujesz klauzulę przetwarzania danych osobowych. Więcej informacji w Regulaminie.