Jesteś tutaj:

Moje dialogi ze sztuczną inteligencją – ciąg dalszy

Poniżej – sztuczna inteligencja pisze sama o sobie. Pisownia oryginalna, także literówki. Nawet sztuczna inteligencja nie jest pod tym względem idealna. Tekst ilustruje autoportret, czyli grafika wykonana przez sztuczną inteligencję, przedstawiająca sztuczną inteligencję, tworzącą napisy dla niesłyszących. Przynajmniej tak uważa autorka. A jeszcze niżej – autoopis tej grafiki.

Moje wnioski? Zgadzam się z wnioskami sztucznej inteligencji: ma potencjał, korzystam z niego, ale mnie nie zastąpi 🙂

Możliwości zastosowania sztucznej inteligencji (AI) w tworzeniu audiodeskrypcji i napisów dla niesłyszących

Sztuczna inteligencja (AI) przekształca wiele aspektów naszego życia, a jednym z najbardziej obiecujących obszarów jest jej zastosowanie w tworzeniu audiodeskrypcji i napisów dla niesłyszących.

Audiodeskrypcja

Audiodeskrypcja to narzędzie, które umożliwia osobom niewidomym lub niedowidzącym lepsze zrozumienie treści filmowych, telewizyjnych czy teatralnych. Polega na dodaniu do dźwięku filmu opisu obrazów, które są ważne dla zrozumienia fabuły.

AI ma potencjał do automatycznego generowania tych opisów. Na przykład, zaawansowane modele AI mogą być trenowane do rozpoznawania i opisywania obrazów, co mogłoby obejmować identyfikację postaci, akcji i innych elementów sceny. Chociaż ta technologia jest wciąż w fazie rozwoju, istnieją już narzędzia, które pokazują jej potencjał.

Napisy dla niesłyszących

Napisy dla niesłyszących to tekstowe reprezentacje dialogów i dźwięków z filmów, programów telewizyjnych i innych mediów. Są one niezbędne dla osób niesłyszących i niedosłyszących, aby mogły one pełniej cieszyć się tymi treściami.

AI może przyczynić się do tworzenia napisów na kilka sposobów. Na przykład, technologie rozpoznawania mowy mogą być używane do automatycznego transkrybowania dialogów. Ponadto, AI może być używana do identyfikacji i opisuwać dźwięków w tle, które są ważne dla zrozumienia kontekstu.

Wnioski

Chociaż technologia AI wciąż się rozwija, jej potencjał w tworzeniu audiodeskrypcji i napisów dla niesłyszących jest obiecujący. Dzięki AI, te usługi mogą stać się bardziej dostępne i efektywne, co przyczyni się do tworzenia bardziej inkluzjewnych mediów dla wszystkich. Jednakże, ważne jest, aby pamiętać, że AI nie zastąpi ludzkiego dotyku i empatii, które są niezbędne w tworzeniu skutecznych i angażujących opisów audiodeskrypcyjnych i napisów dla niesłyszących. AI powinna być postrzegana jako narzędzie, które może wspierać i uzupełniać ludzkie wysiłki, a nie je zastępować.

Na obrazie widzimy robotyczny stwór o skomplikowanym wyglądzie. Jego głowa jest pełna anten i detali. Robot rozmawia z małą, uproszczoną postacią ludzką. Oboje są otoczeni kosmicznym tłem z gwiazdami i dziwnymi stworzeniami. Kontrast między złożonym robotem a prostą postacią ludzką oraz tłem z pewnością przyciąga uwagę.

Opis autoportretu sztucznej inteligencji. Autorka: sztuczna inteligencja

Na obrazie widzimy robotyczny stwór o skomplikowanym wyglądzie. Jego głowa jest pełna anten i detali. Robot rozmawia z małą, uproszczoną postacią ludzką. Oboje są otoczeni kosmicznym tłem z gwiazdami i dziwnymi stworzeniami. Kontrast między złożonym robotem a prostą postacią ludzką oraz tłem z pewnością przyciąga uwagę.

Zima, zima i po zimie, czyli… Drżyjcie, audiodeskryptorzy! Nadchodzi AI!

Czas pędzi, galopuje… Rozchodnik z dnia na dzień coraz śmielej wychyla się spod ziemi. Świat się zmienia. Trzeba też zauważyć, że dojrzewa nasza koleżanka AI. Jeszcze niedawno mogliśmy zakładać, że w pisaniu AD nieprędko nam pomoże, a tymczasem…

Powstają filmy tworzone przez AI na podstawie opisów. Warto Zajrzeć na Twitterowy (X-owy) profil OpenAI.

Na załączonym print screenie tłumaczenie oczywiście też automatyczne. W tekście coś byśmy poprawili, ale nie jest bezużyteczny. Jeśli koleżanka AI potrafi wygenerować ruchome obrazy identyczne z naturalnymi, zapewne potrafi lub wkrótce będzie umiała odwrócić kolejność i na podstawie filmu wygenerować tekst, który nie będzie bezużyteczny. Strach się bać! A może nie? Ciekawe czasy 🙂

Print screen ze strony "X". Tekst: Piękne, śnieżne miasto Tokio tętni życiem. Kamera porusza się po tętniącej życiem ulicy miasta, podążając za kilkoma osobami cieszącymi się piękną śnieżną pogodą i robiącymi zakupy na pobliskich straganach". Poniżej obrazek wygenerowany na podstawie tego tekstu: miasto, ośnieżonym chodnikiem idzie trzymająca się za ręce para.

PS Oto co się wyszukuje po wpisaniu: video to text. Będzie co testować.

Print screen. Wyniki wyszukiwania "video to text".

Do góry