Jesteś tutaj:

Moje dialogi ze sztuczną inteligencją – ciąg dalszy

Poniżej – sztuczna inteligencja pisze sama o sobie. Pisownia oryginalna, także literówki. Nawet sztuczna inteligencja nie jest pod tym względem idealna. Tekst ilustruje autoportret, czyli grafika wykonana przez sztuczną inteligencję, przedstawiająca sztuczną inteligencję, tworzącą napisy dla niesłyszących. Przynajmniej tak uważa autorka. A jeszcze niżej – autoopis tej grafiki.

Moje wnioski? Zgadzam się z wnioskami sztucznej inteligencji: ma potencjał, korzystam z niego, ale mnie nie zastąpi 🙂

Możliwości zastosowania sztucznej inteligencji (AI) w tworzeniu audiodeskrypcji i napisów dla niesłyszących

Sztuczna inteligencja (AI) przekształca wiele aspektów naszego życia, a jednym z najbardziej obiecujących obszarów jest jej zastosowanie w tworzeniu audiodeskrypcji i napisów dla niesłyszących.

Audiodeskrypcja

Audiodeskrypcja to narzędzie, które umożliwia osobom niewidomym lub niedowidzącym lepsze zrozumienie treści filmowych, telewizyjnych czy teatralnych. Polega na dodaniu do dźwięku filmu opisu obrazów, które są ważne dla zrozumienia fabuły.

AI ma potencjał do automatycznego generowania tych opisów. Na przykład, zaawansowane modele AI mogą być trenowane do rozpoznawania i opisywania obrazów, co mogłoby obejmować identyfikację postaci, akcji i innych elementów sceny. Chociaż ta technologia jest wciąż w fazie rozwoju, istnieją już narzędzia, które pokazują jej potencjał.

Napisy dla niesłyszących

Napisy dla niesłyszących to tekstowe reprezentacje dialogów i dźwięków z filmów, programów telewizyjnych i innych mediów. Są one niezbędne dla osób niesłyszących i niedosłyszących, aby mogły one pełniej cieszyć się tymi treściami.

AI może przyczynić się do tworzenia napisów na kilka sposobów. Na przykład, technologie rozpoznawania mowy mogą być używane do automatycznego transkrybowania dialogów. Ponadto, AI może być używana do identyfikacji i opisuwać dźwięków w tle, które są ważne dla zrozumienia kontekstu.

Wnioski

Chociaż technologia AI wciąż się rozwija, jej potencjał w tworzeniu audiodeskrypcji i napisów dla niesłyszących jest obiecujący. Dzięki AI, te usługi mogą stać się bardziej dostępne i efektywne, co przyczyni się do tworzenia bardziej inkluzjewnych mediów dla wszystkich. Jednakże, ważne jest, aby pamiętać, że AI nie zastąpi ludzkiego dotyku i empatii, które są niezbędne w tworzeniu skutecznych i angażujących opisów audiodeskrypcyjnych i napisów dla niesłyszących. AI powinna być postrzegana jako narzędzie, które może wspierać i uzupełniać ludzkie wysiłki, a nie je zastępować.

Na obrazie widzimy robotyczny stwór o skomplikowanym wyglądzie. Jego głowa jest pełna anten i detali. Robot rozmawia z małą, uproszczoną postacią ludzką. Oboje są otoczeni kosmicznym tłem z gwiazdami i dziwnymi stworzeniami. Kontrast między złożonym robotem a prostą postacią ludzką oraz tłem z pewnością przyciąga uwagę.

Opis autoportretu sztucznej inteligencji. Autorka: sztuczna inteligencja

Na obrazie widzimy robotyczny stwór o skomplikowanym wyglądzie. Jego głowa jest pełna anten i detali. Robot rozmawia z małą, uproszczoną postacią ludzką. Oboje są otoczeni kosmicznym tłem z gwiazdami i dziwnymi stworzeniami. Kontrast między złożonym robotem a prostą postacią ludzką oraz tłem z pewnością przyciąga uwagę.

Zima, zima i po zimie, czyli… Drżyjcie, audiodeskryptorzy! Nadchodzi AI!

Czas pędzi, galopuje… Rozchodnik z dnia na dzień coraz śmielej wychyla się spod ziemi. Świat się zmienia. Trzeba też zauważyć, że dojrzewa nasza koleżanka AI. Jeszcze niedawno mogliśmy zakładać, że w pisaniu AD nieprędko nam pomoże, a tymczasem…

Powstają filmy tworzone przez AI na podstawie opisów. Warto Zajrzeć na Twitterowy (X-owy) profil OpenAI.

Na załączonym print screenie tłumaczenie oczywiście też automatyczne. W tekście coś byśmy poprawili, ale nie jest bezużyteczny. Jeśli koleżanka AI potrafi wygenerować ruchome obrazy identyczne z naturalnymi, zapewne potrafi lub wkrótce będzie umiała odwrócić kolejność i na podstawie filmu wygenerować tekst, który nie będzie bezużyteczny. Strach się bać! A może nie? Ciekawe czasy 🙂

Print screen ze strony "X". Tekst: Piękne, śnieżne miasto Tokio tętni życiem. Kamera porusza się po tętniącej życiem ulicy miasta, podążając za kilkoma osobami cieszącymi się piękną śnieżną pogodą i robiącymi zakupy na pobliskich straganach". Poniżej obrazek wygenerowany na podstawie tego tekstu: miasto, ośnieżonym chodnikiem idzie trzymająca się za ręce para.

PS Oto co się wyszukuje po wpisaniu: video to text. Będzie co testować.

Print screen. Wyniki wyszukiwania "video to text".

Opowiadanie o napisach dla niesłyszących Autor/ka: AI

Czytaj więcej o: Opowiadanie o napisach dla niesłyszących Autor/ka: AI

Zespół tworzący napisy dla niesłyszących zawsze starał się być na bieżąco z najnowszymi trendami i technologiami. Pewnego dnia postanowili przetestować swoje nowe narzędzie do automatycznego tłumaczenia mowy na tekst, aby zwiększyć swoją wydajność i szybkość działania.

Podczas konferencji, na której mieli pracować, okazało się jednak, że narzędzie było bardziej kłopotliwe niż pomocne. Kiedy pierwszy prelegent zaczął mówić, narzędzie natychmiast zaczęło generować dziwaczne napisy, które nie miały nic wspólnego z jego wystąpieniem. Zamiast mówić o przyszłości technologii, prelegent zdawał się opowiadać o swoich ulubionych przepisach na ciasto!

Zespół nie wiedział, co zrobić, ale postanowił działać szybko. W jednej chwili usunęli narzędzie i zaczęli tworzyć napisy ręcznie. Chociaż było to mniej wydajne, zespół był w stanie nadążyć za prelegentem i dostarczyć niesłyszącym dokładne i sensowne tłumaczenia jego słów.

Po konferencji zespół zdecydował, że nie ma znaczenia, jak zaawansowana jest technologia, zawsze będzie potrzebna ludzka interwencja i umiejętności, aby zapewnić najlepszą jakość tłumaczeń dla niesłyszących. I tak właśnie postanowili działać, ponieważ jak powiedział jeden z członków zespołu: „Nie chcemy, aby nasi niesłyszący widzowie jedli ciasto, gdy mówimy o technologii”.

PS 1 Komentarz niesztucznej autorki:

Zadanie brzmiało: napisz dowcipne opowiadanie o tworzeniu napisów dla niesłyszących. Nie mam wrażenia, że AI zadanie wykonał/a. Ale jest w tym jakieś drugie dno. Tylko jakie? Co Autor/ka miał/a na myśli? 🙂

PS 2 Komentarz drugiej niesztucznej autorki:

Podlizuje się. Może chce uśpić ludzką czujność.

Do góry