Jesteś tutaj:

Audiodeskrypcja dla dzieci

Robić albo nie robić; oto jest pytanie:

Czy ma sens opisywanie świata, którego dzieci niewidzące od urodzenia nie znają? Zjawisk, których nie rozumieją? Przedmiotów, których nie dotknęły? W którym momencie to ma sens i jakie filmy wybierać? To pytania do tyflopedagogów. My zakładamy, że adresatami audiodeskrypcji filmów dla małych dzieci są dzieci słabowidzące. Tym odbiorcom – jak wszystkim, niezależnie od wieku – dostarczamy emocji, wciągamy ich w fabułę, czyli – bawimy! Cokolwiek to znaczy 🙂

Jako ilustracja „Pies w cyrku”. Audiodeskrypcja tak wrosła w film, że wydaje się narracją z góry zaplanowaną i przemyślaną przez jego twórców. Między nami mówiąc – jest jedyną wersją tego filmu dostępną na stronie Ninateka.pl. Proszę tego nie powtarzać 🙂

Testowanie AI

Pytanie związane z wiadomością dnia, czyli: Jakie są nowe zasady polskiej pisowni ogłoszone przez Radę Języka Polskiego?

Gemini.google.com odpowiada m.in:

  • Pisownia wielką literą: Nazwy nieoficjalnych grup etnicznych i wyznaniowych, np. Żyd, Cygan, Murzyn, o ile nie są używane w znaczeniu pejoratywnym.
  • Dopuszczenie alternatywnej pisowni wielką lub małą literą nazw kontynentów, np. Europa lub europa.
  • Ujednolicenie pisowni nazw kierunków geograficznych, np. Północ zamiast Północna.
  • Zmiany w pisowni niektórych wyrazów, np. agrest zamiast arogest, galeria zamiast galeryja.

Biedne dzieci korzystające z porad AI. Skąd ona/on to wyciągnęła/-ął?

Rada Języka Polskiego uchwaliła szereg zmian w polskiej ortografii, które wejdą w życie 1 stycznia 2026 roku. Poniżej przedstawiam najważniejsze z nich:

1. Pisownia wielką literą:

Nazwy mieszkańców wsi, miast, ich dzielnic i osiedli, np. Warszawianin, Ochocianka, Mokotowianin.
Nazwy nieoficjalnych grup etnicznych i wyznaniowych, np. Żyd, Cygan, Murzyn, o ile nie są używane w znaczeniu pejoratywnym.
Pojedyncze egzemplarze wyrobów firmowych i marek, np. kupiłem nowy Forda, mam w domu Oskara (psa rasy cocker spaniel).
2. Pisownia łączna:

Cząstki -bym, -byś, -by, -byśmy, -byście z czasownikami, np. gdybym wiedział, żebyś poszedł.
Przymiotniki od nazwisk zakończone na -owski, np. Mickiewiczowski, Słowacki.
Człon pół- w wyrażeniach typu: półnauka, półżartem, pół-Francuzka.
3. Pisownia rozdzielna:

Partykuła "nie" z imiesłowami przymiotnikowymi przysłówkowymi, np. nie zrobione zadanie, nie załatwiona sprawa.
Wyrażenia typu: na co dzień, raz na raz, co rusz.
Pary wyrazów równorzędnych, np. tuż-tuż, trzask-prask, bij-zabij (dopuszczalne są również wersje z łącznikiem i przecinkiem).
4. Inne zmiany:

Dopuszczenie alternatywnej pisowni wielką lub małą literą nazw kontynentów, np. Europa lub europa.
Ujednolicenie pisowni nazw kierunków geograficznych, np. Północ zamiast Północna.
Zmiany w pisowni niektórych wyrazów, np. agrest zamiast arogest, galeria zamiast galeryja.

Moje dialogi ze sztuczną inteligencją – ciąg dalszy

Poniżej – sztuczna inteligencja pisze sama o sobie. Pisownia oryginalna, także literówki. Nawet sztuczna inteligencja nie jest pod tym względem idealna. Tekst ilustruje autoportret, czyli grafika wykonana przez sztuczną inteligencję, przedstawiająca sztuczną inteligencję, tworzącą napisy dla niesłyszących. Przynajmniej tak uważa autorka. A jeszcze niżej – autoopis tej grafiki.

Moje wnioski? Zgadzam się z wnioskami sztucznej inteligencji: ma potencjał, korzystam z niego, ale mnie nie zastąpi 🙂

Możliwości zastosowania sztucznej inteligencji (AI) w tworzeniu audiodeskrypcji i napisów dla niesłyszących

Sztuczna inteligencja (AI) przekształca wiele aspektów naszego życia, a jednym z najbardziej obiecujących obszarów jest jej zastosowanie w tworzeniu audiodeskrypcji i napisów dla niesłyszących.

Audiodeskrypcja

Audiodeskrypcja to narzędzie, które umożliwia osobom niewidomym lub niedowidzącym lepsze zrozumienie treści filmowych, telewizyjnych czy teatralnych. Polega na dodaniu do dźwięku filmu opisu obrazów, które są ważne dla zrozumienia fabuły.

AI ma potencjał do automatycznego generowania tych opisów. Na przykład, zaawansowane modele AI mogą być trenowane do rozpoznawania i opisywania obrazów, co mogłoby obejmować identyfikację postaci, akcji i innych elementów sceny. Chociaż ta technologia jest wciąż w fazie rozwoju, istnieją już narzędzia, które pokazują jej potencjał.

Napisy dla niesłyszących

Napisy dla niesłyszących to tekstowe reprezentacje dialogów i dźwięków z filmów, programów telewizyjnych i innych mediów. Są one niezbędne dla osób niesłyszących i niedosłyszących, aby mogły one pełniej cieszyć się tymi treściami.

AI może przyczynić się do tworzenia napisów na kilka sposobów. Na przykład, technologie rozpoznawania mowy mogą być używane do automatycznego transkrybowania dialogów. Ponadto, AI może być używana do identyfikacji i opisuwać dźwięków w tle, które są ważne dla zrozumienia kontekstu.

Wnioski

Chociaż technologia AI wciąż się rozwija, jej potencjał w tworzeniu audiodeskrypcji i napisów dla niesłyszących jest obiecujący. Dzięki AI, te usługi mogą stać się bardziej dostępne i efektywne, co przyczyni się do tworzenia bardziej inkluzjewnych mediów dla wszystkich. Jednakże, ważne jest, aby pamiętać, że AI nie zastąpi ludzkiego dotyku i empatii, które są niezbędne w tworzeniu skutecznych i angażujących opisów audiodeskrypcyjnych i napisów dla niesłyszących. AI powinna być postrzegana jako narzędzie, które może wspierać i uzupełniać ludzkie wysiłki, a nie je zastępować.

Na obrazie widzimy robotyczny stwór o skomplikowanym wyglądzie. Jego głowa jest pełna anten i detali. Robot rozmawia z małą, uproszczoną postacią ludzką. Oboje są otoczeni kosmicznym tłem z gwiazdami i dziwnymi stworzeniami. Kontrast między złożonym robotem a prostą postacią ludzką oraz tłem z pewnością przyciąga uwagę.

Opis autoportretu sztucznej inteligencji. Autorka: sztuczna inteligencja

Na obrazie widzimy robotyczny stwór o skomplikowanym wyglądzie. Jego głowa jest pełna anten i detali. Robot rozmawia z małą, uproszczoną postacią ludzką. Oboje są otoczeni kosmicznym tłem z gwiazdami i dziwnymi stworzeniami. Kontrast między złożonym robotem a prostą postacią ludzką oraz tłem z pewnością przyciąga uwagę.

Zima, zima i po zimie, czyli… Drżyjcie, audiodeskryptorzy! Nadchodzi AI!

Czas pędzi, galopuje… Rozchodnik z dnia na dzień coraz śmielej wychyla się spod ziemi. Świat się zmienia. Trzeba też zauważyć, że dojrzewa nasza koleżanka AI. Jeszcze niedawno mogliśmy zakładać, że w pisaniu AD nieprędko nam pomoże, a tymczasem…

Powstają filmy tworzone przez AI na podstawie opisów. Warto Zajrzeć na Twitterowy (X-owy) profil OpenAI.

Na załączonym print screenie tłumaczenie oczywiście też automatyczne. W tekście coś byśmy poprawili, ale nie jest bezużyteczny. Jeśli koleżanka AI potrafi wygenerować ruchome obrazy identyczne z naturalnymi, zapewne potrafi lub wkrótce będzie umiała odwrócić kolejność i na podstawie filmu wygenerować tekst, który nie będzie bezużyteczny. Strach się bać! A może nie? Ciekawe czasy 🙂

Print screen ze strony "X". Tekst: Piękne, śnieżne miasto Tokio tętni życiem. Kamera porusza się po tętniącej życiem ulicy miasta, podążając za kilkoma osobami cieszącymi się piękną śnieżną pogodą i robiącymi zakupy na pobliskich straganach". Poniżej obrazek wygenerowany na podstawie tego tekstu: miasto, ośnieżonym chodnikiem idzie trzymająca się za ręce para.

PS Oto co się wyszukuje po wpisaniu: video to text. Będzie co testować.

Print screen. Wyniki wyszukiwania "video to text".

Koniec wakacji, czyli… Powtórka!

Pisanie audiodeskrypcji to: analiza obrazu, montażu, narracji, emocji, czytanie języka kina, cyzelowanie każdego słowa… 

Wróć! To SŁUCHANIE!

Przypominamy „Założenia Dekalogu Audiodeskryptora” w tym najważniejszy ogół:

Audiodeskrypcja jest do SŁUCHANIA.

Ucho człowieka. Obok umowne fale dźwiękowe i napisy: audio.

Wyobraźmy sobie…

  1. W obrazie – małe płaczące dziecko. Zaraz potem – głośno buczący parowiec, dźwięk nadający audiodeskrypcyjnemu komunikatowi o dziecku prześmiewczy charakter.
  2. Możliwy tekst AD: „Kobiety ubierają małego chłopca”, ale… Zaraz potem narracja: „To jest tytaniczna praca” :).

Jak uniknąć niezręczności wynikających z zestawienia tekstu audiodeskrypcji z dźwiękiem filmu?

Wybrać inny obraz, inną informację. Jeśli to niemożliwe, jeśli informacja jest ważna, znaleźć dla niej inne miejsce i kontekst dźwiękowy.

Wniosek? Audiodeskryptor musi być pierwszym słuchaczem audiodeskrypcji. Bardzo uważnym.

PS. Ilustracja to radosna twórczość AI. Czarno widzi pracę nad audiodeskrypcją.

AI pisze AD

Czytaj więcej o: AI pisze AD

Wersja 3,5 nie daje możliwości wstawienia obrazu, więc nie mogę mieć zastrzeżeń do wierności opisu. Interpunkcja – bez zarzutów. Jedna literówka, bo „jabłońka” to chyba literówka. Zaskakuje – miltisensoryczność i subiektywizm. Czyżby AI nie znała standardów?

Wyobraź sobie kwitnącą jabłoń, rosnącą w doniczce na balkonie. Napisz audiodeskrypcję.
W tle słychać ciche szumienie wiatru, a przed oczami ukazuje się urocza jabłońka rosnąca w doniczce na balkonie. Jej łodyga jest delikatna i giętka, pokryta licznymi zielonymi liśćmi. Na gałęziach rozwijają się piękne, białe kwiaty, które prezentują się wspaniale w promieniach słonecznych. Kwiaty jabłonki są niesamowicie delikatne i subtelne, ich płatki układają się w kształt pucharów, a w ich środku widoczne są koralikowe pyłki. W powietrzu unosi się słodki i intensywny zapach, który przyciąga pszczoły i motyle.
Jabłońka ta, mimo że rośnie w doniczce na balkonie, w pełni emanuje wiosenną energią i pięknem. Jej kwiaty wabią do siebie wszystkich, którzy przechodzą w pobliżu, a ich delikatność i piękno pozostają w pamięci na długo po zniknięciu z pola widzenia.

Opowiadanie o napisach dla niesłyszących Autor/ka: AI

Czytaj więcej o: Opowiadanie o napisach dla niesłyszących Autor/ka: AI

Zespół tworzący napisy dla niesłyszących zawsze starał się być na bieżąco z najnowszymi trendami i technologiami. Pewnego dnia postanowili przetestować swoje nowe narzędzie do automatycznego tłumaczenia mowy na tekst, aby zwiększyć swoją wydajność i szybkość działania.

Podczas konferencji, na której mieli pracować, okazało się jednak, że narzędzie było bardziej kłopotliwe niż pomocne. Kiedy pierwszy prelegent zaczął mówić, narzędzie natychmiast zaczęło generować dziwaczne napisy, które nie miały nic wspólnego z jego wystąpieniem. Zamiast mówić o przyszłości technologii, prelegent zdawał się opowiadać o swoich ulubionych przepisach na ciasto!

Zespół nie wiedział, co zrobić, ale postanowił działać szybko. W jednej chwili usunęli narzędzie i zaczęli tworzyć napisy ręcznie. Chociaż było to mniej wydajne, zespół był w stanie nadążyć za prelegentem i dostarczyć niesłyszącym dokładne i sensowne tłumaczenia jego słów.

Po konferencji zespół zdecydował, że nie ma znaczenia, jak zaawansowana jest technologia, zawsze będzie potrzebna ludzka interwencja i umiejętności, aby zapewnić najlepszą jakość tłumaczeń dla niesłyszących. I tak właśnie postanowili działać, ponieważ jak powiedział jeden z członków zespołu: „Nie chcemy, aby nasi niesłyszący widzowie jedli ciasto, gdy mówimy o technologii”.

PS 1 Komentarz niesztucznej autorki:

Zadanie brzmiało: napisz dowcipne opowiadanie o tworzeniu napisów dla niesłyszących. Nie mam wrażenia, że AI zadanie wykonał/a. Ale jest w tym jakieś drugie dno. Tylko jakie? Co Autor/ka miał/a na myśli? 🙂

PS 2 Komentarz drugiej niesztucznej autorki:

Podlizuje się. Może chce uśpić ludzką czujność.

Do góry