Tak samo jak automatyczne napisy w yt. niby działają na filmikach promocyjnych gdy ktoś mówi wyraźnie dobrze akcentuje i robi przerwy w miejsca kropek. Ale niestety jak się zaczyna normalna szybka rozmowa, takie urządzenia przestają działać.
Nie dosyć, że cała rozmowa została przygotowana przedtem, więc można było się dostosować do działania programu, to jeszcze lektorzy mówią krystalicznie czystym językiem.
Nie dość, że w czasie burzy pojawia się ogień jak pada i ciężko go utrzymać, to nawet nie wiadomo gdzie się pojawi. Nie można nawet go łatwo przenieść, bo może opażyć.
Nie od razu Rzym zbudowano. Wspomnijmy pierwsze komputery składające się z kilkudziesięciu lamp elektronowych, w porównaniu do dzisiejszych komputerów z miliardami tranzystorów. Oczywiście system na chwilę obecną nie jest idealny i dokładny ale wskazuje kierunek rozwoju technologii. Na przestrzeni ostatnich lat dynamiczny rozwój Deep Learningu powalił na tworzenie takich systemów i jest to tylko kwestia czasu kiedy poziom błędu będzie akceptowalny.
Nie widzę tu żadnej rewolucji szczerze powiedziawszy, sporo błędów było, a wszystkie te elementy czyli zamiana tekstu pisanego na mowę i odwrotnie + przetłumaczenie robi oczywiście chociażby google translate.
Komentarze (56)
najlepsze
Tak samo jak automatyczne napisy w yt. niby działają na filmikach promocyjnych gdy ktoś mówi wyraźnie dobrze akcentuje i robi przerwy w miejsca kropek. Ale niestety jak się zaczyna normalna szybka rozmowa, takie urządzenia przestają działać.
W praktyce nie ma szans, żeby to działało dobrze.
@archlinuxuser: Bzdura, kwestia czasu i pracy wielu ludzi nad poprawą algorytmów.
Nie dość, że w czasie burzy pojawia się ogień jak pada i ciężko go utrzymać, to nawet nie wiadomo gdzie się pojawi. Nie można nawet go łatwo przenieść, bo może opażyć.
W praktyce nie ma szans, żeby to działało dobrze.
Homo erectus.
https://www.youtube.com/watch?v=G6D1YI-41ao