Ewolucja technologii głosowej: rewolucja w interakcji człowiek-maszyna

W ostatnich latach coraz częściej korzystamy z głosu jako narzędzia do sterowania i komunikacji z maszynami. Ten zachodzący proces zmienia sposób, w jaki współdziałamy z naszymi najważniejszymi i najpotężniejszymi narzędziami, co ma głębokie implikacje dla naszych relacji z technologią i szeroko rozumianym społeczeństwem.

Przesunięcie w stronę świata sterowanego głosem przyspieszyło znacznie dzięki pojawieniu się generatywnej sztucznej inteligencji (AI) i dużych modeli językowych. Zamiast sztucznych i frustrujących rozmów, które prowadzimy z asystentami, takimi jak Alexa czy Siri, generatywna sztuczna inteligencja oferuje naturalnie płynne, kontekstowe dwustronne komunikacje.

Jedną z osób, która szczegółowo rozważa te zmiany, jest autor i prezydent WillowTree, Tobias Dengel. W swojej najnowszej książce „Dźwięk przyszłości – Era technologii głosowej” Dengel bada sposoby, w jakie świat prawdopodobnie zmieni się wraz z zburzeniem końcowych barier technicznych programowania i sterowania maszynami.

Dengel twierdzi, że zmiana w sposobie komunikacji z maszynami ma o wiele szersze implikacje niż tylko umożliwienie nam prowadzenia rozmów z urządzeniami. Naturalny charakter języka oznacza, że będziemy korzystać z technologii o wiele wydajniej, dzięki czemu stanie się ona bardziej dostępna dla większej liczby osób.

W trakcie naszej rozmowy mówi mi: „Ludzie potrafią mówić trzy razy szybciej niż pisać na klawiaturze – prawdopodobnie pięć razy szybciej niż przeciętna osoba pisząca na urządzeniu mobilnym… to jest kluczowe spostrzeżenie. Gwarantuję, że gdy coś, co zajmowało trzy minuty, będzie można zrobić teraz w 15 sekund, świat zmieni się z dnia na dzień.”

Jego stanowisko jest takie, że świat szybko przesunie się w kierunku modelu, w którym głos stanie się naszym podstawowym interfejsem do maszyn. Innymi słowy, do zaawansowanych operacji na maszynach, takich jak programowanie komputerów, nie będziemy musieli już uczyć się języka maszyn, ponieważ będą one komunikować się w naszym języku.

Tutaj ważną kwestią jest dostępność. Przejście na głosową interakcję z technologią demokratyzuje jej wykorzystanie, co oznacza, że większa i bardziej zróżnicowana grupa ludzi będzie mogła wykorzystać zaawansowane systemy do rozwiązywania problemów. Dengel uważa, że to nie tylko kwestia wygody, ale fundamentalna zmiana w naszych relacjach z technologią.

Jak mówi, „Zobaczysz, jak każdy interfejs pomiędzy człowiekiem a maszyną zostanie przesunięty ku głosowi.”

Dźwięk w działaniu

W swojej książce, a także w naszej rozmowie, Tobias podaje przykłady, jak ta zmiana już się dokonuje.

Oczywiście, obejmują one asystenty głosowe, które wszyscy mamy w domach i na telefonach, ale jasno podkreśla, że ten trend wykracza daleko poza Alexę i Siriego.

Jednym z jego ulubionych przykładów jest Cathay Pacific, który, jak twierdzi, zastosował technologię rozpoznawania mowy w narzędziu asystującym do rutynowego utrzymania i czyszczenia samolotów.

„Dzięki temu mają teraz głos, który mówi: 'Hej, fotel 13C ma zepsutą podłokietnik’ podczas wykonywania swojej pracy.”

Wskazuje również na technologię sterowania głosem opracowaną dla samolotów wojskowych, która teraz jest wdrażana w lotnictwie cywilnym.

„Wszystkie te wypadki miały miejsce dlatego, że piloci nie wiedzieli, co robi samolot i jak z nim współpracować – gdyby mieli głosowe instrukcje, mogliby wyłączyć autopilota, zrobić coś i uniknąć tych wypadków.”

Jako przykład, jak to może rewolucjonizować technologie codziennego użytku, sugeruje, że aplikacje bankowe znacznie się poprawią, gdy użytkownicy będą mogli poprosić o to, czego chcą, i otrzymać natychmiastowe rezultaty, zamiast nawigować przez setki możliwych funkcji na małym ekranie.

Wspomina również o jednym z klientów WillowTree, dużym producencie napojów bezalkoholowych, który opracował systemy głosowe umożliwiające zamówienie części zamiennych dla maszyn w automatach lub restauracjach. Dzięki temu zaoszczędza się godziny, które wcześniej były poświęcane na przeglądanie katalogów w poszukiwaniu kodów lokalizacyjnych i produktowych.

Etyka i wyzwania

Trudno przecenić wpływ, jaki ta zmiana będzie miała na społeczeństwo. Jedno z największych pytań dotyczy jej wpływu na zatrudnienie i miejsca pracy.

„Dane statystyczne pokazują, że będzie więcej miejsc pracy” – mówi Dengel, „jednak pojawią się też pewne zakłócenia.

„I tutaj istotne jest podejmowanie decyzji politycznych, wsparcie ze strony rządu.”

Zdaniem Dengela najbardziej zagrożone są już teraz stanowiska takie jak operator w centrum obsługi telefonicznej, które są już zastępowane przez narzędzia do konwersacji oparte na sztucznej inteligencji.

Ale zdaniem Dengela, to zostanie zrównoważone nie tylko przez nowe miejsca pracy, takie jak „inżynier ds. promptów”, które będą tworzone, ale także przez mnóstwo sposobów, w jakie będziemy mogli tworzyć wartość przy wykorzystaniu sztucznej inteligencji.

Równie ważne są kwestie związane z bezpieczeństwem. Już teraz widzimy, że oszuści i szantażyści wykorzystują technologię głosową AI do podszywania się. Istnieje realne ryzyko, że te ataki staną się powszechne, gdy AI stanie się tańsze i bardziej dostępne, co prowadzić będzie do większej liczby ofiar.

Jednak Dengel nie martwi się tak bardzo o odległe obawy, które niekiedy są podnoszone.

Mówi, „Niektórzy mówią o AI wariującej i walczącej z ludźmi… Osobiście nie martwię się tym zbytnio, przynajmniej w naszym życiu.

„ChatGPT jest niesamowity, ale obecnie nie jest w stanie nawet zmienić adresu korespondencyjnego na Twojej karcie American Express, ponieważ nie jest podłączony do systemu. Ale może być skutecznie wykorzystywany do celów złych.”

Przygotowanie na przyszłość zasilaną głosem

Jak możemy przygotować się na ten uniwersalny przejście do technologii sterowanej głosem i prowadzenia naturalnych rozmów z maszynami?

Dengel sugeruje, że odpowiedź tkwi w dostrzeżeniu wyzwania i podjęciu go odważnie. Oznacza to stworzenie zespołów złożonych z technologów, inżynierów, projektantów, ekspertów ds. komunikacji i liderów biznesowych. Ich głównym celem jest identyfikacja możliwości i potencjalnych zagrożeń dla biznesu, co pozwoli zarządzać nimi w sposób aktywny, a nie reaktywny.

„To zawsze jest pierwszy krok” – mówi Dengel, „ponieważ zaczynasz definiować to, co możliwe, ale robisz to w kontekście tego, co jest realne, ponieważ bierzesz udział także ludzi związanych z technologią… a następnie tworzysz roadmapę.”

To podejście „warsztatowe”, zapoczątkowane przez Apple i przyjęte przez różne giganty technologiczne, które znalazły się na czele nadchodzącej fali transformacji. Ale jest równie stosowalne dla wszystkich, którzy chcą zyskać przewagę dzięki rewolucji technologii głosowej.

Sekcja FAQ:

1. Jak głosowa interakcja z maszynami może zmienić nasze relacje z technologią?
Głosowa interakcja z maszynami ma szerokie implikacje, umożliwiając nam korzystanie z technologii bardziej efektywnie i demokratyzując jej wykorzystanie. Staje się ona bardziej dostępna dla większej liczby osób.

2. Jakie są już przykłady zmian wynikających z głosowej interakcji z technologią?
Przykłady obejmują zastosowanie rozpoznawania mowy w narzędziach asystujących w czyszczeniu samolotów, technologię sterowania głosem dla samolotów wojskowych i civilnych, oraz systemy głosowe w aplikacjach bankowych i zamówieniach części zamiennych dla maszyn.

3. Jak głosowa interakcja wpłynie na społeczeństwo?
Głosowa interakcja ma wpływ na zatrudnienie i miejsca pracy. Niektóre stanowiska mogą zostać zastąpione przez narzędzia oparte na sztucznej inteligencji, ale tworzone będą także nowe miejsca pracy. Istnieją również obawy dotyczące bezpieczeństwa, związane między innymi z ewentualnym wykorzystaniem technologii głosowej przez oszustów i szantażystów.

4. Jak możemy się przygotować na tę zmianę?
Aby przygotować się na przejście do technologii sterowanej głosem, ważne jest podjęcie wyzwania i stworzenie zespołów z różnych dziedzin, które będą identyfikować możliwości i zagrożenia dla biznesu. Należy działać w sposób aktywny, a nie reaktywny.

Definicje:

– Generatywna sztuczna inteligencja (AI): Zastosowanie algorytmów uczenia maszynowego do generowania nowych danych, na podstawie którego modele AI mogą wypowiadać się w swoim własnym języku.
– Interfejs głosowy: Sposób komunikacji z maszynami przy użyciu głosu, zamiast tradycyjnych interfejsów tekstowych lub graficznych.

Sugerowane linki powiązane z główną domeną:

1. WillowTree – Strona główna WillowTree, firmy zajmującej się technologią głosową.
2. Strona Cathay Pacific – Strona główna Cathay Pacific, linii lotniczych wspomnianej w artykule.
3. Apple – Strona główna Apple, firma która znalazła się na czele transformacji technologii głosowej.
4. Alexa – Strona domowa Alexy, asystenta głosowego wspomnianego w artykule.
5. Siri – Strona domowa Siri, asystenta głosowego wspomnianego w artykule.
6. American Express – Strona główna American Express, karty kredytowej wspomnianej w artykule.

The source of the article is from the blog procarsrl.com.ar