Collaborative UX - 7 wzorców projektowania dla AI według Johna Maedy #EN131

TL;DR

Copilot stack składa się z 5 warstw – od infrastruktury AI przez modele fundamentalne, orkiestrację AI, UX po wtyczki
Collaborative UX odwraca tradycyjne zasady – zamiast usuwać tarcie, świadomie je dodaje dla bezpieczeństwa użytkowników
7 wzorców collaborative UX – od AI notices przez suggested prompts po feedback opportunities i nie-humanizowanie AI
Żelazny trójkąt zostaje czworościanem – do speed, cost i quality dochodzą emocje jako czwarty wymiar
Semantic Kernel umożliwia szybkie prototypowanie – testowanie pomysłów bez instalacji całego repozytorium
Odpowiedzialne AI wymaga myślenia przed działaniem – używanie AI jako kalkulatora konsekwencji etycznych
Użytkownik to pilot, AI to copilot – hierarchia musi być jasna i niezmieniona

Era sztucznej inteligencji wymaga całkowicie nowego podejścia do projektowania doświadczeń użytkownika. John Maeda, VP of Design and AI w Microsoft, przedstawia rewolucyjne spojrzenie na UX w kontekście AI. Jego koncepcja „collaborative UX” odwraca tradycyjne zasady projektowania. Jednak Maeda nie rozpoczął tej podróży od AI – napisał „The Laws of Simplicity” w 2006 roku z 10 prawami projektowania. Dziś, w erze AI, upraszcza to do trzech najważniejszych: prawo emocji, prawo zaufania i prawo porażki. To ostatnie jest kluczowe, ponieważ natura AI to mieszanka sukcesów i porażek.

Copilot stack – 5-warstwowa architektura przyszłości

Copilot stack to fundamentalna zmiana w myśleniu o architekturze AI. Microsoft Build 2023 przedstawił stos technologiczny, który po raz pierwszy umieścił UX na pierwszym planie. Dlatego stack składa się z pięciu kluczowych warstw:

Infrastruktura AI – świat GPU i sprzętu (koła i podwozie samochodu)
Modele fundamentalne – „paliwo” systemu (benzyna, elektryczność, wodór)
Orkiestracja AI – Semantic Kernel (kierownica i hamulce)
UX – interfejs użytkownika (deska rozdzielcza, szyba, fotele)
Wtyczki – dodatki do dokupienia (akcesoria samochodowe)

Kluczowa różnica polega na determinizmie. Tradycyjny stos technologiczny był deterministyczny – kalkulator zawsze zwróci ten sam wynik dla 12+12. Jednak copilot stack jest częściowo niedeterministyczny. Czasami da inną odpowiedź, czasami błędną.

Stara jakość to precyzja. Natomiast nowa jakość to „wysokiej jakości nieprecyzja”. W copilot stack bezpieczeństwo nie jest modułem – musi przebiegać przez każdą warstwę stosu.

Ponadto developerzy muszą nauczyć się nowego słowa: współpracować. Nie tylko z kodem, ale z partnerami marketingowymi, produktowymi, designerskimi i operacyjnymi. Dzieje się tak dlatego, że ta technologia zmienia się tak szybko, a developer może być jedyną osobą w organizacji, która naprawdę rozumie matematykę i proces obliczeniowy.

Collaborative UX – koniec ery rozkazów

Tradycyjne interfejsy opierały się na modelu rozkazującym. Użytkownik wydawał polecenie: „Komputer, zrób to”. Następnie komputer odpowiadał: „Tak jest, szefie”. Collaborative UX wprowadza model współpracy.

Wszyscy jesteśmy przyzwyczajeni do kalkulatora. Dodaj 12 i 12, otrzymasz 24. Jednak wyobraź sobie, że kalkulator mówi: „Współpracujmy nad odpowiedzią”. Nie pozwoliłbyś na to – po prostu rozkazujesz mu. To stary sposób. Nowy sposób to współpraca.

Mimo to użytkownik to pilot. AI to copilot. Pilot ma kontrolę nad sytuacją. Copilot jest tylko tak dobry, jak pilot, który nim kieruje. To fundamentalna zasada nowego paradygmatu.

Joseph Weizenbaum, pionier systemów chatbotów, już w latach 70. ostrzegał przed niebezpieczeństwem. Napisał: „Nie zdawałem sobie sprawy, że bardzo krótka ekspozycja na stosunkowo prosty program komputerowy może wywołać potężne myślenie urojeniowe u całkiem normalnych ludzi”.

Collaborative UX jako filozofia w Microsoft rozwija się błyskawicznie w erze copilotów. Dlatego Maeda używa emoji krzyk – nie tego z „Kevin sam w domu”, ale nawiązującego do obrazu „Krzyk” Edvarda Muncha. Kiedy ludzie po raz pierwszy go zobaczyli, myśleli, że przedstawia szaloną osobę. Ta era często przypomina szaleństwo.

Kluczowa obserwacja z książki „How to Speak Machine”: jeśli jesteś ciekaw, potrafisz być mniej przestraszony i bardziej kreatywny. Natomiast gdy jesteś tylko przestraszony, stajesz się destrukcyjny. Niszczysz to, co na ciebie nadchodzi. Tak będzie z wieloma osobami spoza tech – nie będą rozumiały AI.

Collaborative UX składa się z siedmiu kluczowych wzorców:

AI Notice Pattern – irytujące powiadomienia przypominające, że to AI generuje informacje. Zmusza użytkowników do krytycznego myślenia
Suggested Prompts – AI podpowiada, w czym jest dobre, zamiast pozwalać użytkownikom błądzić
Feedback Opportunities – użytkownicy jako krytycy myślący w duecie z AI muszą móc dawać feedback
Status Updates – dodatkowe informacje o tym, co się dzieje w tle
Citations – źródła pozwalające użytkownikom na głębsze sprawdzenie informacji
Invisible Craft – optymalizacje kosztów, za które developer nie dostanie uznania, ale które są kluczowe
Don’t Humanize AI – unikanie sprawiania wrażenia, że AI to najlepszy przyjaciel użytkownika

Więcej o praktykach collaborative UX znajdziesz tutaj.

Praktyczne zarządzanie tempem, kosztami i jakością

Semantic Kernel Extension dla Visual Studio Code umożliwia szybkie prototypowanie bez instalacji całego repozytorium GitHub. Wystarczy wpisać „Semantic Kernel” w extensions i można rozpocząć pracę.

Optymalizacja kosztów wymaga kreatywnego podejścia. Weź modele OpenAI: DaVinci, GPT-4, ale DaVinci miał poprzedników – Curie, Babbage i ADA. To jak alfabet ABCD – A najstarszy, D najnowszy. Jednak Ada jest znacznie tańsza niż DaVinci. Sztuka polega na stworzeniu „koktajlu” z różnych modeli.

Szósty wzorzec collaborative UX to „invisible craft” – niewidzialna rzemieślniczość. Developer robi dziwne rzeczy w copilot stack, żeby zmniejszyć koszty. Nie dostanie za to uznania, chyba że rzeczywiście ruszy wskaźniki. To częste w świecie japońskich rzemieślników – perfekcyjna inżynieria i spryt, ale też potęga narracji marki, żeby ludzie doceniali to, co dzieje się za kulisami.

Caching to sprawdzona metoda redukcji kosztów – przechowywanie wyników poprzednich zapytań i używanie podobieństwa wektorowego do porównywania nowych tekstów.

Semantic Kernel działa jak architekt do rozmowy. Zamiast samotnie rozwikływać problemy kosztów, developer może prowadzić dialog z systemem. AI pomaga myśleć na głos o optymalizacjach. Ponadto inżynieria potrafi być samotna, a to fundamentalny problem z kosztami LLM.

Jeśli wypróbujesz GPT-4, szybko odkryjesz, że kod, który generuje, jest prawdopodobnie 3-4 razy lepszy niż GPT-3. To przykład tego, jak praca z AI pozwala przyspieszyć nasz „mięsień powolnego myślenia”, którego nigdy nie wykorzystujemy w codziennym życiu.

Żelazny trójkąt staje się czworościanem

Tradycyjny żelazny trójkąt projektów – speed, cost, quality – w erze AI zyskuje czwarty wymiar: emocje. Designerzy wiedzą, jak zarządzać emocjami użytkowników. Jednak oświeceni developerzy muszą się tego nauczyć.

Herbert Simon, pionier AI, opisywał sztuczną inteligencję jako „nożyce”. Jedno ostrze to poznanie (cognition blade) – model fundamentalny. Drugie ostrze to kontekst – prompty i otoczenie. Razem tworzą niesamowity świat copilotów. Ale jak mówili rodzice: nie biegaj z nożycami. To niebezpieczne.

Dlatego Sam Schillace, deputy CTO Microsoftu, ciągle myśli o tym, jak łączą się dwa światy: syntax (konwencjonalne kodowanie) i semantic (kodowanie AI promptami). Z jednej strony mamy precyzję, z drugiej potęgę. Ta kombinacja jest niezwykła.

Paul Ekman opisał w 1976 roku sześć typów emocji: strach, zaskoczenie, smutek, radość, wstręt, gniew. Tylko jedna szósta to pozytywne reakcje. Większość czasu spędzamy na negatywnych emocjach.

Krzywa Kübler-Ross pokazuje, jak ludzie radzą sobie ze zmianą. Odkrywają coś nowego, nie lubią tego, próbują wrócić do poprzedniego stanu. Niektórzy utykają w depresji. Mimo to AI to ogromna zmiana dla użytkowników.

Projektując produkty, szukasz „sweet spot” – wysokiej znajomości i wysokiej nowości. Coś znajomego i nowatorskiego jednocześnie? To brzmi bez sensu, ale ludzie lubią ten kwadrant – podobne do przeszłości, ale też zupełnie nowe. Bardzo trudne do stworzenia. Taki design zdarza się bardzo rzadko.

Semantic Kernel może służyć jak „kalkulator emocji”. Funkcja testująca reakcje różnych grup użytkowników na komunikaty błędów. Dla początkujących użytkowników komunikat „Brakuje pliku .env. Zakończenie” wywołuje frustrację i przytłoczenie. Natomiast dla ekspertów księgowych czas to najcenniejszy zasób.

Checklist wdrożenia collaborative UX

Podstawy: □ Zainstaluj Semantic Kernel Extension w VS Code
□ Przygotuj klucze OpenAI lub Azure OpenAI
□ Zastosuj wszystkie 7 wzorców collaborative UX
□ Przetestuj różne modele dla optymalizacji kosztów
□ Zadaj pytanie: „Jak się poczuje użytkownik, gdy to zobaczy?”

Dodawanie tarcia jako nowa matematyka UX

Wszystkie wzorce collaborative UX dodają tarcie zamiast je usuwać:

AI notices – zmuszają do krytycznego myślenia
Suggested prompts – wymagają wyboru
Citations – zmuszają do czytania źródeł
Status updates – dostarczają więcej informacji
Feedback – wymagają zaangażowania użytkownika

Tylko invisible craft usuwa tarcie – to coś, w czym inżynierowie są dobrzy. Jednak pozostałe wzorce świadomie spowalniają użytkowników dla ich własnego bezpieczeństwa.

Odpowiedzialne AI – myślenie przed działaniem

Frank Oppenheimer, fizyk cząstek z projektu Manhattan, założył Exploratorium w San Francisco. Naukowcy tworzący broń masowego rażenia zaczęli pytać: do czego służy nauka, jeśli nie może chronić ludzkiego życia?

Joseph Weizenbaum, uciekając z nazistowskich Niemiec, stworzył pierwszego chatbota, ale potem przestraszył się konsekwencji swojego wynalazku. Zwykle myślimy krytycznie po tym, jak coś złego się stanie.

Tym razem mamy szansę myśleć krytycznie przed potencjalnymi negatywnymi konsekwencjami AI. Co więcej, samo AI może pomóc w krytycznym myśleniu.

Semantic Kernel pozwala na stworzenie funkcji „make_me_responsible”. Wykorzystując taksonomię szkód Microsoftu, można testować funkcje pod kątem potencjalnych problemów. Funkcja do szybkiego pobierania informacji o kartach kredytowych może prowadzić do dyskryminacji ekonomicznej czy różnicowego wyceniania.

AI może służyć jako „kalkulator odpowiedzialności”. Zamiast testów jednostkowych, przyszłość może przynieść testy odpowiedzialnego AI. Nie tylko dla outputu AI, ale dla ludzkich pilotów rozwijających copiloty dla innych.

Pierwsze kroki z Semantic Kernel

Maeda zachęca do działania: pobierz Semantic Kernel, mamy chat reference apps – wdróż je, dostosuj, przetestuj z bazą użytkowników, zoptymalizuj i przygotuj się na odpowiedzialne skalowanie. Najważniejsze to jak najszybciej zacząć współpracować z użytkownikami. To od nich się najwięcej nauczysz.

Kluczowy insight

Paradoks tarcia w AI

Standardowo myślimy: Dobry UX to usuwanie tarcia, upraszczanie kroków, eliminowanie przeszkód

Prawda jest taka: W AI najlepszy UX to świadome dodawanie tarcia w kluczowych momentach

Dlaczego to przełomowe: Odwraca 30 lat filozofii UX design. AI może się mylić, więc tarcie staje się mechanizmem bezpieczeństwa, który chroni użytkowników przed błędnymi decyzjami opartymi na niepewnych odpowiedziach.

Test na jutro: Następnym razem gdy projektujesz interfejs AI, zamiast pytać „jak to uprościć?” spytaj „gdzie dodać moment refleksji?” i sprawdź czy użytkownicy podejmują lepsze decyzje.

Ten wpis jest częścią mojej kolekcji notatek z ciekawych podcastów, webinarów i innych treści, które uważam za wartościowe i do których sam chcę wracać. Jeśli chcesz sprawdzić oryginalne źródło, znajdziesz je tutaj: UX for AI: Design Practices for AI Developers – LinkedIn Learning

Collaborative UX – 7 wzorców projektowania dla AI według Johna Maedy #EN131