Otwórz Zamknij Wyszukaj
naglowek_cui_jestemmobi

Problem testowania interfejsów konwersacyjnych

2

30 listopada 2016

Autor: Monika

Dzięki zajawce na boty eksploruję zupełnie nowe zagadnienia natury UX-owej. Dziś chciałabym Wam opowiedzieć, jak doszłam do pewnej ściany, którą w najbliższych miesiącach będę chciała przebić.

Dla rzeczowego wprowadzenia w temat, na początek trochę definicji.

Człowiek nie jest zdolny do bezpośredniej komunikacji z maszynami. Aby stało się to możliwe urządzenia i programy są wyposażone w odpowiednie urządzenia wejścia-wyjścia tworzące razem interfejs użytkownika.
Za Wikipedią, interfejs użytkownika jest to zatem przestrzeń (część urządzenia lub oprogramowania), w której następuje interakcja człowieka z maszyną.

Co to jest CUI?

Conversational User Interface (CUI) to jeden z typów interfejsów. O ile pojęcie „conversational UI” jest nowe, bo skojarzone jest z „conversational apps”, czyli komunikatorami mobilnymi takimi jak Messenger czy WhatsApp, o tyle „natural UI” jest już ukonstytuowane. Można powiedzieć, że CUI to to samo co NUI (a jeszcze precyzyjniej, CUI to NUI, ale NUI to nie CUI).

Natural language user interfaces are a type of computer human interface where linguistic phenomena such as verbs, phrases and clauses act as UI controls for creating, selecting and modifying data in software applications.

NUI to pojęcie, które pierwszy raz w literaturze pojawiło się w… 1993 roku, a CUI jest nowe (dwuletnie?). Niemniej, zagadnienia, które zbieram w dzisiejszym tekście rozpoczęły się od problemów i wyzwań wiążących się z testowaniem tworzonych przez Babbl.ai botów na Messengera. Aby nie było więc wątpliwości, że ich źródło powstało w specyfice interfejsów komunikatorów mobilnych, będę dalej używać sformułowania CUI…

Wikipedia nie podaje definicji interfejsu konwersacyjnego, więc pokuszę się o własną. Interfejs konwersacyjny to taki typ interfejsu, w którym interakcja pomiędzy człowiekiem a komputerem odbywa się za pomocą komend tekstowych i/lub głosowych, mniej lub bardziej przypominających naturalną ludzką rozmowę.

Interfejs niewidzialny

Interfejsy konwersacyjne równie dobrze można określić mianem… interfejsów niewidzialnych („invisible interface”). Niewidzialnych to znaczy takich, na których nie widać „instrukcji”, jak je obsługiwać. Tak jak interfejs graficzny wyposażony jest w różne wizualne elementy, np. ikony, symbole, oznaczenia kolorystyczne, przyciski, których znaczenie jest nam znane (zostało przez nas utrwalone) lub przynajmniej możemy się go domyslać, tak interfejs konwersacyjny jest ich kompletnie pozbawiony. Gdy wejdziemy na dowolną stronę internetową, potrafimy na pierwszy rzut oka ocenić, do czego służy i co na niej można zrobić (widzimy menu, widzimy jakiś obrazek, zdjęcie, widzimy jakieś przyciski przenoszące nas dalej w głąb tej strony).

Wchodząc na stronę grovemade.com jeszcze bez klikania w którykolwiek element jej interfejsu możemy z dużą pewnością ocenić, do czego ona służy. Jest to sklep internetowy, na sliderze przedstawione są flagowe produkty, które w tym sklepie można kupić, oprócz sklepu jest jeszcze coś takiego jak „journal”, jest też możliwość zapisu na newsletter.

gui_example_grovemade

A do czego służy to coś od Amazona?
amazon-echo

W jaki sposób pomoże nam Readster?
readster_bot

Gdy staniemy po raz pierwszy przed Amazon Echo, wywołamy po raz pierwszy bota na Messengerze, czy też uruchomimy Siri nie możemy od razu jednoznacznie stwierdzić do czego to służy, co się z tym w ogóle robi i co dzięki interakcji z tym programem/ urządzeniem osiągniemy. Oto pierwsze wyzwanie zarówno dla projektantów UX, jak i badaczy interfejsów konwersacyjnych.

Różnice w sposobach odkrywania możliwości użycia interfejsu

Po wykonaniu pierwszego kroku (wydaniu pierwszej komendy) poznajemy pierwszy zestaw możliwości, ale nie wiemy, ile i jakie kolejne są możliwe. Musimy podjąć drugi krok i kolejne, aby je dalej odkrywać. Co więcej, liczba scenariuszy użycia interfejsów typu GUI jest łatwa do policzenia, liczba scenariuszy użycia CUI – o wiele trudniejsza.

Zatem bardzo ważną i znaczącą różnicą pomiędzy interfejsem graficznym a konwersacyjnym jest zupełnie inny sposób odkrywania jego możliwości (#discoverability).

Różnice w sposobach i tempie wywoływania interakcji

Kolejną różnicą jest zgoła odmienny sposób wywoływania interakcji. Jeśli w sklepie internetowym chcemy wejść do sekcji z interesującym nas asortymentem, to za pomocą kursora myszki lub własnego palca klikamy w menu, rozwijamy je i następnie wybieramy sekcję, która nas interesuje. W przypadku interfejsu konwersacyjnego musimy napisać/ powiedzieć, czego szukamy. W obu tych przypadkach potrzebujemy inną ilość czasu, aby osiągnąć cel. W przypadku CUI wydawać być się mogło, że potrzebujemy go o wiele mniej. Jeśli tylko wiemy, że dany interfejs obsłuży daną komendę, możemy ją podać od razu – wtedy pójdzie błyskawicznie. Jeśli nie wiemy (bo najpierw musimy się tego nauczyć), to przejrzenie interesujących nas produktów w danej tematyce zajmie nam o wiele więcej czasu przez interfejs konwersacyjny (np. w bocie na Messengerze) niż graficzny (np. w sklepie internetowym).

Różnice w rodzajach danych wejściowych i łatwości ich interpretacji

Wyrwę jedno zdanie z powyższego akapitu. „W przypadku interfejsu konwersacyjnego musimy napisać/ powiedzieć, czego szukamy”. I tak odkrywamy ryzyko niejednoznacznej interpretacji danych wejściowych, gdy mamy do czynienia z interfejsami konwersacyjnymi. W przypadku GUI nie ma tego problemu – gdy użytkownik klika na dany przycisk, komputer nie ma wątpliwości, co z tym zrobić – wpuszcza go do następnej sekcji, przypisanej do tego przycisku. W przypadku CUI komputer nie jest gotowy na wszystkie komendy, jakie może podać mu użytkownik. Bogactwo języka w połączeniu z intencjami człowieka generuje spore wyzwania dla lingwistyki stosowanej.

 

Takich różnic mogłabym wymieniać więcej i pewnie to zrobię, ale poświęcę im zupełnie inny post. Świadomość występowania takich różnic i ich wagi prowadzi mnie do dalszych wniosków. Po pierwsze, potrzeba jeszcze sporo pracy u podstaw, aby przysposobić najlepsze praktyki w projektowaniu interfejsów konwersacyjnych (ba, sama nie jestem w tym ekspertem, sama się uczę, ale z moich obserwacji branży botowej wynika, że… wszyscy się tego uczymy!). Sztuka projektowania CUI nie została jeszcze perfekcyjnie opanowana. A skoro tak, to tym bardziej raczkuje sztuka ich testowania! Zatem po drugie, powinniśmy również potrafić badać użyteczność takich interfejsów i opracować know how, jak je optymalizować i rozwijać. Oto sedno moich dzisiejszych rozważań!

Jak właściwie testować interfejsy konwersacyjne?

Był słoneczny listopadowy poniedziałek, kiedy to po rozmowie z Kamilem z Mobee Dicka doznałam olśnienia – „no tak… faktycznie… nie ma narzędzi do porządnego testowania scenariuszy botów”. Zaraz potem pojawiło się pytanie, czy są w ogóle wytyczne, jak testować interfejsy konwersacyjne…

Branża wypracowała zestaw dobrych praktyk, według których ocenia się użyteczność interfejsów graficznych (GUI). Mamy na przykład np. 10 heurystyk Nielsena, które patronują każdemu projektantowi interfejsów użytkownika. Czy te zasady da się właściwie zinterpretować również na potrzeby CUI? Nawet jeśli tak, to czy na pewno nie pomijają żadnych istotnych aspektów wynikających z unikalnej specyfiki CUI? W ogóle należy postawić generalne pytanie, czy i jak metody testowania GUI pasują do CUI.

Zatem dokładnie od 2 tygodni i 2 dni przekopuję internet w poszukiwaniu odpowiedzi. Owszem są teksty, jak projektować tego typu interfejsy, które w pewnym zakresie dają pewne wskazówki do ich badań. Nie ma jednak opisanych metod i metodyk ich badania.

Wydaje mi się, że jestem pierwsza, która w ogóle zwraca uwagę na powyższe zagadnienia. O wsparcie w eksploracji zasobów internetowych poprosiłam Kasię z Mobee Dicka. Niestety, również u niej internet zaświecił pustkami ;) No nie ma. Po prostu nikt w branży specjalistów ds. UX jeszcze nie zajął się na poważnie zagadnieniem testowania interfejsów konwersacyjnych! Jeśli pudłujemy, bardzo proszę podrzućcie w komentarzach literaturę na ten temat. Jestem nie tylko głodna, ale wręcz żądna wiedzy! Jeśli faktycznie jej nie ma, będę samodzielnie chciała ją wypracować i dostarczyć na rynek. Możecie trzymać mnie za słowo!

…W sumie to już zaczęłyśmy z Kasią komponować pierwsze materiały, więc docelowo na pewno będziecie mogli pukać do drzwi Mobee Dicka po know how w tym temacie… Czacha dymi! Ekscytacja jest ogromna! Naprawdę wytyczamy nowy szlak. Trzymajcie za nas kciuki! Wyniki naszej pracy przysłużą się wszystkim w branży :) <3

Piękne nagłówki do postów jestem.mobi rysuje Glejzer.com!
  • Patrycja Muhova

    Czy są już dostępne Twoje materiały na temat testowania CUI?

jestem.mobi

Zamknij

By continuing to use the site, you agree to the use of cookies. more information

The cookie settings on this website are set to "allow cookies" to give you the best browsing experience possible. If you continue to use this website without changing your cookie settings or you click "Accept" below then you are consenting to this.

Close