Úvaha: Vzpomínky na budoucnost aneb kam nás dostalo scifi | Kapitola 3
Seznam kapitol
Vývoj jde stále kupředu a už dnes se máme lépe než zítra. Jak ale vypadala představa našich předků o budoucnosti, tedy dnešní realitě? A kam se můžeme posunout my? Zabruslíme do historie, která nás viděla plně automatizované a virtuální. Něco se vyplnilo, něco byla utopie a něco teprve ještě přijde, až se naučíme pracovat s kontextem.
Ve srovnání s tempem, kterým se vyvíjí v posledních čtyřiceti letech gadgety, se zdá, že počítače ve svém vývoji stagnují. Může za to jediný muž, Douglas Engelbart, který si v době elektrických psacích strojů, děrných štítků a pásek a podobných heblů (jenž představují spíše „solidní kovářskou práci“ než to, co byste hledali na palubě startekovské Enterprise) vysnil počítač dosti futurózní, ale přesto tak relativně snadno vyrobitelný a hlavně nekonečně prakticky pojatý, že ho používáme bez valných změn dodnes. Grafická obrazovka typu WYSIWIG (What You See Is What You Get – pojem týkající se doby, kdy výstup na tiskárnu byl důležitější, než na obrazovku a zobrazovat věci tak, jak budou vypadat na papíře, bylo velmi neobvyklé) byla doplněna zobrazováním navzájem se překrývajících aplikačních oken (velmi revoluční myšlenka na svou dobu), to v jemné grafice a ovládané myší, kterou jste volili příkazy v menu.
To všechno byla tak neskutečně revoluční myšlenka, že ji bez podstatných změn převzali všichni konkurenti vyrábějící počítače. Teprve moderní dotykové mobily mění pravidla hry díky změně ovládání a sadě nových senzorů (kamery, gyroskop, GPS) a počítač je rázem něco jako trikodér.
Jak je možné, že vývoj tak katastroficky zamrzl? Podle mého mínění je problém v tom, že se příliš mnoho vývojářů zaměřilo na čistě scifi koncepty. Zásadní scifistická představa o počítačích budoucnosti spočívala v tom, že se předpokládalo, že budou komunikovat s uživatelem mluvenou řečí, a nebo alespoň budou přijímat příkazy vyslovené mluvenou řečí (jako například palubní počítač Lemova pilota Pirxe, který poslouchal mluvené příkazy, ale výsledky zobrazoval v digitronech).
V řadě kontextů to dává zcela jasný smysl: když něco řídíte a nebo pilotujete, je daleko jednodušší a bezpečnější komunikovat s řídícím systémem mluvícím slovem – a to, že vám systém něco říká, zatímco vykonáváte rutinní činnost, dodává komunikaci na důrazu. Alarmů lze najednou rozsvítit neomezeně mnoho, ale větu můžete formulovat jenom jednu.
Tato myšlenka, i když se v ní postupuje jenom pomalu, ilustruje skutečný zájem „čistých milovníků scifi“ mezi počítačovými vývojáři: hlasová komunikace je pro ně alfou i omegou, i když, po pravdě řečeno, představuje patrně nejkomplikovanější problém, který v AI existuje. Nejde jenom o prosté porozumění řeči, rozeznání mluvícího, dekódování fonémů a jejich složení do slov, ale i interpretaci detekovaného textu, která není triviální. Ve většině jazyků je jazyk závislý na kontextu, v různých kontextech znamená ta samá věta něco jiného, její význam lze modifikovat položením důrazu a zcela ho změnit intonací a nebo doprovodným gestem.
Každý, kdo „na sucho“ (jenom na základě přímých řečí) překládal filmový dabing, jasně ví, že se mu bez problémů může povést přeložit dialog tak, že je to sice správně, ale v kontextu filmu to naprosto nesedí. Začít můžeme zcela základním problémem s určením rodu mluvčího, určením, zda se jedná o nadsázku a nebo ne („Já tě zabiju!“ nese zcela jiný náboj v detektivce a jiný v rodinném sitcomu) a nebo o sarkasmus, tedy konstatování, které obvykle znamená přesný opak toho, co sděluje (Sheldonův počítač, co ho má místo mozku, s tím má neustále problém).