Hlavní navigace

Počítač mluvící a naslouchající – nevěřím, nevěřím

26. 5. 2008
Doba čtení: 7 minut

Sdílet

 Autor: 29
Zásadní vývojové skoky bych s dovolením očekával jinde a jinak. Nechtěl jsem se původně této letité “Gatesově” vizi věnovat, ale při své nedávné návštěvě ji opět velmi intenzivně prezentoval Steve Ballmer, současný šéf Microsoftu.

Dle Steva Ballmera – i Billa Gatese – bude spočívat zásadní vývojový skok ve výpočetní technice v příštích letech v tom, že budeme s počítačem hovořit, říkat mu, co od něj chceme, on nejenže jasně porozumí našemu slovu, ale dokonce se domyslí, pokud nebudeme formulovat přesně, a i na základě našeho obecnějšího zadání nám vyhoví komplexním splněním úkolu. Ballmer to ilustroval na konkrétním, byť trochu chaoticky formulovaném příkladě: řeknete počítači, připrav mi referát, a ono to provede všechny ty akce, půjde do univerzitní knihovny, vyhledá si materiály, přeloží si texty, zjistí, kdo jiný tam ještě přednáší a o čem bude mluvit, kolika lidí se to týká a přesně to zaměří, co mě zajímá, a bude to samoučící proces, nebudu to zadávat na klávesnici, ale všechno hlasem, celý způsob ovládání těchto strojů se změní (video zde). Ballmer říká, že to vše se odehraje v příštích deseti letech, a že v těchto deseti letech proběhnou daleko dramatičtější změny “než kdykoli v minulosti”.

Nevěřím, nevěřím a nevěřím. Ne snad proto, že přesně toto už sliboval Bill Gates před deseti lety, takže již nyní jsme dle jeho prognóz se měli nacházet v nirváně. Vizionář neříká, kdy se něco stane, ale co se stane; vizionář nepočítá technické a technologické překážky zdržující jeho vizi s tím, že se to „po cestě vyřeší“. (I když to, jak dramaticky se v čase Gates, onen vrchní softwarový architekt, či jak zněl jeho kuriózní titul, zmýlil, je na pováženou. Již před deseti lety říkal, jak na tom jeho výzkumníci makají a že to mají už prakticky vyřešené a hotové.) Tedy: věřím spolu s Gatesem i Ballmerem, že toto bude technicky možné a vyřešené; jestli za deset, více nebo méně let, je celkem fuk. Ale nevěřím, že se to stane normou, standardem, obvyklou formou, jakou člověk pracuje s počítačem, a vůbec už ne tím zásadním vývojovým skokem, který je nám stále slibován. Důvody jsou dle mého názoru následující.

1) Myš rychlejší úst. Zkouším převádět běžnou činnost s počítačem (myš, klávesnice) do lidské řeči a takřka vždy mi vychází, že lidská pusa je pomalejší než myš a klávesnice. Představím si, že například chci označit tučně jedno slovo na této stránce: hele, jdi nahoru o sedmnáct, ne osmnáct, ne, devatenáct řádků, jo, dobře, o pár slov doprava, ještě, ne, už moc, o jedno doleva, vyber slovo, ne tohle, to druhý, tučně. Huba mně upadne; místo toho je to jeden klik a jedna klávesová zkratka. Ale i jiné příklady: Psát dopis! – o nic rychlejší než kliknout na ikonu Wordu.

Práce s počítačem je pro zkušené uživatele něco jako práce s předměty na stole – vzít, posunout, otočit, přeložit, odložit. Máme zručné ruce, hned dvě, prstů celkem deset – jde to svižně. Pokud bych měl si dát ruce za záda a ovládat tyto předměty hlasem… no, to bych se daleko nedostal.

2) Jak dlouho vydržíte mluvit v kuse? A poslouchat? Toto je možná věc osobního vkusu a trošku i pohlaví, dámy prominou, ale pokud bych měl namísto klidné práce s myší a klávesnicí neustále mluvit, a ještě pak poslouchat, co zase počítač říká mně, bylo by to na rychlý odvoz do blázince. Plus se přidávají další potíže: představme si dnešní typické kancelářské open space, ve kterém se bílý šum slévá z tisícerého tichounkého klapkání do klávesnic – dle Microsoftu by se zde vedly nepřetržité hovory uživatelů s počítači. Totéž v domácnosti, ve škole v učebnách a na kolejích. Pozavíráme se do zvukotěsných místností?

3) Správná otázka je těžší než správná odpověď. Každému vyřešenému úkolu, kreativní činnosti, objevu, poznání, podnětné informaci předchází správně položená otázka nebo správně zadaný úkol. Přesně formulovaná otázka je v procesu vyřešení úkolu tou nejtěžší věcí a když vidím – například –, že jedním z nejčastěji zadaných vyhledávacích slov na Yahoo je slovo „yahoo“, nemám pocit, že by to současná světová populace nějak zvládala (na Seznamu pak například „libimseti.cz“ nebo „freefoto.cz“. Ehm…). Je zcela utopické si myslet, že s tím, když na počítač budeme mluvit, se nějak zázračně naučíme ty správné dotazy zadávat, když ani nyní, v éře textové informace, to naprostá většina lidí neumí. Lidé nevědí, na co se zeptat, a pokud toto nevědí, je lhostejné, jestli prostředkem je klávesnice, myš, hlas nebo břichomluva. Není otázka, není odpověď. A naopak, pokud i průměrně inteligentní člověk ví, co chce vědět a zjistit, zadá to stejně snadno přes klávesnici jako přes hlasové rozhraní.

4) Kreativita jako šablona ve Wordu. Ballmerův (dosti bizarní) příklad o tom, jak počítač za nás víceméně připraví náš referát, má jednu citelnou slabinu. Pokud tisíc lidí – například v distančním studiu – dostane za úkol vypracovat práci Vliv pískání delfínů na intenzitu tání alpských ledovců, a ballmerovsky ji, sdělením této věty, sdělí počítači, bude výsledkem tisíc identických prací (či „polotovarů pro dopracování“), vytvořených podle algoritmické šablony připravené programátorem v Microsoftu, nebo třeba u Googlu. Máme zde tedy problém:

  • na rutinní, jednoznačné úkoly (Vytiskni to nebo Najdi vlakové spojení z Hodonína do Bruntálu) nepřinese hlas nic přínosného, ani jej moc oproti klávesnici a myši nezrychlí.
  • v obecných zadáních, kde „i cesta sama je objevem“, není žádné zadání typu napiš mi referát řešením, a velmi brzo se to pozná. Rozvádět to není potřeba.

Dalo by se o tom psát dále. Nejsem si jistý dopadem na duševní zdraví člověka (začne to dotazy, pak oslovováním „miláčku“, navolením si sexy hlasu na odpověď a skončí to prodejem gumových nafukovacích počítačů v sexshopech); mám pocit, že už tak „magoříme“ z počítačů dost a budoucnost by měla být spíše „bez počítačů“, tj. s tím, že informační a komunikační technologie budou spíše neviditelnými pomocníky než něčím, s čím neustále žvatláme. Nejsem si jistý zvládáním všech jazykových bariér; vždyť i tak triviální úkol oproti tomuto, jakým je schopnost kvalitního automatického překladu, který by ušetřil miliardy dolarů ročně, nebyl za padesát let computingu vůbec vyřešen a zvládnut. Nejsem si jistý i technologickou dokonalostí a uživatelskou přívětivostí tohoto řešení; bude to možné kvůli nejednoznačnosti lidského hlasu zvládnout tak, aby řešení fungovalo „dokonale“, bezchybně? Nedokonale fungující řešení se neujme. A technicky: budeme si všichni muset při práci s počítačem někam na sebe šroubovat mikrofony, budeme muset ztlumovat hudbu, televizi, okolní hluk a řeč? Lidské ucho je neuvěřitelně dokonalý „výrobek“: velmoci se snaží desítky let vyvinout dokonalé odposlouchávací zařízení a nemají na prostou vodu puštěnou v kuchyni (přičemž dva hovořící lidé si i při té tekoucí vodě navzájem dokonale rozumí).

Řekl jsem, že nebudu komentovat těch deset let, ale budu. Microsoft slibuje tak rychlý pokrok, jaký jsme dosud nezažili, ale já mám (v otázce operačních systémů, tj. základních pohonů našich počítačů) opačný pocit – setrvalé zpomalování pokroku. Vývoj Windows Vista trval Microsoftu nějakých sedm let, a výsledkem je inkrementální vylepšení – tak malé, že devíti z deseti uživatelů nestojí za upgrade ani dva roky po uvedení. Právě tak se, mimochodem, zpomalil i vývoj v hardware, kromě grafiky – proč? Protože lidem stačí to, co mají. Jaké je zdůvodnění toho, že ve světle toho, že se vývoj SW i HW už dvacet ket let nepřetržitě zpomaluje, náhle dojde k „největšímu zrychlení, jaké svět kdy viděl“? Kdo to vůbec potřebuje? A pokud se bavíme o pokroku, přelomech a revolucích – jsou zcela jiné oblasti, ve kterých vývoj pádí zběsile vpřed a konce nedohlédnout.

BRAND24

Tak jsem to oběma pánům nandal. Ale co chytří Ballmer s Gatesem vědí, co hloupý Hlavenka ani netuší? Možná:

  • Vycházejí ze zkušeností z domácího, amerického trhu. Lze uvěřit, že Američanům se řízení počítačů hlasem bude líbit – vypadá to pohodlněji, bezpracněji, prostě další krok ke „stroje pracují za nás“, což mají Američané velmi rádi. Saves your time, saves your money. Tak nějak mě to k „fast-foodové“ kultuře běžného Američana i pasuje; je možné, že to tam bude mít úspěch, no a pak to už Amerika nějak protlačí do zbytku světa. (Připomeňme si typické americké vynálezy: mikrovlnka, klimatizace, kráječ na chleba, otvírák na konzervy, eskalátor atd.).
  • vycházejí z toho, že časem počítač nebude stolní krám, ale bude zabudován, řekněme, ve vašem pupíku (do svého si vrtat nenechám). Tudíž jeho ovládání rukama bude obtížnější, ba nemožné, a lidský hlas (nebo možná i myšlenky?) bude jedinou volbou. To ale už fantazírujeme o ještě mocnější počítačové revoluci, kde bude změna ovládání spíše jakýmsi vedlejším produktem.
  • vycházejí z toho, že chtějí pro Microsoft i pro dalších pár desetiletí udržet vůdčí roli v oblasti PC (operační systém a běžné aplikace), a proti spíše „zjednodušujícímu“ Googlu chtějí mít něco, co hrozivý konkurent mít nebude a masivním marketingem to prohlásit za ten pravý pokrok. I hledalo se, hledalo a nalezlo, ovládání počítače hlasem. Nic moc, ale lepší než se nechat Googlem bez odporu převálcovat.

Tak si vyberte.

Bylo by pro vás úplné hlasové ovládání PC spíše pomocí, nebo zátěží?

Byl pro vás článek přínosný?

Autor článku

Autor je zakladatel společností Computer Press a InternetShops, novinář a autor odborných publikací, v současné době soukromý investor (mj. Fayn Telecommunications.). Jeho další materiály naleznete na www.bloc.cz.

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).