Pin It

Древната игра, в която компютрите все още не могат да печелят


Go-01

Реми Кулон (вляво) и неговата компютърна програма, Crazy Stone, в мач срещу гросмайстор Норимото Йода и играта ГО. Фото: Такаши Осато/WIRED

 

ТОКИО, ЯПОНИЯ – Реми Кулон седи в офисен стол, приведен над малко очукан Макбук лаптоп, в надеждата, че той ще направи нещото, което никоя машина все още не е постигала.

Това може би ще отнеме още една или друга година, но дългосрочното усилие започва тук, в японския Институт за електро-комуникации. Обстановката е далеч от бляскава – неприветлива зала за конференции с облицовка от фалшиво дърво и неприятно флуоресцентно осветление – но мястото е все още изпълнено с напрежение. Пред старичкия екран на проектора в един от ъглите са се насъбрали наблюдатели, телевизионен екип се подготвя да предава турнира по онлайн-телевизията, заедно с анализи на живо, предоставяни от двама професионални коментатори.

Кулон носи все същия поло-пуловер и фини очила без рамка, които носеше по време на миналогодишния турнир, и седи непосредствено до последния си противник, негов сънародник на име Симон Виенò, който изглежда като по-младежка версия на самия него – французин, строен и много скромен. Двамата не се гледат. Погледите им са фокусирани върху компютрите пред тях. Кулон играе със софтуерна програма на име Crazy Stone – плод на повече от седем години работа – а програмата на другия се нарича Nomitan (програмирана е от Виено и неговия японски партньор, Коколо Икеда).

Crazy Stone и Nomitan играят партия от играта ГО, източното съответствие на шаха. На двата екрана се виждат виртуални дъски за ГО – квадратна мрежа от 19 х 19 линии, изпълнена с черни и бели пулове, всеки от тях поставен на пресечната точка между две линии. Ако Crazy Stone успее да спечели и стигне до финала, ще получи правото да играе срещу един от най-добрите играчи на ГО в Япония. Никоя машина не е успявала дотук да победи някой от водещите играчи – не и без да е получавала предварителен аванс[1]. Дори и ако стигне до мача между човек и машина, Crazy Stone няма шансове да промени това състояние на нещата, но Кулон иска да види докъде е стигнало творението му.


Small Ad GF 1

Предизвикателството е респектиращо. През 1994 машините взеха короната в играта на шашки, а след това програма на име Chinook победи най-силния жив играч. Три години по-късно суперкомпютърът Deep Blue на IBM победи в мач световния шампион Гари Каспаров. Днес вече компютрите са равни или надминават хората в игрите на шах, Отело, скрабл, табла, покер, дори и Jeopardy[2]. Но не и в ГО. Това е единствената класическа интелектуална игра, в която човешките мозъци все още са по-силни от хардуера.

Измислена преди повече от 2500 години в Китай, ГО е била любима игра на императори и генерали, интелектуалци и деца-чудо. Подобно на шаха, това е информационна игра, в която изходът е перфектно-детерминистки – тоест игра, в която от играчите не се крие никаква информация и няма елементи на случайност като зарове. И, също като при шаха, това е борба между двама противници. Играта започва с празна дъска, върху която противниците поставят последователно черни и бели пулове, опитвайки да заградят колкото се може повече територия, като същевременно се противопоставят на опитите за заграждане от отсрещната страна. Това може и да изглежда по-просто от шаха, но всъщност не е. Във времето, когато Deep Blue вече побеждаваше Каспаров, най-добрите програми за ГО не можеха да се противопоставят дори на някой по-добър аматьор. И въпреки огромния прогрес на техниката оттогава насам – в наши дни Каспаров вече може да изгуби и срещу домашния ви компютър – автоматизацията на играта ГО на експертно ниво си остава едно от най-големите нерешени предизвикателства пред изкуствения интелект.

Реми Кулон е част от малка общност на компютърни специалисти, които се надяват да решат тази задача. Всяка година през месец март най-добрите програмисти на ГО се събират тук, за да се състезават за Купата на университета за електро-комуникации (UEC) – компютърен турнир за ГО, в който двамата финалисти получават като награда правото да играят мачове срещу избрани „ГО-мъдреци“, което е еквивалента на гросмайсторска степен в шахмата. Организаторите наричат тези мачове на машини срещу хора Densei-sen, което означава „Битката на електрическите мъдреци“.

В тазгодишната купа, Crazy Stone на Кулон е фаворитът. През първия ден на турнира програмата завърши без загуба, което ѝ предостави първата позиция в днешната поредица от мачове на елиминиране, с право да пропусне първия рунд. Сега тече вторият рунд и Виено, сравнително нов човек на компютърната сцена за ГО, ми казва, че ще бъде много доволен ако програмата му успее просто да окаже добра съпротива. „Nomitan използва много от триковете на Реми, но не вярвам това да се окаже достатъчно“,казва той. „Crazy Stone е много по-силна програма“.

 

Go-02
Реми Кулон и Crazy Stone. Фото: Takashi Osato/WIRED

 

Компютърните екрани пред Кулон и Виено показват статистики, от които може да се види как всяка от програмите оценява шансовете си за победа. Макар че играта едва започва, Crazy Stone вече е 58 процента сигурен, че ще спечели. Странно, но оценката на Nomitan за собствените му шансове е приблизително същата. Когато посочвам това на Кулон и Виено, и двамата се засмиват. „Не може да се има пълно доверие на тези алгоритми“, обяснява Виено. „Те винаги са малко прекалено самоуверени“.

Бюлетин „Либерален преглед в неделя“

Официалните коментари започват едва при финалния мач, но с напредването на втория рунд около коментатора Майкъл Редмонд се събира малка тълпа, очакваща да чуе какво мисли. Харизматичният Редмонд, американец, е една от малкото не-азиатски звезди на играта ГО. Започнал е да играе професионално в Япония на 18 годишна възраст и си остава единственият западняк, постигнал 9-ти дан, най-високата степен в играта. „Не познавам стила на играча с черните“, казва той, имайки пред вид Nomitan, „но той е много наперен, много по-агресивен от онзи на Crazy Stone. Много добър tesuji. При хората tesuji е доста добро указание за силата на играча. В наши дни започвам все по-често да го виждам при компютрите“.

Tesuji означава нещо като „умна игра“ и ходовете на Nomitan създават сериозни проблеми на Crazy Stone. Изминала е почти половината от партията, а оценката на Crazy Stone е вече само около 55 процента, което означава, че шансовете са равни. След още няколко хода друг професионален играч на име О Мейен заявява, че Nomitan вече води. Докато останалите партии в залата приключват, тълпата пред проектора започва да става все по-шумна. Съдейки по възклицанията, шансовете на Crazy Stone намаляват все повече.

Повечето от хората в залата приемат думите на професионалисти като О Мейен с пълно доверие. Впрочем, друг избор едва ли има, тъй като игрите на ГО са често толкова сложни, че само изключително силни играчи могат да разберат какво се случва на дъската. Дори за Кулон, който е добър, но не и силен играч на ГО, ходовете на Crazy Stone си остават най-често неразбираеми. Но Кулон вижда в себе си програмист, а не толкова играч, което му позволява да остане спокоен пред лицето на професионалния скептицизъм. Той се доверява на оценката, която му показва Crazy Stone. „Може би О Мейен мисли за това коя от позициите изглежда по-добра“, казва той, с напевен френски акцент. „Но аз знам, че Crazy Stone е много по-силен от Nomitan. Така че просто очаквам в някакъв момент Nomitan да изгуби нишката.“

Така и става. Crazy Stone прави поредица ходове, които предизвикват одобрително мърморене откъм тълпата. Въпреки онзи първоначален tesuji, Nomitan губи предимството си. Скоро оценката на Crazy Stone се изкачва до 80 процента и Nomitan се предава.

Останалите мачове, водещи до финала, не са особено вълнуващи, с изключение на една от полуфиналните битки. Зен, най-големият съперник на Crazy Stone, и миналогодишен втори, почти губи срещу някаква програма на име Айа. Играта започва със сложна локална битка в горния десен ъгъл, като всяка от страните се опитва да поддържа пуловете си живи. Отначало Зен играе с отличен киай, тоест боен дух. Тази част от дъската изглежда твърдо определена. А след това, без видима причина, Зен прави очевидна грешка, с което предизвиква колективна въздишка в залата. Програмистът му, японец с дълга посивяла коса, на име Хидеки Като, гледа неотлъчно нивото на оценките на екрана. В края на краищата Зен успява да спечели преднина и Айа се предава. Финалният мач е определен: Crazy Stone срещу Зен.

Мистерията на ГО

Дори и на Запад ГО отдавна вече е любима игра на математици, физици и компютърни специалисти. Айнщайн е играел ГО когато е бил в Принстън, както и математикът Джон Неш. Видният компютърен учен Алан Туринг е бил фен на ГО и докато е работел като специалист по дешифриране по време на Втората световна война, където е запознал с играта колегата си А. Дж. Гуд. Гуд дава силен начален тласък на играта в западния свят със статията си от 1965 в списание New Scientist на име „Мистерията на ГО“.

 

Go-03
Играчи на ГО в Корея някъде от ранните 1900 години.Фото: Library of Congress

Гуд започва изложението си със забележката, че ГО се намира далеч над всички останали стратегически игри – мнение, споделяно от почти всички играчи на ГО, които съм срещал. „На Запад се играе шах, но ГО е несравнимо по-изтънчена и по-интелектуална игра“, казва южнокореецът Ли Се-Дол, може би най-силният жив играч на ГО и един от малцината, които всяка година печелят седемцифрени суми от турнирни награди. Изтънчеността, разбира се, е нещо субективно. Но си остава факт. Че от всички световни игри с перфектно-детерминистки характер – тик-так-то, шахмат, шашки, Отело, Шангки, Шоги – ГО е единствената, в която компютрите нямат шанс срещу хората.

И това е така не защото програмистите не са правили подобни опити. Също като при шаха, те са опитвали да създадат съответни компютърни програми в продължение на петдесет години, със значително по-малко успех. Първите шахматни програми са написани през ранните петдесет години, една от тях от самия Туринг. Около 1970 те вече бяха доста добри. Но чак до 1962, въпреки популярността на играта сред програмистите, само двама души са успели да напишат програми за ГО, като нито една от тях не е тествана в игра с хора.

Накрая, през 1968, геният на компютърната теория Алфред Зобрист създава първата програма, способна да победи някой пълен начинаещ. Това е многообещаваща първа стъпка, но въпреки огромните количества време, усилия, брилянтност и невероятен прогрес в изчислителната мощ на машините, програмите си остават неспособни да победят добре играещи аматьори в продължение на следващите няколко десетилетия.

За да разберете защо е така, опитайте се да мислите за ГО, сравнявайки я с шахмата. В началото на една шахматна партия белите имат двадесет възможни хода. След това черните имат също двадесет възможности.След като и двете страни са изиграли първия ход, на дъската има 400 възможни позиции. В сравнение с това при ГО се започва с празна дъска, при която черните имат 361 възможни хода[3], всеки от тях на пресечните точки в координатна система от 19 х 19 линии. Белите от своя страна разполагат с 360 възможни хода. Това прави 129,960 възможни позиции след първите ходове.

Степента, с която възможните позиции нарастват е директно пропорционална на „фактора на разклонение“ на дадена игра, тоест средния брой ходове, възможни при всеки следващ ход. При шаха факторът на разклонение е 35. При ГО той е 250. Игрите с висок фактор на разклонение правят класическите алгоритми за търсене от рода на minimax изключително трудоемки. Minimax създава таблица с разклонения, която изчислява възможните ходове, симулирайки всички теоретични позиции, възникващи на следващия ход, а след това търси най-добрия ход въз основа на изчисления, минимиращи възможността за постигане на най-добър сценарий за противника. Подобренията в този алгоритъм – като например алфа-бета-търсене или нулев-ход – съкращават значително обема на разклоненията, като идентифицират ходовете, които заслужават повече внимание и улесняват по-бързото и по-задълбочено търсене. Но онова, което функционира при шаха – а също при шашките или Отело – не функционира при ГО.

Проблемът е в това, че намирането на ходовете, които заслужават внимание при ГО много често е силно мистериозен процес. „Значи, човек гледа дъската и просто знае“, обяснява ми Редмонд докато стоим пред екрана на проектора и гледаме как Crazy Stone намалява преднината на Nomitan. „Това е нещо подсъзнателно, което придобивате в хода на много години тренировки. Ще видя някой ход и ще съм сигурен, че той е правилния, но няма да съм в състояние да ви обясня точно защо е така. Просто го знам.“

Също толкова неразбираем е и процесът на оценяване на отделните конфигурации на дъската. В шаха има някои очевидни правила. Ако например след десет възможни хода една от страните е изгубила кон, а другата не, то по принцип е ясно кой има предимство. Не е така при ГО, където няма лесен начин да се докаже защо позицията на черните е голяма, но уязвима, или защо белите имат лоша игра. Тези неща може да изглеждат очевидни за експертните играчи, но при липса на лесен начин за тяхното точно измерване, те ще си остават невидими за компютрите. А щом няма добър начин за оценяване на междинните позиции, алфа-бета-алгоритъмът, който извършва глобалните търсения на ходове, няма как да намери начин за определяне на това кои ходове ще доведат до най-добър резултат.

Не че това има особено голямо значение: невъзможно високият фактор на разклонение, както и на възможни конфигурации на дъската, правят алфа-бета-алгоритмите почти безполезни, дори и след като са приложени определени подобрения. Добавете към това средната продължителността на една игра – при шаха това са четиридесет хода, при ГО те са 200 – и компютърният ГО започва да изглежда като безсмислена идея.

 

Go-04
Традиционна дъска за ГО
. Фото: Takashi Osato/WIRED

В търсене на мисловния скок

И въпреки това, след Зобрист, програмистите на ГО са продължили усилията си и постепенно са постигнали определен прогрес. Но едва през 1979 един петгодишен проект на компютърния учен Брюс Уилкокс води до създаването на програма, способна да победи аматьори на ниско ниво.

За разлика от програмистите на шахматни програми, Уилкокс се съсредоточава почти изключително върху проблема за моделиране на експертна интелигентност, като събира огромна база данни от позиции, взети от игрите на Джеймс Къруин, един от най-силните западни играчи, който по-късно заминава за Япония, за да стане вторият професионален западен играч в историята на играта. Програмата му разделя дъската на по-малки, обозрими зони, а след това използва базата данни, за да предлага възможни ходове, прилагайки йерархични функции, за да избере най-добрия сред тях. Гледащите далеч напред алгоритми като алфа-бета, от дълги години крайъгълен камък при програмирането на игрови модели, липсват напълно от първоначалните варианти на програмата.

По време на развойния процес самият Уилкокс става много силен играч на непрофесионално ниво, незаменима способност за ранните програмисти на ГО, като се има пред вид до каква степен тогавашните програми зависят от задълбоченото разбиране на играта. Всички те – Марк Буун (програма Голиат), Дейвид Фоутланд (Многото лица на ГО), Чен Жишинг (Хандток и Гомат) – тоест всички победители при състезанията между различните програми на ГО от 80-те и 90-те години, са отлични играчи, и именно комбинацията от задълбочено разбиране на играта и експертни компютърни знания прави възможни постоянните подобрения от 1990-те години. А след това, някак внезапно, прогресът престава. Програмите стигат до едно ниво на трудност, което създава проблеми и на хората-играчи.

„Много хора стигат до определено ниво на силна аматьорска игра и никога не стават по-силни“, обяснява Дейвид Фоутланд. Освен в качеството си на програмист на една от ранните програми за ГО, той е работили и като главен инженер на процесора PA-RISC на Хюлет-Пакард от 1970-те години, където тества програмата си. „Има някакъв мисловен скок, който трябва да бъде постигнат, за да може човек да задмине тази блокада – и програмите се сблъскаха с абсолютно същия проблем. Проблемът е в това да бъдеш в състояние да обхващаш с мисловния си поглед цялата дъска, а не само локалните битки“.

Фоутланд и други програмисти дълго са опитвали да модифицират програмите си така, че да им придадат способността за търсене на ходове по цялата дъска. Успяват да постигнат определен прогрес, но около 2004 нещата отново започват да буксуват и достъпните възможности изглеждат изчерпани. Липсва процесорна сила. За да се извършат търсения дори само с един ход по-дълбоко, се изисква невъзможно бърза машина. Най-трудната игра в света изглежда така, сякаш никога няма да бъде спечелена.

И тук в картината се появява Реми Кулон, чийто Crazy Stone въвежда нова ера на компютърния ГО. Бащата на Кулон също е програмист и през 1983 той подарява на сина си за Коледа игрален компютър от типа Videopac. По онова време Кулон е на девет години, някъде около възрастта, при която повечето звезди на играта ГО напускат дома си, за да започнат дългогодишно целодневно обучение в предназначени специално за целта училища. След по-малко от година Кулон е написал компютърен вариант на играта Mastermind. След четири години създава програма, която може да играе Connect Four. Програма за Отело следва скоро след това, а на 18 Кулон е написал и първата си шахматна програма.

Програмата, на име Crazy Bishop, била ужасна. Без достъп до Интернет Кулон е трябвало да изобретява всичко от нула. Но една година по-късно той започва да следва в технически университет, където университетските компютри му позволяват да разменя алгоритми и стратегии в онлайн-общностите на различни програмисти. Crazy Bishop започва бързо да се подобрява. През 1997 Deep Blue победи Каспаров, а Кулон посещава световния шампионат по компютърен шах в Париж, където неговата програма се представя прилично, а самият той се среща на живо с членовете на онлайн-общността. Това го вдъхновява да продължи следването си като програмист, а не като инженер. След кратки паузи за военна служба и магистърска степен по когнитивни науки, Кулон получава докторска степен по тема, свързана с обучението на роботи.

Макар че се е срещнал с ГО още по време на Компютърната олимпиада от 2002, Кулон не обръща много внимание на играта до 2005, когато, след като започва работа в Университета в Лил, той става научен ръководител на Гийом Шасло, студент, който иска да напише програма за ГО като магистърска работа. Шасло скоро напуска, за да работи по докторската си дисертация, но Кулон вече е запленен и ГО се превръща в основното му занимание.

Облогът Монте Карло

Не след дълго той прави първия си пробив. Кулон е обменил идеи с колега на име Бруно Бузи, който смята, че тайната на компютърния ГО вероятно се крие в един компютърен алгоритъм, известен под името Монте Карло. Разработен през 1950-те с цел да се правят модели на атомни експлозии, Монте Карло заменя голямомащабното търсене със статистическо измерване на няколко определени възможности. Подходът действително се оказва подходящ за ГО. Вместо да прави търсения във всяко разклонение на таблицата с разклонения, Монте Карло разиграва серия от случайни игри за всеки възможен ход, а след това извлича оценка на хода от анализа на резултатите.

Бузи не е успял да създаде работеща програма. Но Кулон намира нов начин за комбиниране на предимствата на старото търсене с ефективността на Монте Карло. Нарича новия алгоритъм „Монте Карло таблично търсене“ (MCTS) и през 2006 Crazy Stone печели първия си турнир. След като Кулон публикува резултатите си, други програмисти бързо интегрират новия алгоритъм в собствените си ГО програми и в продължение на две години Кулон работи върху друга френска програма, Mogo, в която се използва по-прецизна версия на същия алгоритъм.

И макар че Crazy Stone печели Купата UEC през 2007 и 2008, екипът на Mogo използва мачовете на хора срещу машини, за да пробърне войната за публичност в своя полза. Кулон страда остро от липсата на внимание. Когато нито публиката, нито собственият университет му отдават признанието, което заслужава, той губи мотивация и престава да работи по ГО в продължение на почти две години.

Може би с това заниманията му с ГО биха приключили, ако през 2010 Кулон не би получил имейл от Икеда Осаму, главният мениджър на Unbalance, японска фирма за компютърни игри. Икеда го пита дали би се съгласил да лицензира Crazy Stone. Unbalance контролира около една трета от многомилионния глобален пазар за компютърен ГО, но комерсиалната версия на програмата Зен е започнала да увеличава пазарния си дял. Икеда се нуждае от Кулон за да укрепи позицията на собствената си компания.

Първата комерсиална версия на Crazy Stone се появява на пазара през пролетта на 2011. През март 2013 създанието на Кулон се връща отново на турнира за купата UEC, като на финала побеждава Зен и – след като е получил предимство от четири пула в началото на играта – печели първата игра на компютър срещу жив човек: японският професионалист Йошио Ишида (по прякор „компютърът Ишида“). Тези победи имат огромно значение за Кулон, както в емоционално, така и във финансово отношение. Човек може да види какво е значението им в магазина на японската федерация за ГО, където на стената зад щанда, на който се продава програмата, е закрепена изрезка от вестник, която показва киселата физиономия на професионалиста, предаващ играта на създанието на Кулон.

Go-05
Photo
: Takashi Osato/WIRED

Изключително човешки

По време на първата почивка в тазгодишния финал на UEC, телевизионният екип се впуща в действие. Редмонд, с микрофон в ръка, застава от едната страна на магнитната демонстрационна дъска. От другата страна е Наруми Осава, дребничък професионалист с четвърти дан, който, по стандартен японски маниер, ще функционира като сервилен помощник при анализа на играта, воден от Редмонд.

След като всичко е на мястото си, Като и Кулон отиват до дъската за провеждане на процедурата „нигири“, тоест кой ще има право на пръв ход. Кулон грабва шепа пулове от дървения съд до дъската. Като трябва да познае дали борят им е четен или нечетен. Предположението му е правилно и програмата на японеца получава черните пулове и правото на първи ход. Играта започва.

Само след три хода залата експлодира от възбуда. След като е поставил два пула на ключовите ъглови позиции – стандартно начало за тази игра – Зен поставя третия си пул почти в центъра на дъската. Ходът е откровено ексцентричен и дори Като е донякъде слисан. „Това не е човешко решение“, шепне ми Виено. „Зен обича да прави мойо по средата на дъската, също като майстор Такемия. Може би това е новият му стил“.

Като и Кулон седят един до друг с очи, вперени в екраните на лаптопите, от време на време разменят по някоя дума. В горния ляв ъгъл на дъската се започва интересна борба – Crazy Stone напада, а Зен се опитва да укрепи позицията си. Тълпата започва да шушне когато Редмонд обявява един от ходовете на Зае за „изключително човешки“. Черните и бели пулове продължават да запълват дъската, красиви както винаги, оформяйки фигура, известна под названието „филтриран фрактал“ (percolated fractal).

Внезапно лицето на Кулон се изпълва с напрежение. Оценките на Crazy Stone за изхода на играта растат бързо, прекалено бързо, скоро те надминават 60 процента. Оказва се, че програмата е оценила погрешно един семей, или надпревара по обграждане на чуждите пулове, и смята една група собствени пулове от горния десен ъгъл за сигурна, докато тя всъщност не е. И тъй като изборът на ходове зависи от точната оценка на цялостната позиция на дъската, погрешно оценената група се оказва фатална. На 186-я ход Crazy Stone се предава и Зен става новия шампион на UEC.

По-късно същата вечер, по време на официалния банкет, Кулон казва, че не се чувства чак толкова зле, макар че аз предполагам, че е сериозно разочарован. Все пак той има шансове за компенсация. Като финалист, Crazy Stone все още има правото да играе срещу човешки майстор.

Битката на електронните мъдреци

За Кулон Битката на електронните мъдреци не е чак толкова важна. „Реалната конкуренция е в играта на програма срещу програма“, казва ми той по време на едно от ранните ни телефонни интервюта. „Когато противникът ми е друг програмист, ние правим едно и също нещо. Можем да разговаряме един с друг. Но когато играя срещу професионалист и той се опитва да ми обяснява ходовете си, нивото му е прекалено високо и аз не разбирам нищо. Той пък не може да разбере нищо от моя програмистки жаргон. Играта срещу живи хора е добра реклама, но за мен тя не е толкова интересна.“

Но когато се срещаме на реалния Densei-sen, той изглежда възбуден. Наоколо цари трескава активност. Залата за конференции от миналата седмица този път е резервирана за различни университетски величия, а за мачовете е подготвено ново, специално помещение с пълна тишина. Само съдията и хората, отчитащи времето, ще бъдат допуснати там, както и камерите, които показват за нас, тоест всички останали, какво се случва. Професионалните коментатори сега са в главната зала на сградата, където са се събрали поне стотина души, а телевизионните екипи очакват да видят как Crazy Stone и Зен ще се сблъскат с реални професионалисти.

През 2013 в Битката на електронните мъдреци е участвал Ишида „компютърът“ Ишидо, наричан така поради изключителните си способности за изчисляване на варианти и отлична игра в едншпила, края на играта. Тази година професионалистът е Норимото Йода, известен като капитан на японския тим, постигнал историческа победа над Южна Корея през 2006 в състезанието за купата Нонгшим, както и за това, че понякога стоварва пуловете с такава сила върху дъската, че ги чупи. След уводната церемония Кулон и Йода влизат в отделното помещение, покланят се и заемат местата си. В типичния си стил Йода е пристигнал, облечен в традиционно японско кимоно. В лявата си ръка държи сгънато ветрило. Кулон, също в типичния си стил, носи черен поло-пуловер. До дъската пред тях са разположени две купи, пълни с пулове – черни за Кулон, бели за Йода.

Този път няма нигири. Crazy Stone получава масивно предимство – той започва с четири черни пула, поставени върху четирите ключови позиции на дъската (така наречените звездни позиции). Йода няма друг избор освен да започне в силно агресивен стил, за да неутрализира предимството на съперника си.

В залата за пресата не можем да слушаме коментарите на професионалистите. Вместо това аз гледам как Мурамацу Муракаксу, един от главните организатори на състезанието, играе приятелска игра срещу О Мейен, като двамата се опитват да предсказват ходовете на Йода и Crazy Stone. В хода на играта и двамата се съгласяват, че играта на Crazy Stone е отлична.

Междувременно Кулон гледа към дъската, към лаптопа, към съдиите – навсякъде другаде, но не и към все по-раздразнения Йода. След като Кулон поставя поредния си пул, очите на Йода се свиват забележимо. Той изпъшква и започва да си вее яростно с ветрилото. „Това беше отличен ход“, казва О Мейен. „Йода-сан сигурно е раздразнен“.

Crazy Stone продължава да играе отличен ГО и всички опити за нападение от страна на Йода се оказват напразни. Едва когато краят наближава, Crazy Stone разкрива истинската си компютърна идентичност. Водейки с единадесет точки, всеки нормален човек в неговата ситуация би изиграл няколко очевидни хода, след което би пасувал, което е обичайната процедура в ГО, с която се позволява на противника да се предаде. Вместо това алгоритмът на Crazy Stone е направен така, че да се интересува единствено от победа – без да се интересува от това с каква преднина. Кулон пъшка докато Crazy Stone прави безполезен ход в собствената си територия, а след това още един. Играта продължава и Crazy Stone жертва точки, докато в края н краищата все пак решава да пасува и машината най-после е обявена за победител.

Кулон напуска колкото се може по-скоро бесния Йода и се присъединява към нас в помещението за пресата. „Гордея се с Crazy Stone“, казва той. „Много се гордея. Но първото нещо, с което ще се заема когато се прибера у дома ще бъде играта в ендшпила, така че да машината да не прави повече такива безсмислени ходове“. А след това нещата се проясняват. Йода успява да победи Зен във втория Densei-sen мач, а следователно славата от Битката на електронните мъдреци принадлежи на Кулон, чиято програма е победила вече двама професионалисти, ако и чрез предварително дадено предимство.

 

Go-06
Photo
: Takashi Osato/WIRED

Когато изкуственият интелект не е точно изкуствен интелект

След мача питам Кулон кога според него някоя машина ще спечели без предварително предимство. „Мисля, след около десет години“, казва той. „Но не обичам да правя предсказания“. Предпазливостта му е основателна. През 2007 г. главният програмист на Deep Blue, Фенг-Хсуинг Хсу, беше казал нещо много подобно за шахматните програми. Освен това Хсу предпочиташе алфа-бета търсенето пред алгоритъма Монте Карло, твърдейки, че „този алгоритъм няма да играе съществена роля при създаването на машина, която да победи най-добрите човешки играчи“. Едва ли е нужно да се уточнява, че и двете предсказания се оказаха погрешни.

Но дори и с Монте Карло „още десет години“ може да се окаже твърде оптимистична прогноза. И макар програмистите да са единодушни, че някой ден машините ще бъдат еднозначно по-добри от хората, мнозина от специалистите по ГО са скептични. „Въпросът дали някога ще стигнат до там е неясен“, казва Уил Локхарт, режисьор на документалния филм за ГО Играта на обкръжаването. „Хората, които са наясно с това колко силни всъщност са професионалистите, те не са чак толкова сигурни“.

Според изследователя на сложни системи от Университета в Сидни, Майкъл Харè, професионалните играчи на ГО имат изключително непредсказуем стил на игра. Харè е анализирал различни ГО играчи с варираща сила, като се е фокусирал върху предсказуемостта на ходовете им, при определени конфигурации от пулове. „Резултатите бяха напълно неочаквани“, казва той. „Ходовете ставаха все по-предсказуеми, но само докато играчите стигнат до почти професионално ниво. Оттам нататък ходовете стават все по-непредсказуеми и никой не знае защо. Най-доброто ни предположение е, че информацията откъм останалите части на дъската започва да влияе върху вземането на решения по начин, който все още не разбираме“.

Това означава, че компютърните програми евентуално ще се сблъскат с нова стена. Може да се окаже, че липсата на прогрес сред ГО-програмите от миналата година е свидетелство за още едно качествено разделение – същото, което разграничава аматьорите от професионалистите. Ако това наистина е така, може би ще трябва да се стигне до същия вид пробив както при алгоритъма на Кулон, за да се очаква по-нататъшно развитие.

За мое удивление повечето програмисти смятат, че евентуалният успех на програмите им няма да зависи особено много от нарастването на бързината на компютрите. Според тях силата на ГО програмите зависи най-вече от качеството на кода. Процесорната сила помага донякъде, но само донякъде. И действително, при купата UEC се допускат компютри с всякаква сила и макар че някои фирми пристигат със суперкомпютри, снабдени с по 2048 паралелни процесори, Crazy Stone и Зен правят магиите си на съвсем обикновен за наши дни, 64-битов хардуер.

Още по-удивителен е фактът, че никои от тях не гледат на програмите си като на „интелигентни“. „Играта ГО е впечатляващо сложна“, казва Кулон, „но тя няма нищо общо със сложността на човешкия интелект“. С други думи, Crazy Stone и Watson не са човешки същества. Те са решения на специфични проблеми. Ето защо не може да се очаква, че Watson на IBM ще бъде използван в борбата срещу рака, освен ако правенето на точни предположения при Jeopardy не се окаже полезно при лекуването на тумори. Развойната работа при създаването на Watson може и да помогне при създаването на програма за изкуствена диагностика, но тя няма да има нищо общо с Watson, по същия начин, по който Монте-Карло-алгоритмите, използвани при планирането на лечебни заведения, нямат нищо общо с Crazy Stone.

Хората, работещи в рекламния отдел на IBM, представят една по-различна картина, както го прави и пресата. Deep Blue и Watson могат и да печелят срещу хора в силно раздувани битки на човека срещу машината. Съответно, IBM може и да се представя като страж на портала в една нова епоха, онази на изкуствения интелект. Впримчени в една позиция между пълен атеизъм и ужасяващ страх от смъртта, учени като Рей Кързуил и други футуристи, подхранват тази погрешна представа, като обявяват гръмогласно идещия технологически апотеоз на човечеството, сливането на човека и машината, а пресата повтаря тази задъхана идиотщина чрез популярните медии. „Последната крепост на мозъка“, беше написано на корицата на Newsweek след поражението на Каспаров. Но всъщност машините дори не се доближават до някакво наподобяване функциите на мозъка – и създателите им са напълно съгласни с това.

 

Мнозина играчи на ГО гледат на играта като на последния бастион на човешка доминация над компютрите. Това гледище, което мълчаливо приема тезата за някаква битка между хората и машините, е дълбоко погрешно. Всъщност компютрите не могат да „спечелят“ нищо, не и докато не са в състояние да изпитват истинска радост от победата и тъга от загубата – едно програмистко предизвикателство, което прави ГО да изглежда като Тик-так-то. Мачовете на компютърния ГО не са последната крепост на мозъка. Те показват по-скоро какво огромно разстояние има да изминат машините, преди да постигнат нещо отдалечено подобно на истинска човешка интелигентност. А докато дойде този ден, най-добрият подход вероятно е онзи на самите програмисти. „За мен това е удоволствие“, казва Кулон. „Но това е всичко“.

http://www.wired.com/2014/05/the-world-of-computer-go/

 


[1] В играта ГО, за разлика от шахмата, е обичайно по-силният играч да дава аванс на по-слабия (под формата на пулове, предварително поставени на някои от ключовите полета по дъската). Бел. пр.

[2] Телевизионна игра-викторина, широко известна и имитирана по цял свят. Бел. пр.

[3] В отличие от шаха, при ГО първият ход принадлежи на играча с черните пулове. Бел. пр.

Алан Левиновиц е асистент по философия и религия в университета Джеймс Медисън. Негови статии се появяват редовно в списания като Slate, Salon, The Believer и др..

Pin It

Прочетете още...