Oliver Kim 
Komputado | 10a de Junio, 2017
[RS009] AlphaGo venkis

AlphaGo estas artefarita intelekta programo, kiu venkis kontraŭ diversaj ĉampionoj en la ludo Go.



Vi nun aŭskultas la 9an elsendon de RadioScienca kaj mi volas, kiel ĉiam, kore bonvenigi vin. Mi nomiĝas Oliver kaj hodiaŭ mi volas paroli pri la artefarita intelekta programo AlphaGo. Mi preskaŭ ne povas kredi kiel rapide la tempo pasas, ĉar mi bone memoras gravan konkurson, kiu okazis en la jaro 1997. Do, pri kio temas? Tiam la komputilo IBM DeepBlue kaj Garry Kasparov, la tiama ŝakĉampiono, havis konkurson en la ludo ŝako. La komputilo Deepblue venkis kontraŭ Kasparov. La fakto, ke komputiloj povas esti tiom potencaj surprizis multajn, kaj mi memoras ke tiu konkurso estis grandskale pridiskutata.

Nun, post 20 jaroj, alia grava konkurso inter homoj kaj komputiloj okazis. Nun, tamen, la defio estis multoble pli granda. Nun ne temis pri la ludo ŝako, sed pri la ludo Go. Go estas treege ampleksa ludo, kvankam la reguloj mem estas tre facilaj.

Do, kio fakte nun okazis? La programo AlphaGo de la firmao Google venkis kontraŭ du ĉampionoj, Lee Sedol el Koreio (tio okazis en 2016). En Majo 2017 Alphago venkis kontraŭ Ke Jie el Ĉinio. Ke Jie estas la nuna Go-ĉampiono.

La ludantoj metas nigrajn kaj blankajn ŝtonojn sur tabulon. Le celo de la ludo estas okupiĝi pli da teritorio ol la kontraŭulo. Ŝtonoj, kiuj estas tute ĉirkaŭigitaj per ŝtonoj de la alia koloro, mortas kaj la teritorio apartenas al la alia ludanto. Oni kalkulis, ke la tuta nombro de eblaj pozicioj estas 10 je la 170 potenco. Tio estas treege granda nombro, treege pli granda ol la tuta kvanto da atomoj en la universo. Oni povas diri ke la nombroj de pozicioj estas preskaŭ senlima.

Kvankam la reguloj de la ludo estas tre simplaj, treege ampleksaj situacioj povas aperi. Oni eĉ diras, ke la ludo Go estas la plej ampleksa ludo iam ajn inventita de homoj. Tute ne eblas rekte kalkuli la plej bonan movon, ĉar aliaj komponantoj, kiel intuicio, ludas tre gravan rolon. Go ludantoj ofte uzas ilian intuicion por ludi, kaj ili tial ofte ne povas klarigi al eksteruloj, kial ili metis la ŝtonon tien, kien ili metis ĝin. La valoro de la Goaj ŝtonoj ĉiam ŝanĝiĝas, kaj simple ne eblas kalkuli la plej bonan movon.

Mi spektis kelkajn ludojn inter AlphaGo kaj la ĉampionoj en la interreto, kaj mi provis kompreni la eksplikadojn de la komentisto. Sed mi baldaŭ malkovris, ke la komentisto mem ne ĉiam povis ekspliki la movojn de la du ludantoj. Alivorte, kelkfoje mi pensis, ke la komentisto mem ne sciis pri kio okazis.

La programistoj, enmetis artefaritan intelekton en la programon. AlphaGo havas la kapablon lerni kaj tial povas plibonigi sian ludkapablon. Komence la programistoj enmetis kelkajn milionojn da ludoj en la komputilon por instrui ĝin pri la reguloj de la ludo. Poste ili lasis la programon ludi kontraŭ ĝi mem. Tiel la programo povis lerni de siaj propraj eraroj.

La venko de AlphaGo ne estis hazardo. Dum vintro 2016-17 sesdek el la plej bonaj Go-aj ludantoj ludis kontraŭ AlphaGo kaj la komputilo ĉiam venkis. Kelkaj eble ne taksas tiun okazon kiel gravan, sed la evoluigo de artefarite intelektaj programoj estonte certe havos grandan influon al multaj kapoj. La aplikado de AlphaGo por ludi Go estas nur publike videbla aplikaĵo. Oni jam planas uzi la programon por analizi medicinajn informojn kaj tiel plu.

Do jen ĉio, kaj kiel ĉiam, havu bonan tagon kaj ĝis revido!

radioscienca.com (2017)