알파고
AlphaGo시리즈의 일부 |
인공지능 |
---|
알파고는 [1]바둑을 두는 컴퓨터 프로그램이다.구글(현재의 알파벳 주식회사)의 자회사인 DeepMind[2] Technologies에 의해 개발되었다.알파고의 [3]후속 버전은 마스터라는 이름으로 경쟁했던 버전을 포함하여 점점 더 강력해졌다.알파고 마스터는 경쟁 게임에서 은퇴한 후 알파고 제로라고 알려진 훨씬 더 강력한 버전으로 승계되었다. 알파고 제로 버전은 인간 게임으로부터 배우지 않고 완전히 독학했다.알파고 제로는 이후 알파제로로 알려진 프로그램으로 일반화되었는데, 이 프로그램은 체스와 장기를 포함한 추가 게임을 했다.AlphaZero는 규칙을 배우지 않고 배우는 MuZero라고 알려진 프로그램에 의해 차례로 계승되었다.
AlphaGo와 그 후계자들은 몬테카를로 트리 검색 알고리즘을 사용하여 기계 학습, 특히 인간과 컴퓨터 [4]놀이 모두에서 광범위한 훈련을 통해 인공 신경 네트워크(딥 러닝 방법)에 의해 이전에 습득된 지식을 기반으로 움직임을 찾는다.뉴럴 네트워크는 최적의 움직임과 이러한 움직임의 승률을 식별하도록 훈련됩니다.이 신경 네트워크는 트리 검색의 강도를 향상시켜 다음 반복에서 더 강력한 이동 선택을 가능하게 합니다.
2015년 10월 판후이와의 대결에서 오리지널 알파고는 19×19 크기의 대형 [5][6]보드에서 인간 프로 바둑기사를 핸디캡 없이 이긴 최초의 컴퓨터 바둑 프로그램이 되었다.2016년 3월, 컴퓨터 바둑 프로그램이 [7]핸디캡 없이 프로 9단을 이긴 것은 처음인 5개의 대결에서 이세돌을 이겼다.비록 4번째 경기에서 이세돌에게 졌지만, 이세돌은 마지막 경기에서 알파고에 4 대 1로 최종 점수를 내주며 사임했다.이 승리를 인정받아 알파고는 한국기원으로부터 [8]명예 9단을 수여받았다.이세돌과의 선두 다툼과 챌린지 매치는 그렉 코스가 감독한 '알파고'[9]라는 제목의 다큐멘터리 영화로 기록되었다.알파고의 우승은 2016년 [10]12월 22일 사이언스에 의해 올해의 돌파구 중 하나로 선정되었다.
2017년 '미래 바둑 서밋'에서 알파고의 마스터 버전은 당시 세계 랭킹 1위였던 커제이를 3전 2선승제로 누르고, 이후 알파고는 중국웨이키협회에서 [11]프로 9단을 수상했다.
알파고와 커제이의 대결 이후 딥마인드는 알파고를 은퇴시키고 다른 [12]분야에서도 AI 연구를 계속했다.독학으로 배운 알파고 제로(AlphaGo Zero)는 초창기 경쟁 버전인 알파고에 100 대 0의 승리를 거뒀으며, 그 후속작인 알파제로(AlphaZero)는 현재 [13][14]세계 최고의 바둑 기수로 인식되고 있다.
역사
바둑은 체스 같은 다른 게임보다 컴퓨터가 이기는 것이 훨씬 더 어려운 것으로 여겨지고 있는데, 이는 컴퓨터가 알파 베타 가지치기, 나무 횡단, 휴리스틱 [5][15]검색과 같은 전통적인 AI 방법을 사용하는 것이 엄청나게 어렵기 때문입니다.
1997년 IBM의 컴퓨터 딥 블루가 세계 체스 챔피언 개리 카스파로프를 이긴 지 거의 20년이 지났지만, 인공지능 기술을 이용한 가장 강력한 바둑 프로그램은 아마추어 [4]5단 수준에 도달했을 뿐,[5][6][16] 여전히 핸디캡 없이 프로 바둑 선수를 이길 수 없었다.2012년, 4대의 PC 클러스터상에서 동작하는 소프트웨어 프로그램 Zen은, 타케미야 마사키(9p)를 5석, 4석의 핸디캡으로 [17]2회 제쳤다.2013년에는 크레이지 스톤이 이시다 요시오(9p)를 4스톤 [18]핸디캡으로 꺾었다.
DeepMind의 David Silver에 따르면, 알파고 연구 프로젝트는 딥 러닝을 사용하는 신경 네트워크가 [19]바둑에서 얼마나 잘 경쟁할 수 있는지를 테스트하기 위해 2014년경에 시작되었다.알파고는 이전의 바둑 프로그램들에 비해 크게 향상되었다.Crazy Stone과 Zen을 포함한 이용 가능한 다른 바둑 프로그램과의 500개의 게임에서, 한 대의 컴퓨터로 작동하는 AlphaGo는 [20]한 대를 제외하고 모두 이겼다.비슷한 매치업에서 여러 대의 컴퓨터로 실행되는 알파고가 다른 바둑 프로그램과 대결하는 500개의 게임을 모두 이겼고, 한 대의 컴퓨터로 실행되는 알파고와 대결하는 게임의 77%를 차지했습니다.2015년 10월에 배포된 버전은 1,202개의 CPU와 176개의 [4]GPU를 사용했습니다.
판후이와의 대전
2015년 10월, 알파고의 배포 버전은 유럽 바둑 챔피언인 2단 프로 선수인 판 [21]후이를 5대 [6][22]0으로 물리쳤습니다.컴퓨터 바둑 프로그램이 실물 크기의 보드에서 [23]핸디캡 없이 프로 인간 선수를 이긴 것은 이번이 처음이었다.사용된 [6]알고리즘을 설명하는 논문이 네이처 저널에[4] 게재된 것과 동시에 뉴스의 발표는 2016년 1월 27일로 연기되었다.
이세돌과의 대전
알파고는 2016년 [24][25]3월 9일, 10일, 12일,[26] 13일, 15일 서울 포시즌스호텔에서 5차례의 대결을 벌이며 한국 프로 바둑 9단 이세돌(9위)[16][needs update]과 맞붙었다.5경기 중 알파고가 4승을 거뒀고 이청용은 4승을 거둬 74경기 [27]모두 알파고를 이긴 유일한 인간 기수로 기록됐다.AlphaGo는 구글의 클라우드 컴퓨팅에서 실행되었으며,[28] 서버는 미국에 있습니다.이 경기는 7.5점짜리 중국 규칙을 사용했고, 각 팀은 2시간의 사고 시간에 60초의 [29]쿄요미 기간을 3회 더했다.이소룡과 맞붙는 알파고 버전은 [30]판후이 대전에서 사용된 것과 비슷한 계산 능력을 사용했다.이코노미스트는 1920개의 CPU와 280개의 [31]GPU를 사용했다고 보도했다.당시 이세돌은 16년간 [32]세계선수권 타이틀을 지켜온 한국 선수 이창호에 이어 세계에서 두 번째로 많은 우승을 차지했다.국제 바둑에는 공식 순위가 따로 없기 때문에 랭킹은 정보원마다 다를 수 있다.그가 가끔 1위에 오르기도 했지만,[33][34] 몇몇 소식통들은 이세돌을 당시 세계 최고의 선수 4위로 평가했다.알파고는 이대호를 상대하기 위해 특별히 훈련받은 것도 아니고 어떤 특정한 인간 선수들과 경쟁하기 위해 고안된 것도 아니다.
처음 세 경기는 [35][36]이대호의 사퇴로 알파고가 승리했다.하지만 이대호는 4번째 경기에서 알파고를 물리치고 180수 만에 사표를 던졌다.알파고는 그 후 4승째를 거두며 5승째를 거뒀다.[37]
상금은 100만 달러였다.알파고가 5개 중 4개를 이겼기 때문에 그 상금은 [38]유니세프를 포함한 자선단체에 기부될 것이다.이세돌은 5경기 모두 출전해서 15만 달러를 받았고 [29]4차전에서의 우승으로 2만 달러를 추가로 받았다.
2016년 6월 네덜란드의 한 대학에서 열린 발표회에서 딥마인드 팀 중 하나인 아자 황은 알파고와 이승엽의 경기 4차전 과정에서 발생한 논리적인 약점을 고쳤으며, 이후 78(많은 프로들에게 '신수'로 불린 것)은 의도대로 플레이할 것이라고 밝혔다.블랙의 장점을 강조합니다.78번 이동 전에는 알파고가 경기 내내 선두를 달리고 있었지만, 이씨의 이동으로 인해 프로그램의 컴퓨팅 능력이 분산되고 [39]혼란스러워졌다.가장 정확한 이동 순서를 찾아 계속하는 알파고의 정책 네트워크는 78번 이동 후 알파고의 78번 이동 가능성이 가장 높은 것으로 판단되지 않아 알파고가 제대로 조정하지 못했다고 황 교수는 설명했다.o 논리적인 계속.[40]
60개의 온라인 게임
2016년 12월 29일, Tygem 서버의 새로운 계정인 "Magister"(서버 중국어 버전에서는 "Magist"로 표시됨)가 한국에서 프로 선수들과 게임을 하기 시작했다.12월 30일 계정 이름을 "마스터"로 변경하였고, 2017년 1월 1일 폭스고 서버로 이동하였다.1월 4일, DeepMind는 "마지스터"와 "마스터"가 [41][42]알파고 마스터라고 불리는 알파고의 업데이트된 버전에 의해 플레이된다고 확인했다.2017년 1월 5일 현재, 알파고 마스터의 온라인 기록은 60승 [43]0패이며, 바둑의 최고 순위 [44]선수인 커제에게 3승을 거두었다. 커제는 마스터가 알파고의 [43]버전이라는 것을 미리 조용히 보고받았다.마스터에게 패한 후, 구리는 마스터를 [42]이길 수 있는 첫 번째 인간 선수에게 10만 위안(14,400달러)의 현상금을 걸었다.마스터는 하루에 10경기씩 경기를 했다.많은 사람들은 경기 사이에 휴식 시간이 거의 없거나 전혀 없기 때문에 AI 플레이어일 것이라고 빠르게 의심했다.상대는 커제, 박정환, 이야마 유타, 투자시, 미위팅, 시웨, 천야오예, 리친청, 구리, 장하오, 탕웨이싱, 판팅위, 저우루이, 지앙웨이 등 세계 챔피언들이었다.롄샤오, 탄샤오, 멍타이핑, 당이페이, 황윤송, 양딩신, 구쯔하오, 신진서, 조한승, 안성준 등이 있습니다.한 경기를 제외한 60개 경기는 모두 20, 30초짜리 빠른 경기였다.마스터는 나이 등을 고려해 녜웨이핑과 경기할 때 1분 연장해 주겠다고 했다.59번째 게임에서 승리한 후 마스터는 Dr.에 의해 조종되는 채팅방에서 자신을 드러냈습니다.DeepMind [45]팀의 Aja Huang은 그 후 영국으로 국적을 바꿨다.DeepMind의 공동 설립자인 Demis Hassabis는 트윗에서 "우리는 바둑 조직 및 [41][42]전문가들과 협력하여 나중에 공식적이고 긴 게임을 할 수 있기를 기대한다"고 말했다.
바둑 전문가들은 프로그램의 성과와 비인간적인 플레이 스타일에 감명을 받았다; 커제이는 "인류가 수천 년 동안 우리의 전략을 개선해 온 후, 컴퓨터는 우리에게 인간이 완전히 틀렸다고 말한다...단 [43]한 사람도 바둑의 진실의 가장자리를 건드린 적이 없다고 말할 정도다.
바둑 서밋의 미래
알파고 마스터는 2017년 5월 우젠에서 열린 '미래의 바둑 서밋'에서 세계 랭킹 1위인 커제( jie,)와 3차례, 중국 최고 프로 선수 여러 명과 2차례, 바둑 1쌍, 인간 [46]5명으로 구성된 공동팀과 1차례의 경기를 벌였다.
구글 딥마인드는 커제이와 마스터의 3경기 승자 상금으로 150만 달러를 내걸었고 진 팀은 30만 [47][48]달러를 가져갔다.마스터는 커제와의 [49][50]3전 전승을 거뒀고 이후 알파고는 중국 [11]웨이지협회에서 프로 9단을 수상했다.
세계 최고의 바둑 기사인 커제와의 3게임에서 승리한 후, 알파고는 은퇴했다.DeepMind는 [12]또한 다른 분야의 AI 연구에 집중하기 위해 이 게임을 연구하던 팀을 해체했다.서밋이 끝난 후, Deepmind는 [51]바둑 커뮤니티에 선물로 50개의 알파고 대 알파고 대결을 발표했다.
알파고 제로 및 알파 제로
알파고 팀은 2017년 10월 19일 네이처 저널에 인간 데이터가 없고 이전의 어떤 인간 챔피언 격파 [52]버전보다 강력한 버전인 알파고 제로(AlphaGo Zero)를 소개하는 기사를 실었다.알파고 제로는 100대 0으로 승리하며 3일 만에 알파고 리의 강점을 넘어섰고 21일 만에 알파고 마스터 수준에 올랐으며 40일 [53]만에 구버전을 모두 넘어섰다.
2017년 12월 5일 arXiv에서 발표된 논문에서 딥마인드는 알파고 제로의 접근 방식을 단일 AlphaZero 알고리즘으로 일반화했으며, 이 알고리즘은 세계 챔피언 프로그램, 스톡피시, 엘모, 알파고 3일 버전을 각 [54]제로 케이스에서 물리침으로써 체스, 장기, 바둑에서 초인적인 수준의 게임을 24시간 이내에 달성했다고 주장했다.
교육 도구
2017년 12월 11일, 딥마인드는 알파고 마스터가 [56]계산한 다양한 바둑 오프닝의 승률을 분석하는 알파고[55] 교육 도구를 웹사이트에 공개하였다.이 교육 도구는 알파고 마스터가 1,000,000개의 시뮬레이션을 통해 각각 분석한 230,000개의 인간 게임으로부터 6,000개의 바둑 오프닝들을 수집합니다.많은 오프닝에는 인간의 이동 [56]제안이 포함되어 있습니다.
버전
AlphaGo의 초기 버전은 다양한 수의 CPU와 GPU를 사용하여 비동기 또는 분산 모드로 실행되는 하드웨어에서 테스트되었습니다.각 동작에 2초의 생각 시간이 주어졌습니다.결과 Elo 등급은 다음과 같습니다.[4]이동당 시간이 많은 경기에서 더 높은 등급을 획득합니다.
배열 | 서치 스레드 | CPU 수 | GPU 수 | Elo 등급 |
---|---|---|---|---|
싱글[4] | 40 | 48 | 1 | 2,181 |
싱글 | 40 | 48 | 2 | 2,738 |
싱글 | 40 | 48 | 4 | 2,850 |
싱글 | 40 | 48 | 8 | 2,890 |
분산 | 12 | 428 | 64 | 2,937 |
분산 | 24 | 764 | 112 | 3,079 |
분산 | 40 | 1,202 | 176 | 3,140 |
분산 | 64 | 1,920 | 280 | 3,168 |
2016년 5월, 구글은 자체 하드웨어 "텐서 처리 장치"를 공개했는데, 이 장치는 이미 이세돌과의 [57][58]알파고 대결을 포함한 구글의 여러 내부 프로젝트에 배치되었다고 밝혔다.
딥마인드는 2017년 5월 '퓨처오브고 서밋'에서 이번 서밋에서 사용된 알파고 버전이 알파고 [59][60]마스터임을 공개하고 소프트웨어 버전별로 강도를 측정했다고 밝혔다.이씨를 상대로 한 버전인 '알파고 리'는 '알파고 팬' 대 '판후이'에서 사용된 버전인 '알파고 팬'을 3개, '알파고 마스터'는 3개까지 [61]더 강하게 만들 수 있었다.
버전 | 하드웨어 | Elo 등급 | 날짜. | 결과. |
---|---|---|---|---|
알파고 팬 | 176대의 GPU,[53] 분산형 | 3,420[52] | 2015년 10월 | 5:0 판후이와의 대결 |
알파고 리 | 48 TPU,[53] 분산형 | 3,739[52] | 2016년 3월 | 이세돌과의 4:1 대결 |
알파고 마스터 | 4대의 TPU,[53] 1대의 머신 | 4,858[52] | 2017년 5월 | 프로 선수와의 대결에서 60:0 바둑 서밋의 미래 |
알파고 제로(40블록) | 4대의 TPU,[53] 1대의 머신 | 5,190[52] | 2017년 10월 | AlphaGo Lee를 100:0으로 격파 89:11 AlphaGo Master와의 대결 |
AlphaZero(20블록) | 4대의 TPU, 1대의 머신 | 5,018 | 2017년 12월 | AlphaGo Zero(20블록)에 대해 60:40 |
알고리즘.
2016년 현재 AlphaGo 알고리즘은 머신러닝과 트리서치 기술을 조합하여 인간과 컴퓨터 게임 모두에서 광범위한 훈련을 받고 있습니다."가치 네트워크"와 "정책 네트워크"에 의해 안내되는 몬테카를로 트리 검색을 사용하며, 둘 다 심층 뉴럴 네트워크 [5][4]기술을 사용하여 구현됩니다.뉴럴 [4]네트워크에 송신되기 전에 입력에 한정량의 게임 고유의 특징 검출 전처리(예를 들어 무브와 나케이드 패턴의 일치 여부를 강조 표시)가 적용된다.네트워크는 강화 [64]학습에 의해 훈련되는 12개 층의 컨볼루션 뉴럴 네트워크이다.
이 시스템의 신경 네트워크는 처음에는 인간 게임 전문 지식으로부터 부트스트랩되었습니다.알파고는 처음에 약 3천만 [21]번의 움직임을 데이터베이스로 사용하여 기록된 역사 게임에서 나온 전문가 선수들의 움직임을 맞추려고 시도함으로써 인간의 놀이를 모방하도록 훈련되었다.어느 정도 숙달된 후에는 강화 학습을 통해 [5]플레이를 향상시키기 위해 다수의 게임을 자신의 다른 인스턴스와의 대결로 설정함으로써 더 많은 훈련을 받았다.상대편의 시간을 "무례하게" 낭비하는 것을 피하기 위해, 이 프로그램은 승리 확률이 일정 문턱 이하로 떨어지면 사퇴하도록 특별히 프로그램 되어 있다. 이 후보와의 경기는 사퇴 문턱을 20%[65]로 설정했다.
플레이 스타일
알파고 대 판후이의 경기 심판인 토비 매닝은 이 프로그램의 스타일을 "보수적"[66]이라고 묘사했다.알파고의 플레이 스타일은 더 적은 [19]승점보다 적은 승점만큼 더 높은 승률을 선호한다.승리 확률을 극대화하는 전략은 영토적 이득을 극대화하는 인간 플레이어들의 성향과 구별되며, 이상하게 보이는 움직임 [67]중 일부를 설명한다.그것은 사람에 의해 결코 또는 거의 만들어지지 않은 많은 오프닝 동작을 한다.그것은 특히 상대가 지나치게 [citation needed]집중되어 있을 때 어깨 타격을 사용하는 것을 좋아한다.
2016년 우승에 대한 반응
AI 커뮤니티
알파고의 2016년 3월 승리는 인공지능 [68]연구의 중요한 이정표였다.바둑은 그동안 기계학습에서 어려운 문제로 여겨져 왔으며 이는 당시 [68][69][70]기술로는 불가능할 것으로 예상됐다.대부분의 전문가들은 알파고와 같은 강력한 바둑 프로그램이 적어도 5년은 [71]걸릴 것이라고 생각했다. 몇몇 전문가들은 컴퓨터가 바둑 [4][72][73]챔피언들을 이기려면 적어도 10년은 더 걸릴 것이라고 생각했다.2016년 경기 초반 대부분의 관측통들은 이대호가 알파고를 [68]이길 것으로 예상했다.
체커(치누크 드로츠 팀이 해결한 것), 체스, 그리고 이제 컴퓨터가 이긴 바둑과 같은 게임들로 인해, 인기 있는 보드 게임의 승리는 더 이상 인공지능의 주요 이정표가 될 수 없다.딥 블루의 머레이 캠벨은 알파고의 승리를 "한 시대의 끝...보드게임은 어느 정도 끝났고 [68]이제 앞으로 나아가야 할 때입니다.
딥 블루나 왓슨과 비교했을 때, 알파고의 기본 알고리즘은 잠재적으로 더 범용적이며 과학계가 인공지능으로 [19][74]발전하고 있다는 증거일 수 있다.일부 논평가들은 알파고의 승리가 사회가 범용 지능을 가진 기계의 미래 영향에 대비할 수 있는 좋은 기회를 만든다고 믿고 있다.기업가 Guy Suter가 지적했듯이, 알파고는 바둑을 둘 줄만 알고 범용 지능을 가지고 있지 않다; [그것은] 어느 날 아침에 일어나서 [68]총기 사용법을 배우고 싶다고 결정할 수는 없었다.AI 연구원 스튜어트 러셀은 알파고와 같은 AI 시스템이 예상보다 더 빨리 발전하고 더 강력해졌으며, 따라서 우리는 그것들이 "인간의 [75]통제 하에 남아있을" 수 있는 방법을 개발해야 한다고 말했다.Stephen Hawking과 같은 일부 학자들은 (2015년 5월 경기 전) 미래의 자기계발형 AI가 실제 일반 지능을 획득하여 예기치 않은 AI 인수로 이어질 수 있다고 경고했습니다. 다른 학자들은 동의하지 않습니다.AI 전문가 장 가브리엘 가나시아는 상식 같은 것은 결코 재현할 [76]수 없을지도 모른다며 공포에 대해 왜 말할지 모르겠다고 말했다.반대로, 이것은 건강이나 우주 [75]탐험과 같은 많은 분야에서 희망을 불러일으키고 있습니다.컴퓨터 과학자인 리차드 서튼은 말했다. "저는 사람들이 두려워해야 한다고 생각하지 않습니다.하지만 사람들이 [77]관심을 가져야 한다고 생각합니다."
중국에서 알파고는 중국 정부가 인공지능에 [78]대한 자금 지원을 우선시하고 대폭 늘리도록 설득하는 데 도움을 준 "스푸트닉의 순간"이었다.
2017년, DeepMind AlphaGo 팀은 AI의 뛰어난 업적으로 IJCAI Marvin Minsky의 첫 번째 메달을 받았습니다. "AlphaGo는 놀라운 업적이며, 민스키 메달이 무엇을 인정하기 위해 시작되었는지를 보여주는 완벽한 사례입니다,"라고 IJCAI의 회장 Michael Woldridge는 말했습니다."IJCAI가 특히 인상 깊었던 것은 AlphaGo가 DeepMind가 매우 밀접하게 관련되어 있는 최첨단 기계학습 기술뿐만 아니라 클래식 AI 기술을 훌륭하게 조합하여 그 기능을 달성했다는 것입니다.이는 현대 AI의 놀라운 시연이며, [79]이 상을 통해 이를 인정하게 되어 기쁩니다.
Go 커뮤니티
바둑은 중국, 일본, 한국에서 인기 있는 게임이고 2016년 경기는 전 세계적으로 [68][80]약 1억 명의 사람들이 시청했다.많은 정상급 바둑 기사들은 알파고의 비정통적인 기량을 처음에는 구경꾼들을 혼란스럽게 만들었던 겉으로 보기에 의심스러운 움직임으로 특징지었지만,[72] 나중에 생각해 보니 "최고의 바둑 기사들은 정상급 기수를 모방하여 그들의 스타일을 만든다.AlphaGo는 [68]완전히 독창적인 움직임을 보이는군요.2015년 10월 컴퓨터가[81] 처음으로 핸디캡 [82]없이 프로 바둑을 이긴 것과 비교해도 알파고는 의외로 강해진 것 같다.한국 최대 일간지 바둑의 정아람 주임 특파원은 이승엽의 첫 패배 다음 날, "어젯밤은 매우 우울했다...많은 사람이 술을 [83]마셨다고 말했다.한국의 바둑 전문가들을 감독하는 단체인 한국기원은 알파고에 창의력을 발휘하고 게임의 [84]진행을 추진한 공로로 명예 9단 타이틀을 수여했다.
당시 [33][85]세계 최고의 바둑 기수로 인정받았던 18세의 커제( china china)는 처음에는 알파고를 이길 수 있을 것이라고 주장했지만, "내 스타일을 따라할 것"[85]을 우려해 반대하지는 않았다.커제는 경기가 진행되면서 처음 3경기를 [86]분석한 뒤 질 가능성이 높다며 오락가락하다가 4차전 [87]알파고가 흠집을 내자 자신감을 되찾았다.
판후이와의 알파고 대결의 심판인 토비 매닝과 국제 바둑 연맹 사무총장 이하진 둘 다 미래에 바둑 기사들은 그들이 게임에서 무엇을 잘못했는지 배우고 그들의 [82]기술을 향상시키기 위해 컴퓨터로부터 도움을 받을 것이다.
2차전이 끝난 뒤 이승엽은 경기 초반부터 단 한 번의 움직임으로 절대 우위를 점할 수 없었다.알파고의 [88]완승이었다.이대호는 3차전 후 알파고의 능력을 잘못 판단해 [68]무력감을 느꼈다며 패배를 사과했다.그는 이번 패배가 이세돌의 패배이며 인류의 패배가 아니라고 강조했다.[27][76]리는 기계에 대한 그의 궁극적인 손실은 "불가항력"이라고 말했지만 "로봇들은 우리 인간들과 [76]같은 방식으로 게임의 아름다움을 결코 이해하지 못할 것"이라고 말했다.이승엽은 자신의 4승째를 무엇과도 [27]바꿀 수 없는 승리라고 평가했다.
유사한 시스템
Facebook은 또한 기계학습과 몬테카를로 트리 [66][89]검색을 조합한 자체 Go-Playing 시스템 다크포레스트를 개발하고 있다.다른 컴퓨터 바둑 프로그램들에 비해 강하지만, 2016년 초 현재, 그것은 아직 전문 인간 [90]선수를 꺾지 못했다.다크포레스트는 CrazyStone과 Zen에 패해 [91]CrazyStone과 Zen과 비슷한 강점으로 평가되고 있다.
동영상 공유 사이트인 Dwango와 도쿄 대학의 지원을 받아 개발된 시스템인 DeepZenGo는 2016년 11월,[92][93] 바둑의 거장 조치쿤에게 2 대 1로 패했다.
2018년 네이처지는 잠재적인 의약품 [94][95]분자를 계산하는 새로운 방법으로 AlphaGo의 접근방식을 인용했다.
게임 예시
알파고 마스터(흰색) v.탕웨이싱(2016년 12월 31일), 알파고가 사임으로 승리.화이트 36은 널리 찬사를 받았다.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
첫 번째 99개 이동 |
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
100~186으로 이동합니다(139는 131, 150은 130) |
이동에 미치는 영향
다큐멘터리 영화[9][96] '알파고'는 이세돌과 판후이가 알파고를 플레이한 경험으로 이득을 볼 수 있었을 것이라는 기대를 불러일으켰지만, 2018년 5월 현재 그들의 등급은 거의 변하지 않았다. 이세돌은 세계 11위,[97] 판후이는 545위였다.2019년 11월 19일, 이소룡은 AI의 우세로 인해 자신이 바둑의 전체 1위가 될 수 없다고 주장하며 프로 은퇴를 선언했다.이 대통령은 이들을 [98]이길 수 없는 존재라고 표현했다.
See also
- Albert Lindsey Zobrist, wrote first Go program in 1968
- Chinook (draughts player), draughts playing program
- Glossary of artificial intelligence
- Go and mathematics
- Leela (software)
- Leela Zero, open-source learning Go program
- Matchbox Educable Noughts and Crosses Engine
- Samuel's learning computer checkers (draughts)
- TD-Gammon, backgammon neural network
- Pluribus (poker bot)
- AlphaZero
- AlphaFold
References
- ^ "Artificial intelligence: Google's AlphaGo beats Go master Lee Se-dol". BBC News. 12 March 2016. Retrieved 17 March 2016.
- ^ "DeepMind AlphaGO". DeepMind Artificial Intelligence AlphaGo.
- ^ "AlphaGo DeepMind". DeepMind.
- ^ a b c d e f g h i Silver, David; Huang, Aja; Maddison, Chris J.; Guez, Arthur; Sifre, Laurent; Driessche, George van den; Schrittwieser, Julian; Antonoglou, Ioannis; Panneershelvam, Veda; Lanctot, Marc; Dieleman, Sander; Grewe, Dominik; Nham, John; Kalchbrenner, Nal; Sutskever, Ilya; Lillicrap, Timothy; Leach, Madeleine; Kavukcuoglu, Koray; Graepel, Thore; Hassabis, Demis (28 January 2016). "Mastering the game of Go with deep neural networks and tree search". Nature. 529 (7587): 484–489. Bibcode:2016Natur.529..484S. doi:10.1038/nature16961. ISSN 0028-0836. PMID 26819042. S2CID 515925.
- ^ a b c d e "Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning". Google Research Blog. 27 January 2016.
- ^ a b c d "Google achieves AI 'breakthrough' by beating Go champion". BBC News. 27 January 2016.
- ^ "Match 1 – Google DeepMind Challenge Match: Lee Sedol vs AlphaGo". 8 March 2016.
- ^ "Google's AlphaGo gets 'divine' Go ranking". The Straits Times. straitstimes.com. 15 March 2016. Retrieved 9 December 2017.
- ^ a b "AlphaGo Movie". AlphaGo Movie.
- ^ "From AI to protein folding: Our Breakthrough runners-up". Science. 22 December 2016. Retrieved 29 December 2016.
- ^ a b "中国围棋协会授予AlphaGo职业九段 并颁发证书" (in Chinese). Sohu.com. 27 May 2017. Retrieved 9 December 2017.
- ^ a b Metz, Cade (27 May 2017). "After Win in China, AlphaGo's Designers Explore New AI". Wired.
- ^ "AlphaZero Crushes Stockfish In New 1,000-Game Match". 17 April 2019.
- ^ "A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play". 7 December 2018.
- ^ Schraudolph, Nicol N.; Terrence, Peter Dayan; Sejnowski, J., Temporal Difference Learning of Position Evaluation in the Game of Go (PDF)
- ^ a b "Computer scores big win against humans in ancient game of Go". CNN. 28 January 2016. Retrieved 28 January 2016.
- ^ "Zen computer Go program beats Takemiya Masaki with just 4 stones!". Go Game Guru. Archived from the original on 1 February 2016. Retrieved 28 January 2016.
- ^ "「アマ六段の力。天才かも」囲碁棋士、コンピューターに敗れる 初の公式戦". MSN Sankei News. Archived from the original on 24 March 2013. Retrieved 27 March 2013.
- ^ a b c John Riberio (14 March 2016). "AlphaGo's unusual moves prove its AI prowess, experts say". PC World. Retrieved 18 March 2016.
- ^ "Google AlphaGo AI clean sweeps European Go champion". ZDNet. 28 January 2016. Retrieved 28 January 2016.
- ^ a b Metz, Cade (27 January 2016). "In Major AI Breakthrough, Google System Secretly Beats Top Player at the Ancient Game of Go". WIRED. Retrieved 1 February 2016.
- ^ "Special Computer Go insert covering the AlphaGo v Fan Hui match" (PDF). British Go Journal. 2017. Retrieved 1 February 2016.
- ^ "Première défaite d'un professionnel du go contre une intelligence artificielle". Le Monde (in French). 27 January 2016.
- ^ "Google's AI AlphaGo to take on world No 1 Lee Sedol in live broadcast". The Guardian. 5 February 2016. Retrieved 15 February 2016.
- ^ "Google DeepMind is going to take on the world's best Go player in a luxury 5-star hotel in South Korea". Business Insider. 22 February 2016. Retrieved 23 February 2016.
- ^ Novet, Jordan (4 February 2016). "YouTube will livestream Google's AI playing Go superstar Lee Sedol in March". VentureBeat. Retrieved 7 February 2016.
- ^ a b c Yoon Sung-won (14 March 2016). "Lee Se-dol shows AlphaGo beatable". The Korea Times. Retrieved 15 March 2016.
- ^ "李世乭:即使Alpha Go得到升级也一样能赢". JoongAng Ilbo (in Chinese). 23 February 2016. Retrieved 24 February 2016.
- ^ a b "이세돌 vs 알파고, '구글 딥마인드 챌린지 매치' 기자회견 열려" (in Korean). Korea Baduk Association. 22 February 2016. Archived from the original on 3 March 2016. Retrieved 22 February 2016.
- ^ Demis Hassabis [@demishassabis] (11 March 2016). "We are using roughly same amount of compute power as in Fan Hui match: distributing search over further machines has diminishing returns" (Tweet). Retrieved 14 March 2016 – via Twitter.
- ^ "Showdown". The Economist. Retrieved 19 November 2016.
- ^ Steven Borowiec (9 March 2016). "Google's AI machine v world champion of 'Go': everything you need to know". The Guardian. Retrieved 15 March 2016.
- ^ a b Rémi Coulom. "Rating List of 2016-01-01". Archived from the original on 18 March 2016. Retrieved 18 March 2016.
- ^ "Korean Go master proves human intuition still powerful in Go". The Korean Herald/ANN. 14 March 2016. Archived from the original on 12 April 2016. Retrieved 15 March 2016.
- ^ "Google's AI beats world Go champion in first of five matches – BBC News". BBC Online. Retrieved 9 March 2016.
- ^ "Google AI wins second Go game against world champion – BBC News". BBC Online. Retrieved 10 March 2016.
- ^ "Google DeepMind AI wins final Go match for 4–1 series win". Engadget. Retrieved 15 March 2016.
- ^ "Human champion certain he'll beat AI at ancient Chinese game". Associated Press. 22 February 2016. Retrieved 22 February 2016.
- ^ "In Two Moves, AlphaGo and Lee Sedol Redefined the Future". WIRED. Retrieved 12 November 2017.
- ^ "黄士杰:AlphaGo李世石人机大战第四局问题已解决date=8 July 2016" (in Chinese). Retrieved 8 July 2016.
- ^ a b Demis Hassabis (4 January 2017). "Demis Hassabis on Twitter: "Excited to share an update on #AlphaGo!"". Demis Hassabis's Twitter account. Retrieved 4 January 2017.
- ^ a b c Elizabeth Gibney (4 January 2017). "Google reveals secret test of AI bot to beat top Go players". Nature. 541 (7636): 142. Bibcode:2017Natur.541..142G. doi:10.1038/nature.2017.21253. PMID 28079098.
- ^ a b c "Humans Mourn Loss After Google Is Unmasked as China's Go Master". Wall Street Journal. 5 January 2017. Retrieved 6 January 2017.
- ^ "The world's best Go player says he still has "one last move" to defeat Google's AlphaGo AI". Quartz. 4 January 2017. Retrieved 6 January 2017.
- ^ "横扫中日韩棋手斩获59胜的Master发话:我是阿尔法狗" (in Chinese). 澎湃新闻. 4 January 2017. Retrieved 11 December 2017.
- ^ "Exploring the mysteries of Go with AlphaGo and China's top players". 10 April 2017.
- ^ "World No.1 Go player Ke Jie takes on upgraded AlphaGo in May". 10 April 2017.
- ^ "Ke Jie vs. AlphaGo: 8 things you must know". 27 May 2017.
- ^ Metz, Cade (23 May 2017). "Revamped AlphaGo Wins First Game Against Chinese Go Grandmaster". Wired.
- ^ Metz, Cade (25 May 2017). "Google's AlphaGo Continues Dominance With Second Win in China". Wired.
- ^ "Full length games for Go players to enjoy". Deepmind. Retrieved 28 May 2017.
- ^ a b c d e Silver, David; Schrittwieser, Julian; Simonyan, Karen; Antonoglou, Ioannis; Huang, Aja; Guez, Arthur; Hubert, Thomas; Baker, Lucas; Lai, Matthew; Bolton, Adrian; Chen, Yutian; Lillicrap, Timothy; Fan, Hui; Sifre, Laurent; Driessche, George van den; Graepel, Thore; Hassabis, Demis (19 October 2017). "Mastering the game of Go without human knowledge" (PDF). Nature. 550 (7676): 354–359. Bibcode:2017Natur.550..354S. doi:10.1038/nature24270. ISSN 0028-0836. PMID 29052630. S2CID 205261034.
- ^ a b c d e "AlphaGo Zero: Learning from scratch". DeepMind official website. 18 October 2017. Retrieved 19 October 2017.
- ^ Silver, David; Hubert, Thomas; Schrittwieser, Julian; Antonoglou, Ioannis; Lai, Matthew; Guez, Arthur; Lanctot, Marc; Sifre, Laurent; Kumaran, Dharshan; Graepel, Thore; Lillicrap, Timothy; Simonyan, Karen; Hassabis, Demis (5 December 2017). "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm". arXiv:1712.01815 [cs.AI].
- ^ "AlphaGo teaching tool". DeepMind.
- ^ a b "AlphaGo教学工具上线 樊麾:使用Master版本" (in Chinese). Sina.com.cn. 11 December 2017. Retrieved 11 December 2017.
- ^ McMillan, Robert (18 May 2016). "Google Isn't Playing Games With New Chip". The Wall Street Journal. Retrieved 26 June 2016.
- ^ Jouppi, Norm (18 May 2016). "Google supercharges machine learning tasks with TPU custom chip". Google Cloud Platform Blog. Retrieved 26 June 2016.
- ^ "AlphaGo官方解读让三子 对人类高手没这种优势" (in Chinese). Sina. 25 May 2017. Retrieved 2 June 2017.
- ^ "各版alphago实力对比 master能让李世石版3子" (in Chinese). Sina. 24 May 2017. Retrieved 2 June 2017.
- ^ "New version of AlphaGo self-trained and much more efficient". American Go Association. 24 May 2017. Retrieved 1 June 2017.
- ^ "【柯洁战败解密】AlphaGo Master最新架构和算法,谷歌云与TPU拆解" (in Chinese). Sohu. 24 May 2017. Retrieved 1 June 2017.
- ^ Silver, David; Hubert, Thomas; Schrittwieser, Julian; Antonoglou, Ioannis; Lai, Matthew; Guez, Arthur; Lanctot, Marc; Sifre, Laurent; Kumaran, Dharshan; Graepel, Thore; Lillicrap, Timothy; Simonyan, Karen; Hassabis, Demis (7 December 2018). "A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play". Science. 362 (6419): 1140–1144. Bibcode:2018Sci...362.1140S. doi:10.1126/science.aar6404. PMID 30523106. S2CID 54457125 – via science.org (Atypon).
- ^ Silver, David; Schrittwieser, Julian; Simonyan, Karen; Antonoglou, Ioannis; Huang, Aja; Guez, Arthur; Hubert, Thomas; Baker, Lucas; Lai, Matthew; Bolton, Adrian; Chen, Yutian; Lillicrap, Timothy; Fan, Hui; Sifre, Laurent; Driessche, George van den; Graepel, Thore; Hassabis, Demis (19 October 2017). "Mastering the game of Go without human knowledge" (PDF). Nature. 550 (7676): 354–359. Bibcode:2017Natur.550..354S. doi:10.1038/nature24270. ISSN 0028-0836. PMID 29052630. S2CID 205261034.
AlphaGo Lee... 12 convolutional layers
- ^ Cade Metz (13 March 2016). "Go Grandmaster Lee Sedol Grabs Consolation Win Against Google's AI". Wired News. Retrieved 29 March 2016.
- ^ a b Gibney, Elizabeth (27 January 2016). "Google AI algorithm masters ancient game of Go". Nature. 529 (7587): 445–6. Bibcode:2016Natur.529..445G. doi:10.1038/529445a. PMID 26819021.
- ^ Chouard, Tanguy (12 March 2016). "The Go Files: AI computer clinches victory against Go champion". Nature. doi:10.1038/nature.2016.19553. S2CID 155164502.
- ^ a b c d e f g h Steven Borowiec; Tracey Lien (12 March 2016). "AlphaGo beats human Go champ in milestone for artificial intelligence". Los Angeles Times. Retrieved 13 March 2016.
- ^ Connor, Steve (27 January 2016). "A computer has beaten a professional at the world's most complex board game". The Independent. Archived from the original on 28 January 2016. Retrieved 28 January 2016.
- ^ "Google's AI beats human champion at Go". CBC News. 27 January 2016. Retrieved 28 January 2016.
- ^ Dave Gershgorn (12 March 2016). "GOOGLE'S ALPHAGO BEATS WORLD CHAMPION IN THIRD MATCH TO WIN ENTIRE SERIES". Popular Science. Retrieved 13 March 2016.
- ^ a b "Google DeepMind computer AlphaGo sweeps human champ in Go matches". CBC News. Associated Press. 12 March 2016. Retrieved 13 March 2016.
- ^ Sofia Yan (12 March 2016). "A Google computer victorious over the world's 'Go' champion". CNN Money. Retrieved 13 March 2016.
- ^ "AlphaGo: Google's artificial intelligence to take on world champion of ancient Chinese board game". Australian Broadcasting Corporation. 8 March 2016. Retrieved 13 March 2016.
- ^ a b Mariëtte Le Roux (12 March 2016). "Rise of the Machines: Keep an eye on AI, experts warn". Phys.org. Retrieved 13 March 2016.
- ^ a b c Mariëtte Le Roux; Pascale Mollard (8 March 2016). "Game over? New AI challenge to human smarts (Update)". phys.org. Retrieved 13 March 2016.
- ^ Tanya Lewis (11 March 2016). "An AI expert says Google's Go-playing program is missing 1 key feature of human intelligence". Business Insider. Retrieved 13 March 2016.
- ^ Mozur, Paul (20 July 2017). "Beijing Wants A.I. to Be Made in China by 2030". The New York Times. Retrieved 11 April 2018.
- ^ "Marvin Minsky Medal for Outstanding Achievements in AI". International Joint Conference on Artificial Intelligence. 19 October 2017. Retrieved 21 October 2017.
- ^ CHOE SANG-HUN (16 March 2016). "Google's Computer Program Beats Lee Se-dol in Go Tournament". The New York Times. Retrieved 18 March 2016.
More than 100 million people watched the AlphaGo-Lee matches, Mr. Hassabis said.
- ^ John Ribeiro (12 March 2016). "Google's AlphaGo AI program strong but not perfect, says defeated South Korean Go player". PC World. Retrieved 13 March 2016.
- ^ a b Gibney, Elizabeth (2016). "Go players react to computer defeat". Nature. doi:10.1038/nature.2016.19255. S2CID 146868978.
- ^ Zastrow, Mark (15 March 2016). "How victory for Google's Go AI is stoking fear in South Korea". New Scientist. Retrieved 18 March 2016.
- ^ JEE HEUN KAHNG; SE YOUNG LEE (15 March 2016). "Google artificial intelligence program beats S. Korean Go pro with 4–1 score". Reuters. Retrieved 18 March 2016.
- ^ a b Neil Connor (11 March 2016). "Google AlphaGo 'can't beat me' says China Go grandmaster". The Telegraph (UK). Retrieved 13 March 2016.
- ^ "Chinese Go master Ke Jie says he could lose to AlphaGo : The DONG-A ILBO". Retrieved 17 March 2016.
- ^ "...if today's performance was its true capability, then it doesn't deserve to play against me". M.hankooki.com. 14 March 2016. Retrieved 5 June 2018.
- ^ CHOE SANG-HUN (15 March 2016). "In Seoul, Go Games Spark Interest (and Concern) About Artificial Intelligence". The New York Times. Retrieved 18 March 2016.
- ^ Tian, Yuandong; Zhu, Yan (2015). "Better Computer Go Player with Neural Network and Long-term Prediction". arXiv:1511.06410v1 [cs.LG].
- ^ HAL 90210 (28 January 2016). "No Go: Facebook fails to spoil Google's big AI day". The Guardian. ISSN 0261-3077. Retrieved 1 February 2016.
- ^ "Strachey Lecture – Dr Demis Hassabis". The New Livestream. Retrieved 17 March 2016.
- ^ "Go master Cho wins best-of-three series against Japan-made AI". The Japan Times Online. 24 November 2016. Retrieved 27 November 2016.
- ^ "Humans strike back: Korean Go master bests AI in board game bout". CNET. Retrieved 27 November 2016.
- ^ "Go and make some drugs The Engineer". www.theengineer.co.uk. 3 April 2018. Retrieved 3 April 2018.
- ^ Segler, Martwin H.S.; Preuss, Mike; Waller, Mark P. (29 March 2018). "Planning chemical syntheses with deep neural networks and symbolic AI". Nature. 555: 604–610.
- ^ "AlphaGo (2017)". Rotten Tomatoes. Retrieved 5 June 2018.
- ^ "Go Ratings". Go Ratings. Retrieved 5 June 2018.
- ^ Vincent, James (27 November 2019). "Former Go champion beaten by DeepMind retires after declaring AI invincible". The Verge. Retrieved 28 November 2019.
External links
Media related to AlphaGo at Wikimedia Commons
Quotations related to AlphaGo at Wikiquote
- Official website
- AlphaGo wiki at Sensei's Library, including links to AlphaGo games
- AlphaGo page, with archive and games
- Estimated 2017 rating of Alpha Go
- AlphaGo - The Movie on YouTube