David Silver (컴퓨터 과학자)

David Silver (computer scientist)

David Silver FRS(1976년생)는 DeepMind에서 강화 학습 연구 그룹을 이끌며 AlphaGo, AlphaZero, AlphaStar 공동 연구원을 역임했습니다.

그는 1997년 애디슨-웨슬리 상을 받으며 케임브리지 대학을 졸업했고,[1] 그곳에서 데미스 하사비스와 친구가 되었다.그 후, Silver는 비디오 게임 회사 Elixir Studios를 공동 설립해, CTO 및 리더 프로그래머로서 테크놀로지와 혁신에 관한 [1][2]몇개의 상을 수상했습니다.

Silver는 2004년 앨버타 대학에서 강화 학습 박사 과정을 공부하기 위해 학계로 돌아와 최초의 마스터 레벨 9×9 Go 프로그램에서 사용되는 알고리즘을 공동 도입하여 [3][4]2009년에 졸업했습니다.그의 MoGo 프로그램 버전(실뱅 겔리와 공동 집필)은 2009년 현재 [5]가장 강력한 바둑 프로그램 중 하나였다.

Silver는 2011년에 Royal Society University Research Fellowship을 수상했고, 이후 University College London의 강사가 되어 현재 교수로 [6]재직하고 있습니다.강화 학습에 대한 그의 강의는 유튜브에서 [7]볼 수 있다.Silver는 설립 초기부터 DeepMind의 컨설팅을 받았으며 2013년에 정규직으로 입사했습니다.

아타리 게임을 [8]픽셀에서 직접 학습하는 프로그램을 포함한 강화 학습과 딥 러닝의 결합에 중점을 두고 있다.실버는 알파고 프로젝트를 이끌었으며,[9] 바둑의 실물 크기 게임에서 최고의 프로 선수를 물리치는 첫 번째 프로그램으로 정점을 찍었다. 후 AlphaGo는 명예 9단 프로페셔널 인증을 받았으며,[10] 혁신으로 칸 라이온상을 수상했습니다.그리고 그는 같은 방법으로 체스와 장기를 배우기 전에 같은 인공지능을 사용하여 처음부터 바둑을 배우는 알파제로의 개발을 주도했다.프로그램보다 더 높은 수준으로 발전시켰다.

Silver는 DeepMind에서 가장 많이 출판된 직원 중 하나로 11만 명 이상의 인용을 받았으며 74개의 [11]h-index를 가지고 있습니다.

그는 컴퓨터 게임 [12]플레이의 비약적인 발전으로 2019 ACM상을 수상했습니다.

2021년, 실버는 딥 큐 네트워크알파고[13]기여한 공로로 왕립 학회의 펠로우로 선출되었다.

레퍼런스

  1. ^ a b Shead, Sam. "David Silver: The unsung hero and intellectual powerhouse at Google DeepMind". Business Insider. Retrieved 26 September 2020.
  2. ^ "What the AI Behind AlphaGo Can Teach Us About Being Human". Wired.com. Retrieved 17 May 2016.
  3. ^ David, Silver (2009). "Reinforcement Learning and Simulation-Based Search in Computer Go". ERA. doi:10.7939/R39D8T.
  4. ^ Sylvain Gelly, David Silver (2008). "Achieving Master Level Play in 9 × 9 Computer Go" (PDF). Proceedings of the Twenty-Third AAAI Conference on Artificial Intelligence.{{cite journal}}: CS1 maint: 작성자 파라미터 사용(링크)
  5. ^ Stuart J. Russell, Peter Norvig (2009). Artificial Intelligence: A Modern Approach (3rd ed.). Prentice Hall.{{cite book}}: CS1 maint: 작성자 파라미터 사용(링크)
  6. ^ "CSML David Silver". www.csml.ucl.ac.uk. Retrieved 27 May 2017.
  7. ^ "RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning". 13 May 2015 – via YouTube.
  8. ^ Mnih, Volodymyr; Kavukcuoglu, Koray; Silver, David; Rusu, Andrei A.; Veness, Joel; Bellemare, Marc G.; Graves, Alex; Riedmiller, Martin; Fidjeland, Andreas K. (26 February 2015). "Human-level control through deep reinforcement learning". Nature. 518 (7540): 529–533. Bibcode:2015Natur.518..529M. doi:10.1038/nature14236. ISSN 0028-0836. PMID 25719670. S2CID 205242740.
  9. ^ Silver, David; Huang, Aja; Maddison, Chris J.; Guez, Arthur; Sifre, Laurent; Driessche, George van den; Schrittwieser, Julian; Antonoglou, Ioannis; Panneershelvam, Veda; Lanctot, Marc; Dieleman, Sander; Grewe, Dominik; Nham, John; Kalchbrenner, Nal; Sutskever, Ilya; Lillicrap, Timothy; Leach, Madeleine; Kavukcuoglu, Koray; Graepel, Thore; Hassabis, Demis (28 January 2016). "Mastering the game of Go with deep neural networks and tree search". Nature. 529 (7587): 484–489. Bibcode:2016Natur.529..484S. doi:10.1038/nature16961. ISSN 0028-0836. PMID 26819042. S2CID 515925.closed access
  10. ^ "Google DeepMind AlphaGo in U.K. Wins Innovation Grand Prix". Retrieved 27 May 2017.
  11. ^ "David Silver – Google Scholar Citations". Retrieved 1 February 2022.
  12. ^ Ormond, Jim. "ACM Prize in Computing Awarded to AlphaGo Developer: David Silver Recognized for Breakthrough Advances in Computer Game-Playing". acm.org. Retrieved 2 April 2020.
  13. ^ "Royal Society elects outstanding new Fellows and Foreign Members". royalsociety.org. Retrieved 8 June 2021.