“Trí Tuệ Nhân Tạo” Alphago Là Gì Mà Khiến Con Người Thán Phục?

Những người quan tâm đến cờ vây – một trò chơi cờ vây, tự hỏi, làm thế nào một thuật toán AI có thể chiếm được tâm trí của người chơi vĩ đại nhất trong cờ vây? Bài viết hôm nay chính là câu trả lời cho câu hỏi này. Bạn đang xem: Alphago là gì

Cờ vây (tiếng Anh: Go) là một trò chơi cổ xưa của nhân loại, và là một trong những board game lâu đời nhất còn tồn tại cho đến ngày nay. Luật cờ vây rất đơn giản, mục tiêu chính là bao vây một lãnh thổ rộng lớn hơn đối thủ. Một người chơi (người chơi cờ vua) cầm quân trắng, và người kia sẽ cầm quân đen. Quân cờ trong cờ vây còn có tên gọi khác là quân cờ. Tất cả các quân cờ trong một bộ cờ chỉ có một hình dạng (hai cạnh cong đều hoặc một mặt phẳng, một mặt lồi). Một bàn cờ vây tiêu chuẩn có kích thước ô vuông là 19×19 dòng, ngoài ra còn có một số kích thước khác như 13×13 hay 9×9; thậm chí kích thước 17 × 17 đã được sử dụng trong lịch sử.

Đang xem: Alphago là gì

Hình ảnh bàn cờ vây tiêu chuẩn 19×19 bằng đá.1. Quy tắc

Người chơi thay phiên nhau đặt quân cờ của mình trên các giao lộ trống. Giao lộ (điểm giao nhau, tiếng Anh: point) là giao điểm của các đường. Khi một quân cờ được đặt trên bàn cờ, quân cờ đó không thể di chuyển. Tuy nhiên, một quân cờ có thể bị “bắt” và loại bỏ khỏi bàn cờ khi nó bị bao vây bởi các quân cờ đối thủ ở tất cả các nút liền kề. Ván bài sẽ kết thúc khi một bên chấp nhận thua (bỏ cuộc), hoặc cả hai bên đều không muốn đi thêm nước đi nào nữa. Thắng thua được xác định bằng cách đếm lãnh thổ cùng với các quân bắt được và điểm komi (điểm được cộng vào tổng điểm của người chơi màu trắng để tạo lợi thế bù cho việc bắt đầu trò chơi phía sau người chơi khác) – lấy quân màu đen). Bên nào có tổng điểm lớn hơn sẽ thắng.

Các quy tắc của cờ vây tương đối đơn giản, nhưng về mặt chiến thuật, cờ vây cực kỳ linh hoạt. Bạn biết những gì bạn được phép làm, nhưng khi bạn ngồi chơi, bạn không biết phải làm gì. So với Cờ vua, số lượng nước đi có thể có cho một thế cờ lớn hơn nhiều lần: trong Cờ vua, con số này là 20, nhưng trong Cờ vây, con số này là 200. Nếu chúng ta xem xét số lượng khả năng cho tất cả các thế cờ. di chuyển trên bàn cờ, nó thậm chí còn nhiều hơn tổng số nguyên tử trong vũ trụ. Đây là một thách thức rất lớn đối với các nhà nghiên cứu AI khi muốn tạo ra một phần mềm chơi cờ vây với con người.

2. DeepMind và AlphaGo

DeepMind (hay Google DeepMind sau khi được Google mua lại vào năm 2014) là một công ty Trí tuệ nhân tạo (AI) của Anh được thành lập vào tháng 9 năm 2010 với tên gọi DeepMind Technologies. Kể từ tháng 1 năm 2014, sau khi trở lại Google, DeepMind đã bắt tay vào các dự án chuyên sâu về AI. Hiện tại, Giám đốc điều hành và đồng sáng lập của công ty là Tiến sĩ Demis Hassabis.

AlphaGo là một chương trình máy tính được phát triển bởi DeepMind để có thể chơi cờ vây. Trước năm 2015, các chương trình cờ vây tốt nhất trên thế giới chỉ đạt cấp độ nghiệp dư. Thậm chí trong nhiều thập kỷ, người ta tin rằng cờ vây khó bị máy tính đánh bại bởi nó chứa nhiều nước đi sáng tạo và phức tạp mà chỉ bộ não con người mới có thể thành thạo. AlphaGo là chương trình có sự khác biệt đáng kể nhất so với các nỗ lực AI trước đây ở chỗ nó áp dụng mạng thần kinh nhân tạo, trong đó phương pháp tự giải quyết là đánh giá, thử nghiệm và vẽ. trải nghiệm không phải do con người mã hóa cứng, mà thay vào đó, phần lớn do chính chương trình tự học, thông qua hàng chục triệu trò chơi cờ vây cũng như các trò chơi của chính nó.

Xem thêm bài viết hay:  Những Điều Cần Biết Về Bói Bài Tây Là Gì, Bói Bài Ý Nghĩa Về Vận Số Của 52 Lá Bài Tây

*

Logo AlphaGo – Chương trình máy tính cờ vây của Google DeepMind.3. Trận đấu lịch sử giữa AlphaGo và Lee Sedol

Đầu tiên chúng ta hãy tìm hiểu một chút về hệ thống xếp hạng của Go. Thứ hạng cờ vây được phân chia trên hai hệ thống riêng biệt: hệ thống hạng nghiệp dư và hệ thống hạng chuyên nghiệp. Mọi người sử dụng thuật ngữ kyu và thuật ngữ dan để xếp hạng người chơi. Đối với một tuyển thủ chuyên nghiệp, dan cao nhất mà họ có thể đạt được là 9 đẳng chuyên nghiệp (9p).

cảnh trận đấu

Vào tháng 10 năm 2015, AlphaGo đã đánh bại nhà vô địch cờ vây châu Âu Fan Hui. Fan Hui khi đó là một vận động viên 2 đẳng (2p) chuyên nghiệp. Đây là lần đầu tiên một sản phẩm Trí tuệ nhân tạo (AI) có thể đánh bại một người chơi chuyên nghiệp trong một trận đấu sử dụng bàn cờ lớn tiêu chuẩn 19×19 và không sử dụng lợi thế. Ván đấu kết thúc với chiến thắng hoàn toàn của AlphaGo trước Fan Hui (5-0). Sau trận đấu chóng vánh đó, giới cờ vây chuyên nghiệp đã nghi ngờ sức mạnh thực sự của AlphaGo. Họ đặt câu hỏi “Sức mạnh thực sự của AlphaGo là gì?” và “Sẽ mất bao lâu trước khi nó có thể đánh bại những người chơi giỏi nhất thế giới?” Những câu hỏi này thúc đẩy các nhà nghiên cứu DeepMind tiếp tục cải thiện chương trình và họ muốn đẩy thuật toán AI đến giới hạn để xem quá trình tự học và cải tiến này có thể tiến xa đến đâu. Để kiểm tra điều đó, các chuyên gia DeepMind cần tìm một đối thủ cạnh tranh mới, mạnh mẽ hơn…

Lee Sedol là một kỳ thủ cờ vây 9 đẳng (cấp độ cao nhất) chuyên nghiệp đến từ Hàn Quốc. Anh là người hùng, niềm tự hào dân tộc của xứ sở kim chi và là một trong những kỳ thủ mạnh nhất lịch sử cờ vây. Lee Sedol bắt đầu thi đấu chuyên nghiệp từ năm 13 tuổi (lên đẳng chuyên nghiệp năm 12 tuổi). Lee Sedol đã thống trị thế giới cờ vây trong hơn một thập kỷ với 18 chức vô địch thế giới. DeepMind chọn Lee Sedol vì họ muốn chọn một kỳ thủ huyền thoại, người được công nhận là kỳ thủ cờ vây vĩ đại nhất trong thập kỷ qua.

*

Lee Sedol – Cao thủ cờ vây Hàn Quốc.

Demis Hassabis nói về trận đấu đặc biệt giữa AlphaGo và Lee Sedol: “Đây là một thời khắc lịch sử cho cả thế giới Trí tuệ nhân tạo và thế giới cờ vây. Cho đến nay, AlphaGo đã đánh bại mọi thử thách mà chúng tôi đưa ra. Nhưng chúng ta sẽ không biết sức mạnh thực sự của nó cho đến khi chúng ta đối đầu với kỳ thủ cờ vây hàng đầu thế giới như Lee Sedol.”

Fan Hui cũng bình luận: “Cả thế giới đang gây áp lực lên Lee Sedol. Trước đây, anh ấy tham gia các giải đấu vì đất nước, vì bản thân. Còn lần này, anh ấy thi đấu với nhân loại, so tài trí tuệ của con người”.

Ngược lại, Lee Sedol cảm thấy tự tin về trận đấu này. Ông tin rằng trực giác của con người vẫn còn quá tiên tiến để Trí tuệ nhân tạo có thể bắt kịp. Lee Sedol hy vọng sẽ giành chiến thắng 5-0 hoặc 4-1 trước AlphaGo.

Xem thêm bài viết hay:  Biệt Nữu Là Gì - Thuật Ngữ Viết Tắt Trong Đam

trận đấu chính thức

Cuộc thách đấu của DeepMind với kỳ thủ cờ vây mạnh nhất thế giới Lee Sedol diễn ra từ ngày 8 tháng 3 năm 2016 đến ngày 15 tháng 3 năm 2016 tại khách sạn Four Seasons ở Seoul, Hàn Quốc. Michael Redmond (9 đẳng chuyên nghiệp) và Chris Garlock là hai bình luận viên của trận đấu. 5 ván đấu diễn ra vào ngày 9, 10, 12, 13 và 15 tháng 3 và được truyền hình trực tiếp dưới sự theo dõi của 8 triệu người chơi cờ vây tại Hàn Quốc. Hai bên sẽ thi đấu theo luật của Trung Quốc, với 7,5 điểm komi. Trong mỗi trò chơi, thời gian trò chơi được giới hạn trong 2 giờ, sau đó là giai đoạn byo-yomi, mỗi người chơi có 60 giây để thực hiện mỗi nước đi, không quá 3 lần để hoàn thành trò chơi. Aja Huang là đại diện của DeepMind chịu trách nhiệm đặt quân cờ lên bàn cờ vây cho AlphaGo.

Xem thêm: Lễ Khai Trương Cửa Hàng, Lễ Khai Trương Cho Công Ty, Cửa Hàng Gồm Những Gì

*

Trong ván đầu tiên này, AlphaGo cầm quân trắng. Lee Sedol đi trước. Lee nắm quyền kiểm soát trong phần lớn thời gian của ván đấu, nhưng AlphaGo chiếm thế thượng phong trong 20 phút cuối và Lee Sedol chịu thua. Ván đấu kết thúc sau 186 nước đi. Đen 123 và Đen 129 là sai lầm cuối cùng của Lee và anh ấy đã không thể lật ngược tình thế. Lee tự trách mình vì sai lầm ở quân Đen 123 và 129 ngay sau khi ván đấu kết thúc.

*

Ván 1 – AlphaGo (Trắng) thắng.

AlphaGo cầm quân đen trong ván thứ hai và có lợi thế để tiếp tục giành chiến thắng. Lee Sedol sau đó nói rằng “AlphaGo đã có một ván đấu gần như hoàn hảo”. Nước đi thứ 37 của AlphaGo được đánh giá là một nước đi rất đẹp mắt, sáng tạo và độc đáo. AlphaGo đã cho thấy sự bất thường từ các nước đi, nó nhìn từ góc độ rộng hơn khi những người chơi cờ vây chuyên nghiệp cho rằng đó là một nước đi sai nhưng thực ra AlphaGo đã thực hiện một nước đi có chủ ý.

Ván 2 – AlphaGo (Đen) thắng.

Trong ván thứ ba, AlphaGo cầm quân trắng. Nó đã có một trò chơi rất thuyết phục và trên thực tế, nó đã chơi tốt đến mức… gần như đáng sợ. Ván đấu kết thúc ở nước thứ 176 và AlphaGo đã làm nên lịch sử với 3 trận thắng liên tiếp trước Lee Sedol.

Ván 3 – AlphaGo (Trắng) thắng.

Trò chơi thứ tư là một trò chơi đặc biệt. Lee Sedol có trận thắng đầu tiên trước AlphaGo. Ba trận thắng liên tiếp đã khiến bình luận viên Chris Garlock phải thốt lên “Liệu AlphaGo có điểm yếu nào không?”. Tuy nhiên, trong ván đấu thứ tư này, AlphaGo đã phạm một sai lầm không nên có: Quá tự tin. Nước đi thứ 78 của Lee Sedol được mô tả là “thần thánh” (Lee Sedol ảo diệu!) và ở nước đi tiếp theo, AlphaGo đã mắc sai lầm. Tỷ lệ thắng được ước tính là 70% bất ngờ giảm mạnh ở nước thứ 87. Lee Sedol khiến AlphaGo “đầu hàng” sau 180 nước đi. Chiến thắng này có ý nghĩa rất lớn đối với Lee Sedol và các hoạt náo viên. Nó cho thấy trí tuệ con người vẫn có thể đứng vững, dù trong tương lai có lẽ sẽ khó đánh bại được AI.

Ván 4 – Lee Sedol (Trắng) thắng.

Trong Ván 5, Fan Hui nói: “Có vẻ như điểm yếu của Lee Sedol đã quay trở lại và anh ấy đã thực hiện một số nước đi thực sự tồi tệ.” Ván đấu kết thúc nhẹ nhàng với chiến thắng dành cho AlphaGo sau 280 nước đi.

Xem thêm bài viết hay:  Bảo hiểm nhân thọ là gì? Có những loại hình nào?

Ván 5 – AlphaGo (Trắng) thắng.4. Bài học từ AlphaGoNam Chi-hyung (Giáo sư nghiên cứu cờ vây – Đại học Myongji): “Chúng ta đã nói rất nhiều về những nước đi rất ‘dị’ và kỳ lạ của AlphaGo, có vẻ như đó là một sai lầm. . Cho đến khi kết thúc trận đấu, chúng tôi phải nghi ngờ bản thân, những phán đoán của mình.” Frank Lantz (Giám đốc Trung tâm Trò chơi – Đại học New York): “Đối với tôi, đây là điều thú vị nhất mà tôi học được về trò chơi này khi xem cách AlphaGo chơi, nó được gọi là ‘nước cờ cẩu thả’. AlphaGo muốn dạy chúng ta một điều rằng, chúng ta quá phụ thuộc vào điểm số, và dựa vào đó để xác định cơ hội chiến thắng của mình. Tại thời điểm này, bạn có thể bao vây nhiều mặt đất hơn, kiếm được nhiều điểm hơn, tôi ít điểm và thua, điều đó không có nghĩa là bạn sẽ thắng. Tôi chỉ cần một nút duy nhất để đảo ngược tình thế. Tại sao tôi phải mua thêm đất khi tôi không thực sự cần nó? Đó là điều mà AlphaGo muốn thay đổi cách chúng ta nhìn nhận trò chơi trong tương lai.” Lee Sedol: “Điều làm tôi ngạc nhiên nhất là cách AlphaGo chỉ cho chúng tôi những nước đi mà mọi người nghĩ rằng ‘sáng tạo’, thực ra đối với nó lại rất bình thường.”5. Bình luận

DeepMind đã sử dụng công nghệ mạng thần kinh – mô phỏng mạng thần kinh của bộ não con người cho AlphaGo. AlphaGo tự học cách chơi cờ vây bằng cách phân tích hàng nghìn nước đi của người chơi trước đó. Sau đó, kết hợp với công nghệ học tăng cường, nó chơi cờ vua với chính nó để đẩy trình độ của nó lên cấp độ cao hơn. Về bản chất, những lần tự chơi này giúp tạo ra các bước di chuyển mới mà máy tính có thể sử dụng để tự đào tạo lại. Vì vậy, đây không phải là một động thái của con người. Nói cách khác, hệ thống AlphaGo không hoạt động để chơi theo cách thông thường, nó chơi theo cách mà con người sẽ không bao giờ làm.

Xem thêm: Cách Lập Ma Trận Trên Máy Tính Vinacal 570Es Plus, Cách Lập Ma Trận Trên Máy Tính Casio Fx

Video hành trình AlphaGo đánh bại Lee Sedol:

Vũ Duy Long – FPT Software

FPT Cungdaythang.com chính thức ra mắt chuyên mục mới “VIEWER VIEW” nơi độc giả có thể chia sẻ các bài viết về công nghệ mới, kinh nghiệm lập trình, tham gia dự án,… đến cộng đồng yêu thích. nghệ. Các bài viết chất lượng đăng trên website Cungdaythang.com của FPT sẽ nhận được mức nhuận bút hấp dẫn thay cho lời cảm ơn vì những đóng góp của tác giả cho cộng đồng.

Bạn thấy bài viết “Trí Tuệ Nhân Tạo” Alphago Là Gì Mà Khiến Con Người Thán Phục? có khắc phục đươc vấn đề bạn tìm hiểu ko?, nếu ko hãy comment góp ý thêm về “Trí Tuệ Nhân Tạo” Alphago Là Gì Mà Khiến Con Người Thán Phục? bên dưới để Trường Cao đẳng Nghề Khách sạn Du lịch Quốc tế IMPERIAL có thể thay đổi & cải thiện nội dung tốt hơn cho các bạn nhé! Cám ơn bạn đã ghé thăm Website: imperialhotelschool.edu.vn của Trường Cao đẳng Nghề Khách sạn Du lịch Quốc tế IMPERIAL

Nhớ để nguồn: “Trí Tuệ Nhân Tạo” Alphago Là Gì Mà Khiến Con Người Thán Phục? của website imperialhotelschool.edu.vn

Chuyên mục: Là gì?

Viết một bình luận