Học máy và AI có thể được triển khai trên các nhiệm vụ lớn như tìm ra ngoại hành tinh và tạo ra những người theo thuyết quang học, nhưng các kỹ thuật tương tự cũng có một số ứng dụng đáng ngạc nhiên trong giới hàn lâm: DeepMind đã tạo ra một hệ thống AI giúp các học giả hiểu và tái tạo các văn bản Hy Lạp cổ đại rời rạc trên những phiến đá vỡ.
Những viên đất sét, đá hoặc kim loại, được ghi cách đây 2.700 năm, là nguồn chính vô giá cho lịch sử, văn học và nhân học. Một cách tự nhiên, chúng được bao phủ bằng các chữ cái, nhưng thường thì thiên niên kỷ đã không tử tế và không chỉ có các vết nứt và chip mà toàn bộ các mảnh còn thiếu có thể chứa nhiều biểu tượng.
Những khoảng trống như vậy, hay lacunae, đôi khi rất dễ hoàn thành: Nếu tôi viết, thì sp_der đã bắt được fl_, bất cứ ai cũng có thể nói với bạn rằng đó thực sự là con nhện bắt được con ruồi. Nhưng nếu nó còn thiếu nhiều chữ cái nữa và trong một ngôn ngữ chết, để khởi động? Không dễ để lấp đầy những khoảng trống.
Làm như vậy là một khoa học (và nghệ thuật) được gọi là sử thi, và nó liên quan đến cả sự hiểu biết trực quan về các văn bản này và các văn bản khác để thêm bối cảnh; người ta có thể đưa ra một phỏng đoán có giáo dục về những gì đã từng được viết dựa trên những gì còn tồn tại ở nơi khác. Nhưng nó khó khăn và công việc khó khăn – đó là lý do tại sao chúng tôi cung cấp nó cho học sinh tốt nghiệp, những điều nghèo nàn.
Đến với cuộc giải cứu của họ là một hệ thống mới được tạo ra bởi các nhà nghiên cứu DeepMind mà họ gọi là Pythia, sau lời sấm truyền tại Delphi, người đã dịch từ thần thánh của Apollo vì lợi ích của người phàm.
Trước tiên, nhóm nghiên cứu đã tạo ra một đường ống truyền thống không cần thiết để chuyển đổi bộ sưu tập kỹ thuật số Hy Lạp cổ đại lớn nhất thế giới thành văn bản mà một hệ thống máy học có thể hiểu được. Từ đó, chỉ cần tạo ra một thuật toán để đoán chính xác các chuỗi chữ cái – giống như bạn đã làm cho con nhện và con ruồi.
Nghiên cứu sinh và Pythia đều được đưa ra các văn bản chân thực với các phần được cắt bỏ nhân tạo. Các sinh viên đã nhận được văn bản đúng khoảng 57% thời gian – điều đó không tốt, vì việc khôi phục văn bản là một quá trình dài và lặp đi lặp lại. Pythia đã hiểu đúng về vấn đề này, 30% thời gian.
Nhưng! Câu trả lời đúng nằm trong top 20 câu trả lời 73% thời gian. Phải thừa nhận rằng điều đó có vẻ không ấn tượng lắm, nhưng bạn hãy thử và xem liệu bạn có thể có được nó trong 20.
Nguồn: TechCrunch – thực hiện bởi AI News 1.1.2