Việc chứng minh bạn không phải là rô bốt ngày càng khó hơn

Vào năm ngoái, những yêu cầu liên tục của Google để chứng minh tôi là con người bắt đầu cảm thấy ngày càng trở nên hung hăng. Ngày càng nhiều, nút đơn giản, hơi quá dễ thương nói “Tôi không phải là rô-bốt” được theo sau bởi các yêu cầu chứng minh điều đó – bằng cách chọn tất cả đèn giao thông, lối đi qua đường và mặt tiền cửa hàng trong một lưới hình ảnh. Ngay sau đó, đèn giao thông bị chôn vùi trong những tán lá xa xôi, lối qua đường cong vênh và nửa xung quanh một góc, bảng chỉ dẫn trước cửa hàng mờ ảo và bằng tiếng Hàn. Có điều gì đó gây phản cảm về việc được yêu cầu xác định một vòi chữa cháy và vật lộn với nó.




Các bài kiểm tra này được gọi là CAPTCHA, một từ viết tắt của bài kiểm tra Turing công cộng hoàn toàn tự động để nói với Máy tính và Con người khác biệt, và chúng đã đạt đến loại cao nguyên không thể hiểu được trước đây. Vào đầu những năm 2000, những hình ảnh đơn giản của văn bản đã đủ để gây khó khăn cho hầu hết các spam bots. Nhưng một thập kỷ sau, sau khi Google mua lại chương trình từ các nhà nghiên cứu của Carnegie Mellon và đang sử dụng nó để số hóa Google Sách, các văn bản ngày càng phải bị cong vênh và che khuất để đi trước cải tiến các chương trình nhận dạng ký tự quang học – những chương trình mà nói một cách vòng vo, tất cả những người giải quyết CAPTCHA đã giúp cải thiện.

TẠI SAO CAPTCHA LẠI TRỞ NÊN KHÓ KHĂN NHƯ VẬY
TẠI SAO CAPTCHA LẠI TRỞ NÊN KHÓ KHĂN NHƯ VẬY

Bởi vì CAPTCHA là một công cụ thanh lịch để đào tạo AI, bất kỳ thử nghiệm nào đã cho chỉ có thể là tạm thời, điều mà các nhà phát minh ra nó đã thừa nhận ngay từ đầu. Với việc tất cả những nhà nghiên cứu, những kẻ lừa đảo và những con người bình thường giải quyết hàng tỷ câu đố chỉ ở ngưỡng những gì AI có thể làm, tại một số thời điểm máy móc sẽ vượt qua chúng ta. Vào năm 2014 , Google đã đọ sức với một trong những thuật toán máy học của mình chống lại con người trong việc giải các CAPTCHA văn bản bị bóp méo nhất: máy tính kiểm tra đúng 99,8% thời gian, trong khi con người chỉ đạt 33%

Sau đó, Google đã chuyển sang NoCaptcha ReCaptcha , công cụ này quan sát dữ liệu và hành vi của người dùng để cho phép một số người đi qua chỉ bằng một cú nhấp chuột vào nút “Tôi không phải là rô bốt” và giới thiệu cho những người khác nhãn hình ảnh mà chúng ta thấy ngày nay. Nhưng máy móc lại một lần nữa bắt kịp. Tất cả những mái hiên có thể có hoặc không có thể là mặt tiền cửa hàng? Chúng là trò chơi cuối cùng trong cuộc chạy đua vũ trang của nhân loại với máy móc.

Jason Polakis, một giáo sư khoa học máy tính tại Đại học Illinois tại Chicago, nhận xét cá nhân về sự gia tăng gần đây về độ khó CAPTCHA. Vào năm 2016, anh đã xuất bản một bài báo trong đó anh sử dụng các công cụ nhận dạng hình ảnh có sẵn, bao gồm tìm kiếm hình ảnh ngược của riêng Google, để giải các CAPTCHA hình ảnh của Google với độ chính xác 70%. Các nhà nghiên cứu khác đã phá vỡ các thách thức CAPTCHA âm thanh của Google bằng cách sử dụng các chương trình nhận dạng âm thanh của riêng Google.

Polakis cho biết máy học hiện cũng tốt như con người ở các tác vụ nhận dạng văn bản, hình ảnh và giọng nói cơ bản. Trên thực tế, các thuật toán có lẽ tốt hơn trong việc đó: “Chúng ta đang ở thời điểm mà việc làm cho phần mềm trở nên khó hơn cuối cùng lại khiến cho nhiều người trở nên quá khó. Chúng tôi cần một số phương án thay thế, nhưng vẫn chưa có một kế hoạch cụ thể ”.

Tài liệu về CAPTCHA tràn ngập những khởi đầu sai lầm và những nỗ lực kỳ lạ nhằm tìm kiếm thứ gì đó khác ngoài nhận dạng văn bản hoặc hình ảnh mà con người phổ biến và máy móc phải vật lộn. Các nhà nghiên cứu đã thử yêu cầu người dùng phân loại hình ảnh của mọi người theo nét mặt, giới tính và dân tộc. (Bạn có thể tưởng tượng mọi việc diễn ra tốt đẹp như thế nào.) Đã có đề xuất cho các CAPTCHA câu đố và CAPTCHA dựa trên các bài hát thiếu nhiphổ biến trong khu vực nơi người dùng cố ý lớn lên. Những CAPTCHA văn hóa như vậy không chỉ nhằm vào bot mà còn nhắm vào những người làm việc trong các trang trại CAPTCHA ở nước ngoài giải các câu đố cho từng phần nhỏ của xu. Mọi người đã thử tạo kiểu nhận dạng hình ảnh bằng cách yêu cầu người dùng nhận dạng, chẳng hạn như con lợn, nhưng tạo phim hoạt hình cho những con lợn và đeo kính râm cho chúng. Các nhà nghiên cứu đã xem xét yêu cầu người dùng xác định các vật thể trong các vết giống như Magic Eye . Trong một biến thể hấp dẫn, vào năm 2010, các nhà nghiên cứu đã đề xuất sử dụng CAPTCHA để lập chỉ mục các bức tranh khắc đá cổ , máy tính không giỏi trong việc giải mã các bản phác thảo cử chỉ của tuần lộc được vẽ nguệch ngoạc trên tường hang động.




Gần đây đã có những nỗ lực phát triển CAPTCHA giống như trò chơi , các bài kiểm tra yêu cầu người dùng xoay vật thể theo các góc nhất định hoặc di chuyển các mảnh ghép vào vị trí, với hướng dẫn không phải bằng văn bản mà bằng ký hiệu hoặc ngụ ý bởi bối cảnh của bảng trò chơi. Hy vọng rằng con người sẽ hiểu được logic của câu đố nhưng máy tính, thiếu các hướng dẫn rõ ràng, sẽ không thành công. Các nhà nghiên cứu khác đã cố gắng khai thác thực tế rằng con người có cơ thể, sử dụng máy ảnh thiết bị hoặc thực tế tăng cường để làm bằng chứng tương tác về loài người.

Vấn đề với nhiều bài kiểm tra này không nhất thiết là các bot quá thông minh – mà là con người đã thu hút chúng. Và không phải là con người bị câm; đó là con người rất đa dạng về ngôn ngữ, văn hóa và kinh nghiệm. Một khi bạn loại bỏ tất cả những thứ đó để thực hiện một bài kiểm tra mà bất kỳ con người nào cũng có thể vượt qua, mà không cần đào tạo trước hoặc suy nghĩ nhiều, bạn sẽ chỉ còn lại những công việc khó khăn như xử lý hình ảnh, chính xác là thứ mà một AI được thiết kế riêng sẽ giỏi .

Polakis nói: “Các bài kiểm tra bị giới hạn bởi khả năng của con người. “Đó không chỉ là khả năng thể chất của chúng tôi, bạn cần thứ gì đó [có thể] đa văn hóa, đa ngôn ngữ. Bạn cần một số loại thử thách phù hợp với ai đó từ Hy Lạp, ai đó từ Chicago, ai đó từ Nam Phi, Iran và Úc cùng một lúc. Và nó phải độc lập khỏi những phức tạp và khác biệt về văn hóa. Bạn cần một cái gì đó dễ dàng đối với một con người bình thường, nó không nên bị ràng buộc với một nhóm con cụ thể của những người và nó sẽ khó đối với máy tính cùng một lúc. Điều đó rất hạn chế trong những gì bạn thực sự có thể làm. Và nó phải là thứ mà con người có thể làm nhanh và không quá khó chịu. “

Tìm ra cách khắc phục những câu đố về hình ảnh mờ đó nhanh chóng đưa bạn vào lãnh địa triết học: phẩm chất chung của con người có thể được chứng minh cho một cỗ máy, nhưng không một cỗ máy nào có thể bắt chước được? Làm người là gì?

Nhưng có thể con người của chúng ta không được đo lường bằng cách chúng ta thực hiện một nhiệm vụ, mà ở cách chúng ta di chuyển qua thế giới – hoặc trong trường hợp này là thông qua internet. Shuman Ghosemajumder, người trước đây đã làm việc tại Google chống gian lận nhấp chuột trước khi trở thành giám đốc công nghệ của công ty phát hiện bot Shape Security, cho biết. Thay vì thử nghiệm, ông ủng hộ một thứ gọi là “xác thực liên tục”, về cơ bản là quan sát hành vi của người dùng và tìm kiếm các dấu hiệu tự động hóa. Ghosemajumder nói: “Một con người thực không có khả năng kiểm soát tốt các chức năng vận động của chính mình, và vì vậy họ không thể di chuyển chuột theo cùng một cách nhiều lần trong nhiều lần tương tác, ngay cả khi họ thực sự cố gắng. Mặc dù bot sẽ tương tác với một trang mà không cần di chuyển chuột,




Nhóm CAPTCHA của Google cũng đang suy nghĩ theo hướng tương tự. Phiên bản mới nhất, reCaptcha v3, được công bố vào cuối năm ngoái, sử dụng “phân tích rủi ro thích ứng” để chấm điểm lưu lượng truy cập theo mức độ đáng ngờ; Sau đó, chủ sở hữu trang web có thể chọn giới thiệu cho người dùng sơ sài một thử thách, như yêu cầu mật khẩu hoặc xác thực hai yếu tố. Theo Cy Khormaee, giám đốc sản phẩm của nhóm CAPTCHA, Google sẽ không cho biết yếu tố nào ảnh hưởng đến điểm số đó, ngoài việc Google quan sát một loạt “lưu lượng truy cập tốt” trên một trang web trông như thế nào và sử dụng điều đó để phát hiện “ giao thông tệ.” Các nhà nghiên cứu bảo mật cho biết nó có thể là sự kết hợp của cookie, thuộc tính trình duyệt, kiểu lưu lượng truy cập và các yếu tố khác. Một nhược điểm của mô hình phát hiện bot mới là nó có thể khiến việc điều hướng trên web trong khi giảm thiểu việc giám sát trở thành một trải nghiệm khó chịu, vì những thứ như VPN và tiện ích chống theo dõi có thể khiến bạn bị gắn cờ là đáng ngờ và bị thách thức.

Aaron Malenfant, trưởng nhóm kỹ thuật của nhóm CAPTCHA của Google, cho biết việc loại bỏ các bài kiểm tra Turing có nghĩa là để vượt qua đối thủ cạnh tranh mà con người tiếp tục thua cuộc. “Khi mọi người ngày càng đầu tư nhiều hơn vào học máy, những thách thức đó sẽ ngày càng khó khăn hơn đối với con người, và đó là lý do đặc biệt tại sao chúng tôi ra mắt CAPTCHA V3, để đi trước đường cong đó.” Malenfant nói rằng 5 đến 10 năm nữa, các thách thức CAPTCHA có thể sẽ không còn khả thi nữa. Thay vào đó, hầu hết các trang web sẽ có một bài kiểm tra Turing bí mật, liên tục chạy trong nền.

Trong cuốn sách The Most Human Human của mình , Brian Christian tham gia một cuộc thi Turing Test với tư cách là lá người và nhận thấy rằng thực sự khá khó khăn để chứng minh tính nhân văn của bạn trong cuộc trò chuyện. Mặt khác, các nhà sản xuất bot đã thấy dễ dàng vượt qua, không phải bằng cách nói chuyện hùng hồn hoặc thông minh nhất, mà bằng cách né tránh các câu hỏi bằng những câu đùa không có trình tự, mắc lỗi chính tả hoặc trong trường hợp bot đã thắng cuộc thi Turing vào năm 2014, tự xưng là một cậu bé 13 tuổi người Ukraine với vốn tiếng Anh kém. Rốt cuộc, lỗi là do con người. Có thể một tương lai tương tự đang sẵn sàng cho CAPTCHA, bài kiểm tra Turing được sử dụng rộng rãi nhất trên thế giới – một cuộc chạy đua vũ trang mới không tạo ra những con bot vượt trội hơn con người trong việc gắn nhãn hình ảnh và phân tích văn bản, nhưng những con mắc lỗi, bỏ sót nút, bị phân tâm và chuyển đổi các tab. “Tôi nghĩ rằng mọi người đang nhận ra rằng có một ứng dụng để mô phỏng người dùng bình thường … hoặc người câm,” Ghosemajumder nói.

Các bài kiểm tra CAPTCHA cũng có thể tồn tại trong thế giới này. Amazon đã nhận được bằng sáng chế vào năm 2017 cho một kế hoạch liên quan đến ảo ảnh quang học và các câu đố logic mà con người gặp rất nhiều khó khăn trong việc giải mã. Được gọi là Kiểm tra Turing thông qua thất bại, cách duy nhất để vượt qua là nhận được câu trả lời sai.

 



LEAVE A REPLY

Please enter your comment!
Please enter your name here