Chiếc áo ngực bị thuật toán của Microsoft gán nhãn gợi dục. Ảnh: The Guardian. |
Ashley James, người dẫn chương trình kiêm DJ với 334.000 người theo dõi trên mạng xã hội, rất bất ngờ khi các clip quay bụng bầu của cô bị cấm chiếu trên Reels, tính năng chia sẻ video ngắn của Instagram.
James, người có hai con, nói rằng các video khác của cô buộc phải che bụng bầu và đã có tới 183.000 lượt xem.
"Tôi thấy thật ghê tởm khi AI đang nói với chúng ta rằng cơ thể phụ nữ chẳng khác gì những đối tượng tình dục. Khi mang thai lần đầu tiên, tôi thực sự đã nghĩ rằng mình sẽ thoát khỏi tình trạng siêu tính dục hóa và vật hóa cơ thể", James bày tỏ.
Bà mẹ hai con là người ủng hộ mạnh mẽ việc phô bày cơ thể thực sự của phụ nữ, bao gồm cả sự thay đổi hình dáng khi mang thai, những vết sẹo lúc sinh em bé.
Các clip quay cảnh bụng bầu của Ashley James bị buộc phải làm mờ khi đăng lên trang cá nhân. Ảnh: ashleylouisejames. |
"Tôi muốn mọi người thấy rằng đây không phải là khuyết điểm, mà là những bộ phận cơ thể rất bình thường và chúng ta không cần phải che giấu. Tôi nghĩ nó giúp chống lại các tiêu chuẩn sắc đẹp phi thực tế, photoshop và văn hóa ăn kiêng".
Không chỉ bị chặn các bài đăng, James còn bị quấy rối khi chia sẻ hình ảnh mang thai. "Tính dục hóa cơ thể, bộ ngực, bụng bầu của nữ giới đã ăn sâu vào xã hội, đến mức khi phụ nữ làm một việc thuần túy như cho em bé bú, họ cũng bị tính dục hóa. Tôi nhận được rất nhiều tin nhắn nói rằng mình đang cố thu hút sự chú ý của đàn ông khi đăng tải hình ảnh như vậy".
Vấn đề của cả hệ thống
Các công cụ AI ban đầu được phát triển để bảo vệ người dùng Internet không nhìn thấy nội dung có tính chất bạo lực hoặc khiêu dâm. Tuy nhiên, theo một báo cáo mới từ The Guardian, công cụ cũng "đánh giá ảnh của phụ nữ khêu gợi tình dục hơn ảnh của nam giới, đặc biệt nếu có liên quan đến núm vú, bụng bầu hoặc tập thể dục".
Thuật toán của Google đã đánh giá hình ảnh mẹ bầu là "rất có khả năng chứa nội dung không phù hợp". Còn thuật toán của Microsoft tự tin đến 90% rằng hình ảnh này "có bản chất khêu gợi tình dục".
"Kết quả là các công ty truyền thông xã hội tận dụng các thuật toán này hoặc các thuật toán tương tự đã ngăn chặn phạm vi tiếp cận của vô số hình ảnh có cơ thể phụ nữ", báo cáo cho biết thêm, đồng thời gợi ý rằng "sự thiên vị giới tính có sẵn" có thể là nguyên nhân.
Hình ảnh phụ nữ mang thai, tập thể dục thường bị gán nhãn gợi dục. Ảnh: chelsea_/Glamour. |
Leon Derczynski, giáo sư khoa học máy tính tại Đại học CNTT Copenhagen, chuyên về tác hại trực tuyến, cho biết: "Điều này thật hoang đường. Việc tính dục hóa phụ nữ dường như đã ăn sâu vào cả hệ thống".
Báo cáo nói rõ rằng làn da trần không phải là vấn đề. Khi một nhà báo nam của The Guardian tạo dáng trong chiếc quần jeans và để ngực trần, thuật toán của Microsoft chỉ đánh giá khả năng gợi dục (racy score) dưới mức 22%.
Tuy nhiên, khi người này mặc một chiếc áo ngực màu đen trơn, tỷ lệ này đã tăng vọt lên 97%, giữ nguyên chiếc áo ngực khiến mức cảnh báo đạt 99%.
Ai đang gán nhãn dữ liệu?
AI hiện đại được xây dựng bằng cách sử dụng học máy (machine learning), một bộ thuật toán cho phép máy tính học hỏi từ dữ liệu.
Khi sử dụng học máy, các nhà phát triển không viết những quy tắc rõ ràng cho máy tính biết cách thực hiện một tác vụ. Thay vào đó, họ cung cấp cho máy tính dữ liệu huấn luyện.
Việc gán nhãn hình ảnh cũng tương tự như vậy. Máy tính học hỏi từ hình ảnh có sẵn, học cách phân tích điểm số và tìm ra bất kỳ mẫu nào giúp chúng tái tạo các quyết định của con người.
Margaret Mitchell, nhà khoa học chính về đạo đức tại công ty AI Hugging Face và là cựu đồng trưởng nhóm nghiên cứu AI về đạo đức của Google, tin rằng những bức ảnh được sử dụng để huấn luyện các thuật toán này có thể được gán nhãn bởi những người đàn ông dị tính, những người có thể coi hình ảnh một phụ nữ tập thể dục là không phù hợp.
Hình ảnh da thịt của đàn ông và phụ nữ bị thuật toán đánh giá theo tiêu chí khác nhau. Ảnh: The Guardian. |
Lý tưởng nhất là các công ty công nghệ nên tiến hành phân tích kỹ lưỡng xem ai đang dán nhãn dữ liệu của họ, để đảm bảo rằng tập dữ liệu cuối cùng chứa đựng quan điểm đa dạng. Các công ty cũng nên kiểm tra xem các thuật toán của họ có hoạt động tương tự trên hình ảnh nam, nữ và các nhóm khác hay không.
"Nhưng điều này không phải lúc nào cũng được thực hiện. Không có tiêu chuẩn về chất lượng ở đây", Mitchell nói.
Xu hướng mà The Guardian phát hiện chỉ là một phần của hơn thập kỷ tranh cãi xung quanh việc kiểm duyệt nội dung trên mạng xã hội.
Các tiêu chuẩn khác nhau, cho phép ảnh chụp núm vú nam được phép đăng trên Instagram, nhưng vòng một của nữ phải được che lại, từ lâu đã thu hút sự phản đối kịch liệt về hoạt động kiểm duyệt nội dung trên nền tảng truyền thông xã hội.
Nhiều người trẻ xứ châu Á, đặc biệt là Hàn Quốc, Nhật Bản, thường kết thúc một ngày với webtoon (truyện tranh số). Thế giới ảo này giúp họ tạm quên đi mệt mỏi mà không tốn thời gian hay tiền bạc. Sự phổ biến ngày càng lớn của webcomic, hay còn gọi webtoon (truyện tranh số), đã có tác động tích cực đáng ngạc nhiên đến ngành xuất bản.