Bên trong thuật toán của TikTok - người dùng bị gây nghiện như thế nào?

Nếu không nhờ thuật toán AI đề xuất nội dung này, các video thời lượng ngắn với nội dung đầy kích thích của TikTok sẽ khó có thể phổ biến trên khắp thế giới như hiện nay.
09/12/2022 20:01
Nguyễn Hải

Nếu không nhờ thuật toán AI đề xuất nội dung này, các video thời lượng ngắn với nội dung đầy kích thích của TikTok sẽ khó có thể phổ biến trên khắp thế giới như hiện nay.

TikTok như một cơn bão gây nghiện đang quét qua toàn cầu. Cùng với hàng tỷ người dùng trẻ bị cuốn theo cơn bão này, những mạng xã hội khổng lồ trên toàn cầu cũng phải chạy theo cơn bão do những đoạn clip ngắn trên TikTok gây nên. Nhưng cho đến giờ, dường như vẫn chưa ai có thể lặp lại được cơn sốt gây nghiện mà TikTok tạo ra trong thời gian qua.

Đó là vì các công ty đối thủ mới chỉ sao chép TikTok ở việc tạo ra những đoạn video ngắn, còn làm thế nào để "gây nghiện" cho người dùng lại là câu chuyện hoàn toàn khác. Bí quyết nằm ở thuật toán đề xuất nội dung cho người dùng. Nhưng vào tháng 9 gần đây, trong một động thái làm nhiều người bất ngờ, Bytedance, công ty mẹ của TikTok đã công bố thiết kế cho hệ thống đề xuất nội dung được sử dụng trong ứng dụng nổi tiếng này.

Bên trong thuật toán của TikTok - người dùng bị gây nghiện như thế nào? - Ảnh 1.

Nguồn internet

Điều này nằm trong nỗ lực của Bytedance nhằm biến hệ thống đề xuất nội dung này thành một dịch vụ thuê bao đám mây dành cho các khách hàng doanh nghiệp. Nhờ đó, thế giới mới có cái nhìn rõ ràng hơn về cách thức TikTok gây nên "cơn nghiện" đối với người dùng khắp toàn cầu.

Monolith: Hệ thống AI đề xuất nội dung của TikTok

Trong khi thuật toán của Facebook dựa trên "social graph" – mạng lưới kết nối xã hội – của người dùng, hay mức độ tương tác của họ với những người khác để đưa ra các đề xuất nội dung tương tự để giữ chân người dùng, thuật toán đề xuất của TikTok tập trung vào tương tác giữa người dùng với chính nội dung đó, được đặt tên hệ thống Monolith.

Bên trong thuật toán của TikTok - người dùng bị gây nghiện như thế nào? - Ảnh 2.

Kiến trúc huấn luyện trực tuyến của Monolith với 2 giai đoạn: huấn luyện sơ bộ và huấn luyện trực tuyến. Nguồn: ByteDance.

Về tổng thể, kiến trúc của Monolith tuân theo thiết lập phân tán của TensorFlow – một thư viện phần mềm mã nguồn mở của Google dành cho máy học và trí tuệ nhân tạo, vốn được tạo ra để dành cho việc huấn luyện học sâu các mạng lưới thần kinh nhân tạo.

Đối với Monolith, quá trình huấn luyện được chia thành 2 giai đoạn: huấn luyện sơ bộ (Batch Training) với việc nạp các dữ liệu đầu vào cho hệ thống cùng các tham số cơ bản. Các dữ liệu này được lấy từ những thông tin như thiết lập ngôn ngữ, quốc gia hay loại thiết bị.

Nhưng một phần quan trọng khác là các lựa chọn ban đầu của người dùng đối với chủ đề video mà họ quan tâm. Từ các chủ đề này, TikTok đề xuất ra một loạt các nội dung tương ứng với cấp độ ngang hàng nhau – từ của người dùng mới đăng tải cho đến nội dung của những người có ảnh hưởng.

Tiếp đó hệ thống phân tích phản hồi của người dùng đối với nội dung được đề xuất và đánh giá chất lượng của nội dung đó dựa trên các tham số bao gồm: số lượng like, lượt xem, thời gian xem, số bình luận, lượt repost, lượt share, mức độ gia tăng người theo dõi, … Các nội dung thuộc top 10% điểm số cao nhất sẽ được ưu tiên hiển thị.

Nhưng không dừng lại ở đó, hệ thống Monolith còn trải qua quá trình huấn luyện trực tuyến với các dữ liệu liên tục được nạp vào theo thời gian thực. Sau khi một mô hình được xây dựng dựa trên các dữ liệu đưa vào từ giai đoạn huấn luyện sơ bộ, nó tiếp tục được cập nhật dựa trên các dữ liệu đưa vào theo thời gian thực. Các tham số về phản hồi của người dùng cũng được cập nhật và đồng bộ theo thời gian thực để hệ thống đưa ra các tác động gần như ngay lập tức đến người dùng.

Bên trong thuật toán của TikTok - người dùng bị gây nghiện như thế nào? - Ảnh 3.

Vòng lặp thông tin phản hồi của hệ thống huấn luyện Monolith: Ở giai đoạn huấn luyện sơ bộ [Người dùng - Máy chủ mô hình - máy chủ huấn luyện - máy chủ mô hình - người dùng], thời gian vòng lặp kết thúc kéo dài hơn trong khi giai đoạn huấn luyện trực tuyến, vòng lặp gần như kết thúc ngay lập tức. Nguồn ByteDance

Để đánh đổi khả năng huấn luyện liên tục với tốc độ cao, hệ thống Monolith được TikTok thiết kế với việc chấp nhận tỷ lệ lỗi cao hơn (fault Tolerance) – hay nói cách khác, công ty chấp nhận giảm độ chính xác trong mô hình của mình để các tham số được đồng bộ liên tục nhanh hơn, với băng thông mạng lớn hơn và đưa ra kết quả theo thời gian thực đáng tin cậy hơn.

Tương tự thuật toán đề xuất của Facebook, tương tác của người dùng đối với nội dung được đánh giá thông qua các hành vi khi like, share hoặc bình luận dưới đoạn video. Nhưng yếu tố then chốt trong thuật toán của TikTok là thời gian người dùng xem video. Điều này được thể hiện trong chính tài liệu do TikTok công bố:

"Các ID chỉ dành một ít thời gian (với đoạn video được đề xuất) sẽ có ít đóng góp cho việc cải thiện chất lượng mô hình," ngoài ra các ID "có thời hạn sử dụng từ lâu hiếm khi đóng góp vào mô hình hiện tại khi phần nhiều trong số chúng không bao giờ được truy cập. Điều này có thể là vì người dùng đã không còn hoạt động hoặc đoạn video ngắn đã lỗi thời."

Trong khi các hành vi người dùng như like, chia sẻ, bình luận không phải lúc nào cũng xuất hiện trong mỗi đoạn video được đề xuất, do vậy thời gian xem đoạn video vẫn được TikTok xem là yếu tố then chốt để đánh giá mức độ ưa thích của người dùng đối với đoạn video đó.

Bên trong thuật toán của TikTok - người dùng bị gây nghiện như thế nào? - Ảnh 4.

Ảnh Internet

Hệ lụy của thiết kế gây nghiện cho người dùng

Trên thực tế, mọi nền tảng mạng xã hội đều được thiết kế để giữ chân người dùng ở lại càng lâu càng tốt. Nhưng có thể thấy thuật toán đề xuất của TikTok được thiết kế để tập trung vào phản hồi của người dùng đối với nội dung được hiển thị - thay vì dựa vào mối quan hệ tương tác giữa người dùng với nhau như cách làm của Facebook.

Điều này kéo theo một hệ lụy khác trong hệ thống đề xuất nội dung của TikTok đối với người dùng: đó là duy trì tương tác của người dùng bằng cách "gây nghiện" cho họ. Còn cách nào tốt hơn để kéo dài thời gian xem video và tương tác của người dùng bằng cách đề xuất các nội dung gây kích thích hợp chất dopamin trong não bộ - một hợp chất được giải phóng mỗi khi bạn nhận được điều gì đó gây thích thú.

Trên thực tế, thiết kế giữ chân người dùng của TikTok cũng tương tự như YouTube. Nhưng khác biệt nằm trong thiết kế giao diện của 2 ứng dụng này. Trong khi YouTube ban đầu dành cho người dùng máy tính sau đó mới được thiết kế cho smartphone, do đó các video có thời lượng dài với giao diện mặc định chỉ chiếm một phần màn hình còn lại là không gian cho các đề xuất video khác.

Bên trong thuật toán của TikTok - người dùng bị gây nghiện như thế nào? - Ảnh 5.

Ảnh Internet

Còn với TikTok, các video có thời lượng rất ngắn, giao diện mặc định chiếm trọn vẹn màn hình điện thoại, thu hút toàn bộ sự chú ý của người dùng. Với các nội dung liên tục kích thích sự chú ý trong thời gian ngắn, một chuỗi liên tục các video như vậy có thể hút cạn sự tập trung của người dùng, gần như thực sự "gây nghiện" khi khiến họ không thể rời mắt khỏi màn hình điện thoại.

Chạy theo việc gây nghiện cho người dùng càng nhiều càng tốt sẽ không chỉ tạo ra các video với hình ảnh, âm thanh ngày càng cuốn hút, mà cũng kéo theo nhiều nội dung "rác" hoặc gây tranh cãi mạnh mẽ trong cộng đồng. Khi lôi kéo được nhiều tương tác, hệ thống đề xuất của TikTok sẽ nhanh chóng đưa nó lên hàng đầu trong số các nội dung được ưu tiên hiển thị và lan truyền rộng rãi tới người dùng khác – bất kể họ là ai hay mối quan tâm là gì.

Cho dù TikTok thường xuyên phải xóa một số lượng lớn video do vi phạm "Tiêu chuẩn cộng đồng" của mình. Riêng quý 2/2022, TikTok cho biết đã xóa 113 triệu video vi phạm. Đây là một mức gia tăng khổng lồ khi trong 6 tháng cuối năm 2019, số lượng video xóa khỏi nền tảng này chỉ ở con số 49 triệu. Số lượng video bị xóa cho thấy, tốc độ tăng trưởng khủng khiếp của các nội dung rác trên nền tảng này lớn đến mức nào. Hơn thế nữa, con số này còn chưa bao gồm vô số nội dung rác khác chưa bị phát hiện và xóa bỏ trước khi phát tán rộng rãi trên nền tảng này.

Tin cùng chuyên mục

Tỷ phú Phạm Nhật Vượng dừng hoàn toàn dịch vụ taxi bằng xe Vinfast VF 8

Tỷ phú Phạm Nhật Vượng dừng hoàn toàn dịch vụ taxi bằng xe Vinfast VF 8

Nhà sáng lập GSM - tỷ phú Phạm Nhật Vượng công bố dừng hoàn toàn dịch vụ taxi Xanh SM Luxury bằng xe VinFast VF 8.

Ford Việt Nam ghi nhận doanh số kỷ lục, nâng cao trải nghiệm khách hàng

Ford Việt Nam ghi nhận doanh số kỷ lục, nâng cao trải nghiệm khách hàng

Tháng 11 vừa qua là tháng bán lẻ kỉ lục của Ford Việt Nam với tổng cộng 5.593 xe, phá kỉ lục của tháng 10 và của tất cả các tháng trong lịch sử bán hàng của thương hiệu xe Mỹ tại Việt Nam.

Khách hàng nhận thêm ưu đãi với Crossover của Năm

Khách hàng nhận thêm ưu đãi với Crossover của Năm

Ngay sau khi bất ngờ qua mặt cả Corolla Cross để giành giải Ô tô của năm 2024 phân khúc Crossover B+/C-, tân binh Subaru Crosstrek tung ngay gói ưu đãi bảo dưỡng xe miễn phí 1 năm (hoặc 20.000 km) cho các khách hàng mới trong năm 2024.

GAC "lôi kéo" khách với gói hậu mãi 7 năm miễn phí

GAC "lôi kéo" khách với gói hậu mãi 7 năm miễn phí

GAC Việt Nam và nhà phân phối Tan Chong vừa đưa ra gói ưu đãi hậu mãi kỷ lục trên thị trường: 7 năm (hoặc 150.000 km) miễn phí cho khách hàng với 3 loại dịch vụ gồm bảo hành, cứu hộ 24/7 và nhân công bảo dưỡng.

Camry thế hệ mới chốt giá dẫn đầu phân khúc sedan cỡ D

Camry thế hệ mới chốt giá dẫn đầu phân khúc sedan cỡ D

Sau gần 2 tháng ra mắt tại Triển lãm ô tô Việt Nam, Camry thế hệ mới bắt đầu được bán ra thị trường từ tuần này với mức giá 1 tỷ 220 triệu đồng cho bản máy xăng và từ 1 tỷ 460 triệu đến 1 tỷ 542 triệu đồng cho các bản hybrid.

Triển vọng nào cho "Ô tô triển vọng của năm 2024"?

Triển vọng nào cho "Ô tô triển vọng của năm 2024"?

Danh hiệu Ô tô triển vọng của năm 2024 giải Car Awards mà Lynk & Co 06 giành được liệu có mang lại triển vọng doanh số cho mẫu xe CUV đô thị này trong năm 2025?

Maserati GranTurismo -– "Tay chơi" Italy trên đường Việt Nam

Maserati GranTurismo -– "Tay chơi" Italy trên đường Việt Nam

Thiết kế giao thoa giữa nghệ thuật điêu khắc Italy với hiệu suất cao của khối động cơ, giữa phong cách thể thao và sự sang trọng, chiếc Maserati GranTurismo Modena màu trắng ngọc thế hệ mới đầu tiên vừa có mặt tại TP.HCM với giá từ hơn 9 tỷ đồng.

V-Green hợp tác Fast+ triển khai 5.000 trụ sạc đến hết năm 2025

V-Green hợp tác Fast+ triển khai 5.000 trụ sạc đến hết năm 2025

Công ty Cổ phần Phát triển Trạm sạc Toàn cầu V-GREEN và Công ty Cổ phần Trạm sạc Fast+ đã ký kết thoả thuận hợp tác nhượng quyền để lắp đặt 5.000 trụ sạc các loại dành riêng cho xe điện VinFast, công suất từ 7,4 KW đến 120 KW trên toàn quốc, từ nay đến hết năm 2025.

Tin mới nhất

Chuyến tàu The first luxury train in Vietnam - Sjourney

Chuyến tàu The first luxury train in Vietnam - Sjourney

Chuyến tàu The first luxury train in Vietnam - Sjourney, chính thức đón đoàn khách nước ngoài đầu tiên vào lúc 16:30 ngày 18/12/2024 tại ga Sài Gòn.

Đà Nẵng đón Giáng sinh – Chào năm mới 2025 với nhiều chương trình du lịch độc đáo

Đà Nẵng đón Giáng sinh – Chào năm mới 2025 với nhiều chương trình du lịch độc đáo

Chào mừng lễ Giáng sinh và năm mới 2025, các đơn vị du lịch, lưu trú, điểm công cộng trên địa bàn thành phố Đà Nẵng đang có nhiều hoạt động, chương trình độc đáo, hấp dẫn thu hút khách du lịch.

Du lịch Huế “cất cánh” bằng thế mạnh di sản văn hóa

Du lịch Huế “cất cánh” bằng thế mạnh di sản văn hóa

Năm 2025 là dấu mốc quan trọng đánh dấu bước ngoặt Thừa Thiên - Huế trở thành thành phố trực thuộc Trung ương, đem đến nhiều vận hội mới cho địa phương.

Thái Nguyên lần đầu tổ chức Liên hoan ẩm thực các món ăn chế biến từ cây chè

Thái Nguyên lần đầu tổ chức Liên hoan ẩm thực các món ăn chế biến từ cây chè

Ngày 16/12/2024, tại thành phố Thái Nguyên, Sở Văn hóa, Thể thao và Du lịch tỉnh Thái Nguyên phối hợp với Hiệp hội Du lịch tỉnh tổ chức Liên hoan Ẩm thực mang chủ đề “Trải nghiệm xứ trà, đậm đà bản sắc”.

Ninh Thuận tăng cường bảo vệ và phát huy giá trị đồi cát Nam Cương

Ninh Thuận tăng cường bảo vệ và phát huy giá trị đồi cát Nam Cương

Đồi cát Nam Cương (xã An Hải, huyện Ninh Phước) nằm cách trung tâm thành phố Phan Rang – Tháp Chàm khoảng 7 km về hướng Đông Nam được ví như "tiểu sa mạc Sahara" với cảnh quan và địa hình độc đáo.

Quảng Bình phát triển du lịch nông thôn, du lịch cộng đồng

Quảng Bình phát triển du lịch nông thôn, du lịch cộng đồng

Tỉnh Quảng Bình có nhiều danh lam thắng cảnh kỳ thú, hấp dẫn du khách trong nước và quốc tế.

Phở và nem “chinh phục” thực khách Italy

Phở và nem “chinh phục” thực khách Italy

Ngày 12/12/2024, Đại sứ quán Việt Nam tại Italy đã phối hợp với Vietnam Airline tổ chức sự kiện “Phở và Nem: Đường đến với ẩm thực Việt Nam - Bay thẳng Việt Nam - Italy từ tháng 7/2025” nhằm quảng bá văn hóa ẩm thực và thúc đẩy du lịch Việt Nam.

Độc đáo khu phố bao cấp của Hà Nội được tái hiện trong "Đêm Trúc Bạch"

Độc đáo khu phố bao cấp của Hà Nội được tái hiện trong "Đêm Trúc Bạch"

Lần đầu tiên tại Hà Nội, một không gian với bối cảnh là một khu phố cổ Hà Nội với các toa tàu điện, các cửa hàng bách hóa… gợi nhớ cho người dân Thủ đô và du khách về ký ức của "thời bao cấp", một trong những thời kỳ đặc biệt của đất nước.

Đêm Trúc Bạch: Điểm đến của một Hà Nội quyến rũ, sâu lắng và đậm chất thơ

Đêm Trúc Bạch: Điểm đến của một Hà Nội quyến rũ, sâu lắng và đậm chất thơ

Đêm Hà Nội với sự lung linh của ánh đèn và hơi thở lịch sử qua từng góc phố, là một mô hình độc đáo, giúp du khách khám phá một Hà Nội rất khác - một Hà Nội quyến rũ, đậm chất thơ và sâu lắng.

Bí ẩn những địa điểm được cho là cánh cổng dẫn tới thế giới khác đến nay vẫn chưa có lời giải

Bí ẩn những địa điểm được cho là cánh cổng dẫn tới thế giới khác đến nay vẫn chưa có lời giải

Những nơi này đều có nhiều truyền thuyết bí ẩn xoay quanh và được cho là có thể dẫn lối cho người trần sang thế giới bên kia.