Bằng cách sử dụng thuật toán phân tích từ khóa, các nhà nghiên cứu của trường đại học Cornell University (Mỹ) đã xây dựng một phần mềm có thể phân biệt đâu là các bài đánh giá (review) thật về sản phẩm, dịch vụ, còn đâu là các bài review giả mạo, quảng cáo... với độ chính xác lên đến 90%. Giúp cho những người dùng thông minh như chúng ta không phải đọc trúng những bài review vô bổ khi tìm kiếm thông tin trên Internet.
Vì trên thực tế, đôi khi rất khó để chúng ta phân biệt giữa các bài reivew thật và giả. Để thử nghiệm, nhóm nghiên cứu chọn ra 400 bài review thật và 400 bài review "xạo" nói về 20 khách sạn ở Chicago, Mỹ. Sau đó đem 800 bài review này cho một hội đồng gồm 3 người đọc thử. Kết quả là họ không tài nào phân biệt được thật giả ngoài cách... đoán mò.
Theo như giải thích của Myle Ott, một nhà nghiên cứu về khoa học máy tính của trường đại học trên cho biết thì con người luôn bị ảnh hưởng bởi một khuynh hướng gọi là "khuynh hướng sự thật". Nghĩa là chúng ta luôn tin tưởng vào những gì đọc được, trừ khi có một bằng chứng nào đó nói lên cái chúng ta đọc là sai thì khi đó, ta mới sửa chữa lại nhận thức của mình. Đó là lý do tại sao nhiều người không phân biệt được những bài viết đúng với những bài viết sai sự thật.
Ảnh: Gizmodo
Sau khi thử nghiệm bằng sức người, nhóm nghiên cứu tiếp tục thử nghiệm bằng "sức máy". Họ sử dụng một máy tính để kiểm tra 800 bài review trên, nhằm mục đích tìm hiểu xem các bài review thật và giả khác nhau ở chỗ nào. Kết quả cho thấy, các bài review giả rất hay sử dụng các từ ngữ ngữ cảnh rất chung chung. Ví dụ như đề tài đánh giá khách sạn thì họ hay dùng những từ khái quát như "kỳ nghỉ lễ", "công ty này", "doanh nghiệp nọ"... trong khi đó các bài review chân chính thì có cách viết chi tiết và cụ thể hơn, đánh giá sâu vào từng tiểu tiết nhỏ, ví dụ như "phòng tắm", "giá cả", "phục vụ"... Ngoài ra, bài review giả còn dùng rất nhiều động từ, còn bài review thật thì dùng danh từ nhiều hơn.
Thông qua kết quả có được từ máy tính đó, nhóm nghiên cứu đã tạo ra một thuật toán dùng để phân biệt các bài review thật, giả theo phương pháp phân tích từ khóa và câu chữ, với độ chính xác đạt đến 89,8%. Tuy nhiên, phần mềm thuật toán này chỉ mới có khả năng đánh giá các bài review về khách sạn, mà cụ thể là các khách sạn ở Chicago. Nhóm nghiên cứu hy vọng trong tương lai các thuật toán tương tự về các chủ đề khác sẽ sớm được xây dựng để phục vụ người dùng.
Theo Gizmag