Ứng dụng công nghệ trong phát hiện đề tài, thu thập và xử lý thông tin
Một số CQBC trên thế giới đã sử dụng công nghệ trí tuệ nhân tạo (AI) để theo dõi sự kiện, trích xuất thông tin và xác định xu hướng. Cụ thể, các thuật toán học máy (ML) có thể hỗ trợ các nhà báo trong việc sàng lọc, khám phá nội dung từ các nguồn thông tin khác nhau; công cụ xử lý ngôn ngữ tự nhiên (NLP) giúp phân tích thái độ, cảm xúc của người dùng, các công nghệ nhận dạng hình ảnh giúp phân tích giới tính, tuổi, trạng thái của nhân vật,...
Juicer của BBC là một API tổng hợp tin tức và trích xuất nội dung. Công cụ này theo dõi các kênh thông tin RSS của 850 hãng tin tức toàn cầu, tổng hợp và trích xuất các bài báo từ BBC và các nguồn bên ngoài5. Sau đó nó tự động phân tích, gán thẻ tag cho các bài viết rồi phân chia theo 04 danh mục: tổ chức, địa điểm, con người và sự vật. Do đó, nếu một nhà báo đang tìm kiếm những câu chuyện mới nhất về một nhân vật nổi tiếng hoặc những bài báo liên quan đến các công ty hoạt động trong một lĩnh vực nào đó, Juicer sẽ nhanh chóng tìm kiếm trên web và cung cấp một danh sách các nội dung liên quan.
Các công nghệ phát hiện, nhận dạng hình ảnh cũng được sử dụng ở khâu này. Chẳng hạn, tờ NewYork Times đã sử dụng Rekognition API của Amazon để nhận dạng các nghị sĩ quốc hội trong các bức ảnh. Các bức ảnh được phóng viên chụp gửi về sẽ được gửi trả lại phiên bản mới có chú thích tên thành viên quốc hội cùng với mức độ tự tin (confidence) của kết quả nhận dạng.
Ứng dụng công nghệ trong sáng tạo tác phẩm báo chí
Nhằm gia tăng tốc độ sản xuất tin bài, các tòa soạn báo đã ứng dụng công nghệ AI để tự động viết các tin mang tính thường xuyên, lặp lại, để các nhà báo có thể tập trung vào các bài viết chuyên sâu hơn. Chẳng hạn, phần mềm Heliograf (The Washington Post) đưa tin về các sự kiện thể thao và hoạt động tranh cử; RADAR (Press Association, 2017) có khả năng thu thập dữ liệu và tự động viết 30.000 bài báo địa phương/tháng; SALCO (BBC) viết 689 tin/ đêm về cuộc bầu cử năm 2019;...
Nghiên cứu RADAR cho thấy, hệ thống này dựa trên công cụ phần mềm NLG và đầu vào được cấp phát từ dữ liệu mở như London Datastore. Các nhà báo sẽ viết các mẫu văn bản, các mẫu này sau đó được mã hóa và tự động điều chỉnh thông tin của văn bản theo các vị trí địa lý được xác định trong dữ liệu.
Bên cạnh đó, ứng dụng chuyển văn bản thành giọng nói (Text to Speech) của công nghệ AI cũng đang là xu hướng của các tòa soạn khi cho phép tự động chuyển các tin bài dưới dạng văn bản thành tập tin âm thanh để đọc bài đó lên giống như báo nói. Giải pháp này rất hữu ích cho các đối tượng công chúng là người già, người khiếm thị, người lái xe hoặc những người không có nhiều thời gian để đọc báo.
Nhằm tăng tính hấp dẫn của tin bài, một số CQBC trên thế giới đã ứng dụng các công nghệ thực tế ảo (VR) và thực tế tăng cường (AR). Các công nghệ này, với khả năng mô phỏng thông tin thông qua không gian 3 chiều, giúp thông tin sinh động, dễ hiểu hơn và tăng cường trải nghiệm cho công chúng. Các công nghệ này chủ yếu được các CQBC lớn như BBC, CNN, New York Time, TIME, Frontline,... sử dụng để đưa tin về các sự kiện thời sự, chính trị, các vấn đề mang tính toàn cầu hay các bài báo về khoa học, du lịch, khám phá,... Tuy nhiên, đến nay hai công nghệ này vẫn chưa thực sự phổ biến trong báo chí do việc phát triển phần mềm khá phức tạp, tốn nhiều thời gian và đòi hỏi cao về chất lượng đường truyền Internet.
Ứng dụng công nghệ trong biên tập và kiểm duyệt nội dung
Để xác thực nguồn gốc và kiểm chứng thông tin, AI và Blockchain (chuỗi khối) là hai công nghệ đang được ứng dụng, thử nghiệm tại các tòa soạn.
Một số công cụ kiểm chứng nổi tiếng trên thế giới như Full Fact (UK), Chequeabot (Argentina), PolitiFact (Hoa Kỳ),... đã dựa trên các công cụ xử lý ngôn ngữ tự nhiên và học máy để xác định các phát ngôn trong truyền thông và khớp chúng với cơ sở dữ liệu của các fact-check hiện có để kiểm tra tính chính xác của thông tin. Chẳng hạn, Chequeabot sử dụng các công cụ lập trình như Freeling (trường Đại học Polytechnic của Catalonia), Nltk và Gensim để trích xuất văn bản, phân tích câu và dự đoán dựa trên học máy. Từ tháng 1/2019, Chequeado bắt đầu chia sẻ code của Chequeabot trên GitHub6. Do đó, mọi người đều có thể sử dụng công nghệ này trong tòa soạn của họ.
Công nghệ Blockchain cũng đang được một số hãng tin như New York Times, Forbes, AP thử nghiệm để xác thực nội dung7. Công nghệ này giúp lưu trữ dữ liệu dạng metadata bao gồm thời gian và địa điểm chụp ảnh, quay video, đăng bài, người thực hiện hành động, phương thức thực hiện cũng như thời điểm thông tin được chỉnh sửa và xuất bản,... Qua đó minh bạch thông tin về quyền tác giả, sự công nhận, từ đó tăng sự tin tưởng của độc giả và thúc đẩy năng lực của các nhà báo chân chính.
Ứng dụng công nghệ trong phân phối nội dung và đánh giá phản hồi
Để đến gần hơn với độc giả, các tòa soạn sử dụng các công cụ chatbot và cá nhân hóa thông tin.
Với các thông tin phản hồi từ công chúng, các CQBC sử dụng học máy để kiểm soát các bình luận dựa trên các thuật ngữ chính để phân biệt bình luận là tốt hay xấu, sau đó gửi cảnh báo đến người điều hành. AI có khả năng theo dõi và phân tích thái độ, hành vi của người dùng thông qua các “dấu vết” mà người dùng để lại các trang MXH như các dòng trạng thái, các bình luận, đánh giá, chia sẻ,... Tính năng này giúp các tòa soạn hiểu hơn công chúng của mình và suy nghĩ, nhận xét của họ về nội dung bài viết, qua đó có những hành động để nâng cao chất lượng sản xuất tin bài.
Ví dụ, phần bình luận của Thời báo New York thường được kiểm duyệt bởi một nhóm 14 người chịu trách nhiệm xem xét thủ công hơn 11 nghìn bình luận mỗi ngày9. Tòa soạn này đã thử nghiệm giải pháp AI để có thể chuyển đổi việc kiểm tài chính. Nguồn nhân lực, như đã phân tích ở trên, hiện các CQBC đang thiếu chuyên gia công nghệ.
Chatbot của The Guardian (Anh) cho phép người dùng chọn phiên bản US, UK và Úc của Guardian News, chọn khoảng thời gian, nó sẽ lựa chọn và gửi các bài phóng sự hàng ngày thông qua Facebook Messenger. Nếu người dùng chỉ muốn nắm bắt, theo dõi các tiêu đề và tin tức thể thao, hay đọc các tin tức khoa học và xu hướng công nghệ, họ có thể bổ sung thông tin đó vào, khi đó giao diện chatbot sẽ trả lời tin nhắn với nội dung liên quan đến truy vấn của người dùng.
Bên cạnh đó, AI cũng cho phép xây dựng các hệ thống khuyến nghị trong báo chí. Các hệ thống khuyến nghị thúc đẩy quá trình marketing và cá nhân hóa để đưa các bài viết đến gần với công chúng mục tiêu. Hệ thống cá nhân hóa sử dụng dữ liệu thời gian thực để khuyến nghị bài viết tới người dùng dựa trên các yếu tố khác nhau. Các ứng dụng tin tức của Trung Quốc như Jinri Toutiao, Qutoutiao và Kuaibao được sử dụng rộng rãi để cung cấp tin tức cá nhân hóa từ nhiều nhà cung cấp tin tức khác nhau.
* Bài viết được trích từ bài nghiên cứu "Vai trò của công nghệ đối với báo chí - truyền thông trong kỷ nguyên chuyển đổi số" của tác giả Ths. Bùi Thị Vân Anh và Ths. Hà Đình Dũng (Viện công nghệ Thông tin và Truyền thông CDIT) đăng trên Tạp chí Thông tin & Truyền thông Tháng 1/2021.