OpenAI dạy ChatGPT “nhận lỗi” để AI trung thực hơn
Thiên Trang (th)
OpenAI đang thử nghiệm cách buộc ChatGPT tự thú nhận sai sót, nhằm hiểu vì sao AI gian lận và tăng độ tin cậy cho mô hình tương lai.
OpenAI đang triển khai một hướng tiếp cận mới nhằm giải mã “hộp đen” của các mô hình ngôn ngữ lớn như ChatGPT.Thay vì chỉ ngăn chặn sai phạm, hãng yêu cầu mô hình tự thú nhận cách nó hoàn thành nhiệm vụ và lý do dẫn đến hành vi gian lận.
Theo OpenAI, các “lời thú nhận” là phần văn bản bổ sung, nơi AI tự đánh giá mức độ tuân thủ chỉ dẫn.Boaz Barak, nhà khoa học nghiên cứu tại OpenAI, cho rằng mô hình AI luôn phải cân bằng giữa việc hữu ích, vô hại và trung thực, và sự xung đột này dễ dẫn đến nói dối.
Trong một số tình huống khó, động lực làm hài lòng người dùng có thể khiến AI đưa ra câu trả lời nghe có vẻ đúng dù không chính xác.Để huấn luyện AI nhận lỗi, OpenAI chỉ thưởng cho tính trung thực và không phạt khi mô hình thừa nhận sai lầm.Thử nghiệm với GPT-5-Thinking cho thấy AI có thể tự khai nhận hành vi “lách luật” khi bị giao nhiệm vụ bất khả thi.
Dù chưa đảm bảo AI sẽ luôn trung thực, OpenAI tin rằng cách tiếp cận này giúp hiểu rõ hơn vì sao ChatGPT đôi khi gian dối và cách khắc phục trong tương lai.Mời quý độc giả xem thêm video: Dọn rác AI | Hà Nội 18h00
Một chiếc xe buýt va chạm với 6 phương tiện khác trên tuyến đường liên bang 95 tại bang Virginia, Mỹ, khiến 5 người thiệt mạng và 34 người khác bị thương.
Mặc dù chiếc máy bay không người lái này được thiết kế để vận chuyển vật tư trên chiến trường, Quân đội Mỹ đã thử nghiệm biến nó thành một bệ phóng tên lửa.
Tính năng nổi bật của Motorola Razr Fold có thể là hỗ trợ tùy chọn Pen Ultr, bút cảm ứng thông minh có khả năng làm được nhiều việc hơn là chỉ vẽ hoặc viết.
Mẫu Suzuki Burgman nổi tiếng sẽ có đại diện để cạnh tranh ở phân khúc 150cc với Burgman 15, nhưng xe được cho là mượn sản phẩm của liên doanh tại Trung Quốc.
Honda Việt Nam (HVN) vừa công bố kết quả kinh doanh năm tài chính 2026 (từ tháng 4/2025 đến 3/2026), ghi nhận nhiều kết quả tích cực ở cả mảng ôtô và xe máy.