Trong thời đại công nghệ trí tuệ nhân tạo (AI) lên ngôi, tất cả chúng ta đều mong muốn có thể tận dụng tốt nhất khả năng của AI, đặc biệt là việc nâng cao độ nhất quán và chính xác của đầu ra. Điều này có thể coi là tiêu chí quan trọng nhất để đánh giá khi đưa các tính năng AI vào ứng dụng trong công việc.
Một kỹ thuật thiết lập câu lệnh nâng cao mang tên Self-Consistency Prompting có thể sẽ là lựa chọn giúp chúng ta giải quyết được yêu cầu trên. Self-Consistency Prompting giúp cải thiện hiệu suất bằng cách sử dụng nhiều con đường suy luận khác nhau để tìm ra câu trả lời thường gặp nhất, thay vì chỉ chọn câu trả lời đầu tiên mà AI đưa ra.
Hãy cùng tìm hiểu sâu hơn về cách hoạt động của tSelf-Consistency Prompting để biết cách áp dụng một cách tốt nhất.
Self-Consistency Prompting là một kỹ thuật thiết lập câu lệnh nâng cao dựa trên CoT Prompting. Mục đích của kỹ thuật này là thiết kế câu lệnh giúp tăng cường khả năng suy luận của các Mô hình Ngôn ngữ Lớn (LLMs). Phương pháp này hoạt động bằng cách tạo ra nhiều phản hồi khác nhau cho cùng một câu hỏi, sau đó chọn ra câu trả lời phổ biến nhất, nhất quán nhất hoặc hợp lý nhất.
Việc sử dụng Self-Consistency Prompting trong quá trình làm việc mang lại nhiều lợi ích:
Nâng cao độ chính xác: Kỹ thuật này cho phép mô hình tạo ra nhiều phản hồi khác nhau cho cùng một câu hỏi, sau đó đánh giá lại tất cả các câu trả lời để loại bỏ các phản hồi không hợp lý và lựa chọn phản hồi nhất quán nhất. Do đó, độ chính xác của phản hồi sẽ được nâng cao.
Tăng độ tin cậy: Khi cân nhắc nhiều quan điểm khác nhau, điều này giúp hạn chế những thiên kiến có thể xuất hiện trong mô hình AI hoặc trong dữ liệu mà nó đã được huấn luyện. Điều này mang lại sự tin cậy cho người dùng trong các phản hồi.
Phát triển tư duy phản biện: Khuyến khích AI tự đánh giá những lập luận của mình sẽ thúc đẩy tư duy phản biện, đây là một kỹ năng rất quan trọng trong việc giải quyết vấn đề và đưa ra quyết định.
Self-consistency prompting sẽ có hiệu quả với các công việc có đầu ra đã biết, ví dụ như:
Giải quyết vấn đề toán học: Bằng cách tạo ra nhiều đầu ra cho một bài toán, self-consistency prompting có thể xác định giải pháp nhất quán nhất, dẫn đến độ chính xác cao hơn trong các câu trả lời.
Ví dụ: Giải bài toán “Minh có 10 chiếc tất. Nếu anh ấy vứt đi 3 chiếc cũ và mua 36 chiếc mới, anh ấy sẽ có bao nhiêu chiếc tất?”
Lý lẽ thông thường: Đối với các nhiệm vụ như trả lời câu hỏi mang tính lý lẽ thông thường (tức là các quy tắc hàng ngày hoặc quy tắc cơ bản trong thực tế), self-consistency prompting đánh giá các cách lập luận khác nhau để cung cấp câu trả lời hợp lý và nhất quán nhất.
Ví dụ: “Người đàn ông nằm trên lớp rêu mềm và ngước lên nhìn những cái cây, người đàn ông ở đâu?”
Lập luận biểu tượng: Self-consistency prompting có thể rất hữu ích đối với các nhiệm vụ tương tự như giải các câu đố tư duy logic bằng cách tạo ra nhiều giải pháp tiềm năng và chọn giải pháp nhất quán nhất.
Ví dụ: “Nếu đầu vào là ‘abcd’, đầu ra sẽ là gì nếu chúng ta nối lại các chữ cái đầu tiên và cuối cùng?”
Ví dụ cụ thể:
Khi bạn có một câu hỏi giải quyết vấn đề toán học như "Khi tôi 6 tuổi, em gái tôi bằng một nửa tuổi của tôi. Bây giờ tôi 70 tuổi, em gái tôi bao nhiêu tuổi?"
Áp dụng self-consistency prompting trong trường hợp này, chúng ta sẽ có một prompt như sau:
Q: Có 15 cây trong rừng. Những người làm việc tại rừng sẽ trồng cây trong rừng hôm nay. Sau khi họ hoàn tất, sẽ có 21 cây. Những người làm việc tại rừng đã trồng bao nhiêu cây hôm nay?
A: Chúng ta bắt đầu với 15 cây. Sau đó, chúng ta có 21 cây. Sự chênh lệch phải là số cây họ đã trồng. Vì vậy, họ đã trồng 21 - 15 = 6 cây. Câu trả lời là 6.
Q: Nếu có 3 xe ô tô trong bãi đậu xe và 2 xe ô tô nữa đến, thì có bao nhiêu xe ô tô trong bãi đậu xe?
A: Trong bãi đậu xe đã có 3 xe ô tô. 2 xe ô tô nữa đến. Bây giờ sẽ có 3 + 2 = 5 xe ô tô. Câu trả lời là 5.
Q: Olivia có 23 đô la. Cô ấy đã mua năm chiếc bánh bagel với giá 3 đô la mỗi chiếc. Cô ấy còn lại bao nhiêu tiền?
A: Cô ấy đã mua 5 chiếc bánh bagel với giá 3 đô la mỗi chiếc. Điều này có nghĩa là cô ấy đã chi 5 đô la
Q: Khi tôi 6 tuổi, em gái tôi bằng một nửa tuổi của tôi. Bây giờ tôi 70 tuổi, em gái tôi bao nhiêu tuổi?
Đáp án như sau:
Khi bạn 6 tuổi, em gái của bạn bằng một nửa tuổi bạn, tức là 3 tuổi. Bây giờ khi bạn 70 tuổi, em gái của bạn sẽ là 70 - 3 = 67 tuổi. Câu trả lời là 67.
Việc áp dụng phương pháp tự nhất quán này vào câu lệnh của bạn rất đơn giản. Bạn chỉ cần thêm một phần "ví dụ" vào phần hướng dẫn trong câu lệnh của mình. Hãy cung cấp những ví dụ rõ ràng và cụ thể để giúp mô hình hiểu kỹ hơn. Đối với các mô hình ngôn ngữ mới và tiên tiến, có thể bạn chỉ cần 1-3 ví dụ là đã đủ để đạt được kết quả như mong muốn. Tuy nhiên, bạn nên thử nghiệm và tối ưu hóa các cprompt của mình cho từng trường hợp sử dụng cụ thể để đảm bảo hiệu quả tốt nhất.
Self-consistency là một kỹ thuật mạnh mẽ giúp cải nâng cao hiệu suất của mô hình ngôn ngữ lớn (LLM) một cách đáng kể. Bằng cách kết hợp nhiều đầu ra và chọn phản hồi nhất quán nhất, bạn sẽ cải thiện độ chính xác và độ tin cậy của các câu trả lời từ AI, biến nó thành một công cụ hữu ích cho nhiều công việc khác nhau.