Thuật ngữ | Định nghĩa |
Thuật toán | Một chuỗi hướng dẫn để giải quyết một vấn đề hoặc thực hiện một nhiệm vụ. Các thuật toán xác định cách một hệ thống trí tuệ nhân tạo xử lý dữ liệu đầu vào để nhận diện các mẫu, đưa ra quyết định và tạo ra các đầu ra. |
Trí tuệ nhân tạo (AI) | Hệ thống máy tính được thiết kế để thực hiện các nhiệm vụ liên quan đến trí tuệ con người, chẳng hạn như nhận diện mẫu hoặc đưa ra quyết định. |
Chatbot | Một chương trình giao tiếp với con người thông qua văn bản trong một giao diện viết, được xây dựng trên một mô hình ngôn ngữ lớn. Ví dụ bao gồm ChatGPT của OpenAI, Gemini của Google, và nhiều hơn nữa. Mặc dù nhiều người dùng thường gọi chatbot và LLM (mô hình ngôn ngữ lớn) là như nhau, nhưng thực chất chatbot là giao diện người dùng được xây dựng trên LLM. |
Mô hình cơ sở | Một loại mô hình được thiết kế để làm “nền tảng” đa mục đích cho nhiều ứng dụng khác nhau. Các mô hình cơ sở có thể được điều chỉnh (hoặc “tinh chỉnh”) cho các mục đích chuyên ngành hoặc nhiệm vụ cụ thể. Ngược lại, các mô hình “hẹp” được thiết kế để giới hạn ở những nhiệm vụ cụ thể. |
AI tạo sinh | Một lĩnh vực con của trí tuệ nhân tạo, đề cập đến các mô hình có khả năng tạo ra nội dung (chẳng hạn như ngôn ngữ, hình ảnh hoặc âm nhạc). Đầu ra của các mô hình GAI dựa trên các mẫu đã được học từ các tập dữ liệu huấn luyện rộng lớn. |
Mô hình ngôn ngữ lớn (LLM) | Một loại mô hình AI sinh làm việc cụ thể với ngôn ngữ viết (cả ngôn ngữ tự nhiên và mã). Các mô hình này được đào tạo trên một tập hợp dữ liệu văn bản khổng lồ được lấy từ Internet. Ví dụ bao gồm GPT-3 và GPT-4 của OpenAI, là nền tảng cho ChatGPT, Claude của Anthropic, PaLM của Google, LLaMA của Meta, và nhiều hơn nữa. |
Học máy | Một lĩnh vực của khoa học máy tính trong đó một hệ thống học các mẫu hoặc xu hướng từ dữ liệu cơ sở. Các thuật toán học máy thực hiện các nhiệm vụ như dự đoán hoặc đưa ra quyết định. |
Mạng nơ-ron | Một loại mô hình tính toán (được đặt tên do cấu trúc có vẻ giống như các yếu tố của não người, bao gồm các nút và lớp liên kết với nhau), có thể được đào tạo để nhận diện các mẫu và đưa ra dự đoán. Trong quá trình đào tạo, các kết nối giữa các lớp khác nhau của mạng nơ-ron được tăng cường hoặc làm yếu đi một cách lặp đi lặp lại dựa trên “dữ liệu huấn luyện” đầu vào và các tham số thiết kế mô hình khác. |
Prompt (Câu lệnh) | Trong bối cảnh của AI, đây là văn bản đầu vào được viết bởi một con người được cung cấp cho một mô hình AI sinh. Prompt thường mô tả những gì bạn đang tìm kiếm, nhưng cũng có thể đưa ra hướng dẫn cụ thể về phong cách, giọng điệu hoặc định dạng. |
Học tăng cường từ phản hồi của con người (RLHF) | Một kỹ thuật đào tạo mô hình trực tiếp từ phản hồi của con người. RLHF thường được sử dụng trong các nhiệm vụ mà khó có thể xác định một giải pháp rõ ràng, thuật toán, nhưng mà con người có thể dễ dàng đánh giá chất lượng đầu ra của mô hình. Đối với các mô hình AI tạo sinh, RLHF là một phương pháp được sử dụng để xác định và lọc ra nội dung có vấn đề như bạo lực và ngôn từ hận thù. |
Dữ liệu huấn luyện | Nội dung được sử dụng để dạy cho một hệ thống học máy cách thực hiện một nhiệm vụ cụ thể. Dữ liệu huấn luyện cung cấp cho hệ thống một cơ sở kiến thức từ đó mô hình có thể đưa ra dự đoán hoặc nhận diện các mẫu. Dữ liệu huấn luyện có thể bao gồm hình ảnh, văn bản, mã, hoặc các loại phương tiện khác. Nó có thể có cấu trúc hoặc không có cấu trúc, tùy thuộc vào loại quy trình huấn luyện được sử dụng. |